中文AV在线播放,四叶草研究所免费隐藏入口

【網(wǎng)店勿用！此為申報(bào)選題所填信息，網(wǎng)店請(qǐng)調(diào)用*終版】
自然語(yǔ)言處理跨越了許多不同的學(xué)科，有時(shí)很難理解它們各自帶來(lái)的貢獻(xiàn)和挑戰(zhàn)。本書(shū)探討了自然語(yǔ)言處理與認(rèn)知科學(xué)之間的關(guān)系，每章都由相關(guān)領(lǐng)域的專(zhuān)家撰寫(xiě)，內(nèi)容涵蓋語(yǔ)言理解、語(yǔ)言生成、詞聯(lián)想、詞義消除歧義、詞可預(yù)測(cè)性、文本生成和作者身份識(shí)別。本書(shū)適合對(duì)自然語(yǔ)言處理及其跨學(xué)科特性感興趣的學(xué)生和研究人員。

本書(shū)是一本論文專(zhuān)輯，致力于探索自然語(yǔ)言處理和認(rèn)知科學(xué)之間的關(guān)系，以及計(jì)算機(jī)科學(xué)對(duì)于這兩個(gè)領(lǐng)域的貢獻(xiàn)。根據(jù)Poibeau和Vasishth[POI 16]所述，對(duì)認(rèn)知問(wèn)題的研究興趣可能較少受到關(guān)注。因?yàn)樵谡J(rèn)知科學(xué)領(lǐng)域，研究者往往無(wú)力應(yīng)對(duì)自然語(yǔ)言處理技術(shù)的復(fù)雜性；同樣，自然語(yǔ)言處理的研究者也沒(méi)有認(rèn)識(shí)到認(rèn)知科學(xué)對(duì)于他們工作的貢獻(xiàn)。我們相信，2004年啟動(dòng)的自然語(yǔ)言處理和認(rèn)知科學(xué)國(guó)際研討會(huì)（NLPCS）提供了一個(gè)強(qiáng)大的平臺(tái)，支持新的研究課題的多樣性，并且能幫助研究者建立共識(shí)。與此同時(shí)，這個(gè)平臺(tái)還認(rèn)可跨學(xué)科方法的重要性，并將計(jì)算機(jī)科學(xué)家、認(rèn)知學(xué)和語(yǔ)言學(xué)的研究者聚集到一起來(lái)推動(dòng)自然語(yǔ)言處理研究。
本書(shū)包含10章，都是由自然語(yǔ)言處理和認(rèn)知科學(xué)國(guó)際研討會(huì)的研究者完成的。
在第1章，Philippe Blache闡述了理解語(yǔ)言的過(guò)程在理論上是非常復(fù)雜的，該過(guò)程必須實(shí)時(shí)進(jìn)行，且需要許多不同來(lái)源的信息。他認(rèn)為對(duì)于一個(gè)語(yǔ)言輸入的整體解釋?xiě)?yīng)該建立在基于塊的基本單元的分組之上，而這些單元構(gòu)成了“盡可能解釋”原則的支柱，該原則負(fù)責(zé)推遲理解過(guò)程，直到有足夠的信息可用。
接下來(lái)的兩章討論人類(lèi)關(guān)聯(lián)問(wèn)題。在第2章，Korzycki、Gatkowska和Lubaszewski討論了一個(gè)有900個(gè)學(xué)生參與的自由詞關(guān)聯(lián)測(cè)試。他們利用三個(gè)算法從文本中提取出關(guān)聯(lián)列表，然后將提取的關(guān)聯(lián)列表與人類(lèi)關(guān)聯(lián)列表做對(duì)比。這三個(gè)算法分別是Church-Hanks算法、潛在語(yǔ)義分析（LSA）和潛在狄利克雷分配（LDA）。
在第3章，Lubaszewski、Gatkowska和Godny描述了一個(gè)過(guò)程，用于在實(shí)驗(yàn)中建立的人類(lèi)關(guān)聯(lián)網(wǎng)絡(luò)中的單詞關(guān)聯(lián)。他們認(rèn)為每個(gè)關(guān)聯(lián)都是基于兩個(gè)釋義之間的語(yǔ)義關(guān)系，而這種釋義之間的關(guān)聯(lián)有自己的方向，并且獨(dú)立于其他關(guān)聯(lián)的方向。此過(guò)程使用圖結(jié)構(gòu)來(lái)生成語(yǔ)義一致的子圖。
在第4章，Rapp探索了人類(lèi)語(yǔ)言生成是否是由關(guān)聯(lián)控制的，以及話語(yǔ)的下一個(gè)實(shí)詞是否可被視為該實(shí)詞表示的一種關(guān)聯(lián)，而這種關(guān)聯(lián)已經(jīng)在說(shuō)話人的記憶中被激活。他還介紹了反向關(guān)聯(lián)任務(wù)的概念，討論了激勵(lì)詞是否可以通過(guò)響應(yīng)詞來(lái)預(yù)測(cè)。他根據(jù)反向關(guān)聯(lián)任務(wù)搜集了人類(lèi)數(shù)據(jù)，并將其與機(jī)器生成的結(jié)果進(jìn)行了比較。
在第5章中，Vincent-Lamarre和他的同事研究了在字典中定義所有其余單詞所需的單詞及其數(shù)量。為此，他們?cè)谠~典組件Wordsmyth上使用了圖論分析。其研究結(jié)果對(duì)于理解符號(hào)基礎(chǔ)，以及詞義的學(xué)習(xí)和心理表征具有重要意義。他們得出的結(jié)論是，語(yǔ)言使用者只有掌握用于理解詞的定義的詞匯表中的單詞，才能夠從語(yǔ)言（口頭）定義中學(xué)習(xí)和理解單詞的含義。
第6章側(cè)重于詞義消歧。Tripodi和Pelillo根據(jù)進(jìn)化博弈論方法來(lái)研究詞義消歧。要消除歧義的每個(gè)單詞都表示為玩家，每個(gè)意義都表示為策略。該算法已經(jīng)在具有不同數(shù)量標(biāo)記詞的四個(gè)數(shù)據(jù)集上進(jìn)行了測(cè)試。它利用關(guān)系和上下文信息來(lái)推斷目標(biāo)詞的含義。實(shí)驗(yàn)結(jié)果表明，該方法的性能優(yōu)于傳統(tǒng)方法，并且只需要少量標(biāo)記點(diǎn)就能勝過(guò)有監(jiān)督系統(tǒng)。
在第7章中，Zock和Tesfaye專(zhuān)注于以四個(gè)任務(wù)表達(dá)的文本生成的挑戰(zhàn)性任務(wù)：構(gòu)思、文本結(jié)構(gòu)、表達(dá)和修訂。他們專(zhuān)注于文本結(jié)構(gòu)，涉及消息的分組（分塊）、排序和鏈接。其目的是研究文本生成的哪些部分可以自動(dòng)化，以及計(jì)算機(jī)是否可以基于用戶(hù)提供的一組輸入構(gòu)建一個(gè)或多個(gè)主題樹(shù)。
著述屬性是第8章研究的重點(diǎn)。Boukhaled和Ganascia分析了使用虛詞的序貫規(guī)則和詞性（POS）標(biāo)簽作為文本標(biāo)記的有效性。該有效性不依賴(lài)于詞袋假設(shè)或原始頻率。他們的研究表明，虛詞和詞性n元組（n-gram）的頻率優(yōu)于序貫規(guī)則。
第9章討論了基頻檢測(cè)（F0），它在人類(lèi)語(yǔ)音感知中起著重要作用。Glavitsch探索了使用人類(lèi)認(rèn)知原理進(jìn)行的F0估計(jì)是否能夠表現(xiàn)得與最新的F0檢測(cè)算法一樣好或更好。他所提出的運(yùn)行在時(shí)域的算法錯(cuò)誤率較小，并且在使用有限的存儲(chǔ)和計(jì)算資源的情況下，其表現(xiàn)超過(guò)了傳統(tǒng)的最高水平的基于關(guān)聯(lián)的RAPT方法。在神經(jīng)認(rèn)知心理學(xué)中，手動(dòng)收集的完形填充概率（CCP）用于量化眼球運(yùn)動(dòng)控制模型中句內(nèi)上下文單詞的可預(yù)測(cè)性。由于CCP數(shù)據(jù)都是基于上百個(gè)參與者的采樣，在所有新的激勵(lì)上泛化該模型是很難的。
在第10章中，Hofmann、Biemann和Remus提出應(yīng)用語(yǔ)言模型，這些模型可以通過(guò)在線數(shù)據(jù)庫(kù)中公開(kāi)可用數(shù)據(jù)集的item級(jí)別的性能進(jìn)行基準(zhǔn)測(cè)試。先前在腦電圖（EEG）和眼球運(yùn)動(dòng)（EM）數(shù)據(jù)中從句內(nèi)上下文中預(yù)測(cè)單詞的神經(jīng)認(rèn)知方法依賴(lài)于CCP數(shù)據(jù)。他們的研究表明，當(dāng)直接計(jì)算CCP、EEG和EM數(shù)據(jù)時(shí)，n元語(yǔ)言模型和遞歸神經(jīng)網(wǎng)絡(luò)（RNN）的句法和短程語(yǔ)義過(guò)程差不多同樣好。這可以幫助將神經(jīng)認(rèn)知模型推廣到所有可能的新穎單詞組合。
參考文獻(xiàn)

你還可能感興趣

我要評(píng)論