定 價:198 元
叢書名:經(jīng)典譯叢·人類語言技術(shù)
當前圖書已被 8 所學(xué)校薦購過!
查看明細
- 作者:Daniel Jurafsky(D. 朱夫斯凱), James H. Martin(J. H. 馬。
- 出版時間:2018/3/1
- ISBN:9787121250583
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP391
- 頁碼:
- 紙張:膠版紙
- 版次:2
- 開本:16開
從本書*版出版以來,一直好評如潮,被國外許多大學(xué)選作自然語言處理或計算語言學(xué)的教材,被認為該領(lǐng)域教材的黃金標準。本書*版綜合了自然語言處理、計算語言學(xué)和語音識別的內(nèi)容,全面論述計算機自然語言處理,深入探討計算機處理自然語言的詞匯、句法、語義、語用等各個方面的問題,介紹了自然語言處理的各種現(xiàn)代技術(shù)。該版對于*版做了全面的改寫,增加了大量反映自然語言處理*成就的內(nèi)容,特別是增加了語音處理和統(tǒng)計技術(shù)方面的內(nèi)容,全書面貌為之一新。本書四大特色: 覆蓋全面 強調(diào)實用 注重評測 語料為本內(nèi)容簡介本書全面論述了自然語言處理技術(shù)。本書在*版的基礎(chǔ)上增加了自然語言處理的*成就,特別是增加了語音處理和統(tǒng)計技術(shù)方面的內(nèi)容,全書面貌為之一新。本書共分五個部分。*部分詞匯的計算機處理,講述單詞的計算機處理,包括單詞切分、單詞的形態(tài)學(xué)、*小編輯距離、詞類,以及單詞計算機處理的各種算法,包括正則表達式、有限狀態(tài)自動機、有限狀態(tài)轉(zhuǎn)錄機、N元語法模型、隱馬爾可夫模型、*熵模型等。第二部分語音的計算機處理,介紹語音學(xué)、語音合成、語音自動識別以及計算音系學(xué)。第三部分句法的計算機處理,介紹英語的形式語法,講述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、統(tǒng)計剖析,并介紹合一與類型特征結(jié)構(gòu)、Chomsky層級分類、抽吸引理等分析工具。第四部分語義和語用的計算機處理,介紹語義的各種表示方法、計算語義學(xué)、詞匯語義學(xué)、計算詞匯語義學(xué),并介紹同指、連貫等計算機話語分析問題。第五部分應(yīng)用,講述信息抽取、問答系統(tǒng)、自動文摘、對話和會話智能代理、機器翻譯等自然語言處理的應(yīng)用技術(shù)。本書寫作風(fēng)格深入淺出,實例豐富,引人入勝。本書可作為高等學(xué)校自然語言處理或計算語言學(xué)的本科生和研究生的教材,也可以作為從事人工智能、自然語言處理等領(lǐng)域的研究人員和技術(shù)人員的必備參考。
從本書*版出版以來,一直好評如潮,被國外許多大學(xué)選作自然語言處理或計算語言學(xué)的教材,被認為該領(lǐng)域教材的黃金標準。
本書*版綜合了自然語言處理、計算語言學(xué)和語音識別的內(nèi)容,全面論述計算機自然語言處理,深入探討計算機處理自然語言的詞匯、句法、
語義、語用等各個方面的問題,介紹了自然語言處理的各種現(xiàn)代技術(shù)。該版對于*版做了全面的改寫,增加了大量反映自然語言處理*成就
的內(nèi)容,特別是增加了語音處理和統(tǒng)計技術(shù)方面的內(nèi)容,全書面貌為之一新。
本書四大特色:
覆蓋全面 強調(diào)實用 注重評測 語料為本
譯 者 簡 介
馮志偉
先后在北京大學(xué)和中國科學(xué)技術(shù)大學(xué)研究生院兩次研究生畢業(yè),獲雙碩士學(xué)位。1978年至1981年,在法國格勒諾布爾理科醫(yī)科大學(xué)應(yīng)用數(shù)學(xué)研究所(IMAG)自動翻譯中心(CETA)師從法國著名數(shù)學(xué)家、國際計算語言學(xué)委員會主席B.Vauquois教授,專門研究數(shù)理語言學(xué)和機器翻譯問題;貒螅群髶沃袊茖W(xué)技術(shù)信息研究所計算中心機器翻譯研究組組長、教育部語言文字應(yīng)用研究所計算語言學(xué)研究室主任、杭州師范大學(xué)外國語學(xué)院高端特聘教授。1986年至2004年,在德國Fraunhofer研究院)(FhG)、Trier大學(xué)、Konstanz高等技術(shù)學(xué)院、韓國Korean Advanced Institute of Science and Technology (KAIST)、英國Birmingham大學(xué)擔任教授或研究員,長期從事語言學(xué)和計算機科學(xué)的跨學(xué)科研究,是我國計算語言學(xué)事業(yè)的開拓者之一。在中國,他是中國語文現(xiàn)代化學(xué)會副會長、中國應(yīng)用語言學(xué)學(xué)會常務(wù)理事、中國人工智能學(xué)會理事、國家語言文字工作委員會21世紀語言文字規(guī)范(標準)審定委員會委員、全國科學(xué)技術(shù)名詞審定委員會委員、全國術(shù)語標準化技術(shù)委員會委員、中國外語教育研究中心學(xué)術(shù)委員會委員、《數(shù)學(xué)辭!房偩庉嬑瘑T會委員、《中國大百科全書》(《語言文字卷》)編輯委員會成員。在國際上,他是TELRI(Trans European Language Resources Infrastructure)、LREC(Language Resources and Evaluation Conference)、COLING 2010(Computational Linguistics Conference)的顧問委員會委員,并擔任IJCL(International Journal of Corpus Linguistics)、IJCC(International Journal of Chinese and Computing)等重要學(xué)術(shù)期刊編委以及英國Continuum出版公司系列叢書Research in Corpus and Discourse編委。承擔國家自然科學(xué)基金項目和國家社會科學(xué)基金項目多項,出版專著30余部,發(fā)表論文300余篇。
孫樂
1998年5月畢業(yè)于南京理工大學(xué),獲博士學(xué)位。1998年9月至2000年10月在中國科學(xué)院軟件研究所從事博士后研究,現(xiàn)為中國科學(xué)院軟件研究所中文信息處理研究室研究員、博士生導(dǎo)師。曾先后在英國Birmingham大學(xué)、加拿大Montreal大學(xué)做訪問學(xué)者。目前主要研究方向:自然語言理解、知識圖譜、信息抽取、問答系統(tǒng)等。作為項目負責(zé)人承擔國家自然科學(xué)基金重點項目、國家863項目、國際合作項目等30多項,在ACL、SIGIR、EMNLP等重要國際會議和國內(nèi)核心期刊發(fā)表論文50多篇。現(xiàn)為中國中文信息學(xué)會副理事長兼秘書長、中文信息學(xué)報副主編、國家語委語言文字規(guī)范標準審定委員會委員、國際測評NTCIR MOAT中文簡體任務(wù)的組織者、第23屆國際計算語言學(xué)大會(COLING 2010)組織委員會聯(lián)席主席、第13屆國際機器翻譯峰會(MT Summit 2011)組織委員會聯(lián)席主席、第53屆國際計算語言學(xué)年會(ACL2015)組織委員會聯(lián)席主席。
中文版序言
The goal of a textbook author is the same as the goal of any teacher: passing on our love for our field to a new generation of students, encouraging them to do innovative and creative new work, and helping them to advance the state of human knowledge. For a textbook in the interdisciplinary area of speech and language processing, there are the additional goals of enabling students from differing backgrounds (computer science, linguistics, electrical engineering) to acquire the knowledge and tools of the new interdisciplinary field, and to develop an appreciation for the beauty and complexity and variety of human language. We therefore feel extremely lucky that Professor Feng Zhiwei, aided by Dr. Sun Le, undertook the arduous job of translating this book. Prof. Feng is the perfect scholar for the job of translating such a book, because of his long experience in our field, his wide breadth of research interests throughout computational linguistics in general and Chinese computational linguistics specifically, his remarkable familiarity with the state of our field across the world, from China to France, from Korea to Germany, and of course his expertise on translation as a research area! We are also very excited that this translation into Chinese is the first translation of our book out of English. China's long history of the study of language is of course well known, and in this new century the young scientists of China are already playing a key role in the important scientific advances of our field. We look forward to even more amazing contributions from China and hope that our small book, now with the help of Prof. Feng and Dr. Sun, can provide a small aide in the great role that Chinese scientists are playing on the world scientific stage!
Daniel Jurafsky and James H. Martin
Palo Alto, California, and Boulder, Colorado
譯文
教材的作者與所有教師有著相同的目標:即把我們對于本專業(yè)的熱愛傳達給新一代的學(xué)生, 鼓勵他們?nèi)ミM行創(chuàng)新性的研究和探索,幫助他們把人類知識進一步向前推進。由于語音和語言的計算機處理屬于交叉學(xué)科的領(lǐng)域,所以,我們這本關(guān)于這個交叉學(xué)科領(lǐng)域的教材還有其特定的目標。這些特定的目標就是使來自不同知識背景(計算機科學(xué)、語言學(xué)和電子工程)的學(xué)生掌握這門新的交叉學(xué)科的基本知識和工具,并在學(xué)習(xí)過程中一步一步地來感受人類語言的美妙性、復(fù)雜性和多樣性。因此,當我們了解到馮志偉教授在孫樂研究員的協(xié)助下承擔了把這本教材翻譯成中文的艱辛工作的時候,我們感到無比的榮幸。我們認為,馮志偉教授是翻譯這本教材的最理想的學(xué)者,因為他在這個專業(yè)領(lǐng)域具有多年的經(jīng)驗;他的研究興趣涉及面廣,既包括普遍的計算語言學(xué)研究,也包括具體的漢語計算語言學(xué)的研究;他對于這個學(xué)科在全世界的情況了如指掌,從中國到法國,從韓國到德國,他都親身參與了這些國家的計算語言學(xué)研究工作;并且,翻譯一直是馮教授長期從事的一個研究領(lǐng)域,他當然也是精研通達的翻譯內(nèi)行!這個中文譯本是英文原著的第一個外文譯本,它的出版使我們非常之激動和振奮。眾所周知,中國在語言研究方面有著悠久的歷史,在新世紀,中國年輕一代的科學(xué)工作者在這個領(lǐng)域的一些重要的科學(xué)進展方面已經(jīng)起著關(guān)鍵性的作用。我們期待著中國在這個領(lǐng)域里進一步做出更加出色的貢獻,并且希望,在中國科學(xué)工作者為全世界的科學(xué)進步事業(yè)所發(fā)揮的巨大作用中,由于馮志偉教授和孫樂研究員的幫助,拙著也能夠為此盡我們的綿薄之力!
Daniel Jurafsky
James H. Martin
譯者序
采用計算機技術(shù)來研究和處理自然語言是20世紀40年代末期和20世紀60年代才開始的, 60多年來,這項研究取得了長足的進展,成為了計算機科學(xué)中一門重要的新興學(xué)科自然語言處理(Natural Language Processing,NLP)。
我們認為,計算機對自然語言的研究和處理,一般應(yīng)經(jīng)過如下4個方面
Daniel Jurafsky現(xiàn)任斯坦福大學(xué)語言學(xué)系和計算機科學(xué)系副教授。在此之前,他曾在博爾德的科羅拉多大學(xué)語言學(xué)系、計算機科學(xué)系和認知科學(xué)研究所任職。他出生于紐約州的Yonkers,1983年獲語言學(xué)學(xué)士,1992年獲計算機科學(xué)博士,兩個學(xué)位都在伯克利加利福尼亞大學(xué)獲得。他于1998年獲得美國國家基金會CAREER獎,2002年獲得Mac-Arthur獎。他發(fā)表過90多篇論文,內(nèi)容涉及語音和語音處理的廣泛領(lǐng)域。James H. Martin現(xiàn)任博爾德的科羅拉多大學(xué)語言學(xué)系、計算機科學(xué)系教授,認知科學(xué)研究所研究員。他出生于紐約市,1981年獲可倫比亞大學(xué)計算機科學(xué)學(xué)士,1988年獲伯克利加利福尼亞大學(xué)計算機科學(xué)博士。他寫過70多篇關(guān)于計算機科學(xué)的論著,出版過《隱喻解釋的計算機模型》(A Computational Model of Metaphor Interpretation)一書。
馮志偉:先后在北京大學(xué)和中國科學(xué)技術(shù)大學(xué)研究生院兩次研究生畢業(yè),獲雙碩士學(xué)位。任中國科學(xué)技術(shù)信息研究所計算中心機器翻譯研究組組長、教育部語言文字應(yīng)用研究所計算語言學(xué)研究室主任、杭州師范大學(xué)外國語學(xué)院高端特聘教授。長期從事語言學(xué)和計算機科學(xué)的跨學(xué)科研究,是我國計算語言學(xué)事業(yè)的開拓者之一。在中國,他是中國語文現(xiàn)代化學(xué)會副會長、中國應(yīng)用語言學(xué)學(xué)會常務(wù)理事、中國人工智能學(xué)會理事、國家語言文字工作委員會21世紀語言文字規(guī)范(標準)審定委員會委員、全國科學(xué)技術(shù)名詞審定委員會委員、全國術(shù)語標準化技術(shù)委員會委員、中國外語教育研究中心學(xué)術(shù)委員會委員、《數(shù)學(xué)辭!房偩庉嬑瘑T會委員、《中國大百科全書》(《語言文字卷》)編輯委員會成員。在國際上,他是TELRI(Trans-European Language Resources Infrastructure)、LREC(Language Resources and Evaluation Conference)、COLING-2010(Computational Linguistics Conference)的顧問委員會委員,并擔任IJCL(International Journal of Corpus Linguistics)、IJCC(International Journal of Chinese and Computing)等重要學(xué)術(shù)期刊編委以及英國Continuum出版公司系列叢書Research in Corpus and Discourse編委。承擔國家自然科學(xué)基金項目和國家社會科學(xué)基金項目多項,出版專著30余部,發(fā)表論文300余篇。孫樂:1998年5月畢業(yè)于南京理工大學(xué),獲博士學(xué)位。1998年9月至2000年10月在中國科學(xué)院軟件研究所從事博士后研究,博士后出站后留研究所工作至今,現(xiàn)為中國科學(xué)院軟件研究所基礎(chǔ)軟件國家工程中心研究員,博士生導(dǎo)師。曾于2003年和2004年,先后在英國Birmingham大學(xué)、加拿大Montreal大學(xué)做訪問學(xué)者,從事平行語料庫和高精度信息檢索方面的研究。目前主要研究方向:基于知識的自然語言理解、下一代信息檢索模型、信息抽取與問答系統(tǒng)等。作為項目負責(zé)人承擔國家自然科學(xué)基金項目、國家863項目和國際合作項目等10余項,在國內(nèi)外重要學(xué)術(shù)刊物和會議上發(fā)表論文80多篇。
第1章導(dǎo)論
1.1語音與語言處理中的知識
1.2歧義
1.3模型和算法
1.4語言、思維和理解
1.5學(xué)科現(xiàn)狀與近期發(fā)展
1.6語音和語言處理簡史
1.6.1基礎(chǔ)研究:20世紀40年代和20世紀50年代
1.6.2兩個陣營:1957年至1970年
1.6.3四個范型:1970年至1983年
1.6.4經(jīng)驗主義和有限狀態(tài)模型的復(fù)蘇:1983年至1993年
1.6.5不同領(lǐng)域的合流:1994年至1999年
1.6.6機器學(xué)習(xí)的興起:2000年至2008年
1.6.7關(guān)于多重發(fā)現(xiàn)
1.6.8心理學(xué)的簡要注記
1.7小結(jié)
1.8文獻和歷史說明
第一部分 詞匯的計算機處理
第2章正則表達式與自動機
2.1正則表達式
2.1.1基本正則表達式模式
2.1.2析取、組合與優(yōu)先關(guān)系
2.1.3一個簡單的例子
2.1.4一個比較復(fù)雜的例子
2.1.5高級算符
2.1.6正則表達式中的替換、存儲器與ELIZA
2.2有限狀態(tài)自動機
2.2.1用FSA來識別羊的語言
2.2.2形式語言
2.2.3其他例子
2.2.4非確定FSA
2.2.5使用NFSA接收符號串
2.2.6識別就是搜索
2.2.7確定自動機與非確定自動機的關(guān)系
2.3正則語言與 FSA
2.4小結(jié)
2.5文獻和歷史說明
第3章 詞與轉(zhuǎn)錄機
3.1英語形態(tài)學(xué)概觀
3.1.1屈折形態(tài)學(xué)
3.1.2派生形態(tài)學(xué)
3.1.3附著
3.1.4非毗連形態(tài)學(xué)
3.1.5一致關(guān)系
3.2有限狀態(tài)形態(tài)剖析
3.3有限狀態(tài)詞表的建造
3.4有限狀態(tài)轉(zhuǎn)錄機
3.4.1定序轉(zhuǎn)錄機和確定性
3.5用于形態(tài)剖析的FST
3.6轉(zhuǎn)錄機和正詞法規(guī)則
3.7把FST詞表與規(guī)則相結(jié)合
3.8與詞表無關(guān)的FST:Porter詞干處理器
3.9單詞和句子的詞例還原
3.9.1中文的自動切詞
3.10拼寫錯誤的檢查與更正
3.11最小編輯距離
3.12人是怎樣進行形態(tài)處理的
3.13小結(jié)
3.14文獻和歷史說明
第4章 N元語法
4.1語料庫中單詞數(shù)目的計算
4.2簡單的(非平滑的)N元語法
4.3訓(xùn)練集和測試集
4.3.1N元語法及其對訓(xùn)練語料庫的敏感性
4.3.2未知詞:開放詞匯與封閉詞匯
4.4N元語法的評測:困惑度
4.5平滑
4.5.1Laplace平滑
4.5.2Good Turing打折法
4.5.3Good Turing估計的一些高級專題
4.6插值法
4.7回退法
4.7.1高級專題:計算Katz回退的和P*
4.8實際問題:工具包和數(shù)據(jù)格式
4.9語言模型建模中的高級專題
4.9.1高級的平滑方法:Kneser Ney平滑法
4.9.2基于類別的N元語法
4.9.3語言模型的自適應(yīng)和網(wǎng)絡(luò)(Web)應(yīng)用
4.9.4長距離信息的使用:簡要的綜述
4.10信息論背景
4.10.1用于比較模型的交叉熵
4.11高級問題:英語的熵和熵率均衡性
4.12小結(jié)
4.13文獻和歷史說明
第5章詞類標注
5.1(大多數(shù))英語詞的分類
5.2英語的標記集
5.3詞類標注
5.4基于規(guī)則的詞類標注
5.5基于隱馬爾可夫模型的詞類標注
5.5.1計算最可能的標記序列: 一個實例
5.5.2隱馬爾可夫標注算法的形式化
5.5.3使用Viterbi算法來進行HMM標注
5.5.4把HMM擴充到三元語法
5.6基于轉(zhuǎn)換的標注
5.6.1怎樣應(yīng)用TBL規(guī)則
5.6.2怎樣學(xué)習(xí)TBL規(guī)則
5.7評測和錯誤分析
5.7.1錯誤分析
5.8詞類標注中的高級專題
5.8.1實際問題:標記的不確定性與詞例還原
5.8.2未知詞
5.8.3其他語言中的詞類標注
5.8.4標注算法的結(jié)合
5.9高級專題:拼寫中的噪聲信道模型
5.9.1上下文錯拼更正
5.10小結(jié)
5.11文獻和歷史說明
第6章隱馬爾可夫模型與最大熵模型
6.1馬爾可夫鏈
6.2隱馬爾可夫模型
6.3似然度的計算:向前算法
6.4解碼:Viterbi算法
6.5HMM的訓(xùn)練:向前向后算法
6.6最大熵模型:背景
6.6.1線性回歸
6.6.2邏輯回歸
6.6.3邏輯回歸:分類
6.6.4高級專題:邏輯回歸的訓(xùn)練
6.7最大熵模型
6.7.1為什么稱為最大熵
6.8最大熵馬爾可夫模型
6.8.1MEMM的解碼和訓(xùn)練
6.9小結(jié)
6.10文獻和歷史說明
第二部分 語音的計算機處理
第7章語音學(xué)
7.1言語語音與語音標音法
7.2發(fā)音語音學(xué)
7.2.1發(fā)音器官
7.2.2輔音:發(fā)音部位
7.2.3輔音:發(fā)音方法
7.2.4元音
7.2.5音節(jié)
7.3音位范疇與發(fā)音變異
7.3.1語音特征
7.3.2語音變異的預(yù)測
7.3.3影響語音變異的因素
7.4聲學(xué)語音學(xué)和信號
7.4.1波
7.4.2語音的聲波
7.4.3頻率與振幅:音高和響度
7.4.4從波形來解釋音子
7.4.5聲譜和頻域
7.4.6聲源濾波器模型
7.5語音資源
7.6高級問題:發(fā)音音系學(xué)與姿態(tài)音系學(xué)
7.7小結(jié)
7.8文獻和歷史說明
第8章 語音合成
8.1文本歸一化
8.1.1句子的詞例還原
8.1.2非標準詞
8.1.3同形異義詞的排歧
8.2語音分析
8.2.1查詞典
8.2.2名稱
8.2.3字位-音位轉(zhuǎn)換
8.3韻律分析
8.3.1韻律的結(jié)構(gòu)
8.3.2韻律的突顯度
8.3.3音調(diào)
8.3.4更精巧的模型:ToBI
8.3.5從韻律標記計算音延
8.3.6從韻律標記計算F0
8.3.7文本分析的最后結(jié)果:內(nèi)部表示
8.4雙音子波形合成
8.4.1建立雙音子數(shù)據(jù)庫的步驟
8.4.2雙音子毗連和用于韻律的TD-PSOLA
8.5單元選擇(波形)合成
8.6評測
8.7文獻和歷史說明
第9章語音自動識別
9.1語音識別的總體結(jié)構(gòu)
9.2隱馬爾可夫模型應(yīng)用于語音識別
9.3特征抽。篗FCC矢量
9.3.1預(yù)加重
9.3.2加窗
9.3.3離散傅里葉變換
9.3.4Mel濾波器組和對數(shù)
9.3.5倒譜:逆向傅里葉變換
9.3.6Delta特征與能量
9.3.7總結(jié):MFCC
9.4 聲學(xué)似然度的計算
9.4.1矢量量化
9.4.2高斯概率密度函數(shù)
9.4.3概率、對數(shù)概率和距離函數(shù)
9.5詞典和語言模型
9.6搜索與解碼
9.7嵌入式訓(xùn)練
9.8評測:詞錯誤率
9.9小結(jié)
9.10文獻和歷史說明
第10章語音識別:高級專題
10.1多遍解碼:N最佳表和格
10.2A*解碼算法(棧解碼算法)
10.3依賴于上下文的聲學(xué)模型:三音子
10.4分辨訓(xùn)練
10.4.1最大互信息估計
10.4.2基于后驗分類器的聲學(xué)模型
10.5語音變異的建模
10.5.1環(huán)境語音變異和噪聲
10.5.2說話人變異和說話人適應(yīng)
10.5.3發(fā)音建模:由于語類的差別而產(chǎn)生的變異
10.6元數(shù)據(jù):邊界、標點符號和不流利現(xiàn)象
10.7人的語音識別
10.8小結(jié)
10.9文獻和歷史說明
第11章計算音系學(xué)
11.1有限狀態(tài)音系學(xué)
11.2高級有限狀態(tài)音系學(xué)
11.2.1元音和諧
11.2.2模板式形態(tài)學(xué)
11.3計算優(yōu)選理論
11.3.1優(yōu)選理論中的有限狀態(tài)轉(zhuǎn)錄機模型
11.3.2優(yōu)選理論的隨機模型
11.4音節(jié)切分
11.5音位規(guī)則和形態(tài)規(guī)則的機器學(xué)習(xí)
11.5.1音位規(guī)則的機器學(xué)習(xí)
11.5.2形態(tài)規(guī)則的機器學(xué)習(xí)
11.5.3優(yōu)選理論中的機器學(xué)習(xí)
11.6小結(jié)
11.7文獻和歷史說明
第三部分句法的計算機處理
第12章英語的形式語法
12.1組成性
12.2上下文無關(guān)語法
12.2.1上下文無關(guān)語法的形式定義
12.3英語的一些語法規(guī)則
12.3.1句子一級的結(jié)構(gòu)
12.3.2子句與句子
12.3.3名詞短語
12.3.4一致關(guān)系
12.3.5動詞短語和次范疇化
12.3.6助動詞
12.3.7并列關(guān)系
12.4樹庫
12.4.1樹庫的例子:賓州樹庫課題
12.4.2作為語法的樹庫
12.4.3樹庫搜索
12.4.4中心詞與中心詞的發(fā)現(xiàn)
12.5語法等價與范式
12.6有限狀態(tài)語法和上下文無關(guān)語法
12.7依存語法
12.7.1依存和中心詞之間的關(guān)系
12.7.2范疇語法
12.8口語的句法
12.8.1不流暢現(xiàn)象與口語修正
12.8.2口語樹庫
12.9語法和人的語言處理
12.10小結(jié)
12.11文獻和歷史說明
第13章句法剖析
13.1剖析就是搜索
13.1.1自頂向下剖析
13.1.2自底向上剖析
13.1.3自頂向下剖析與自底向上剖析比較
13.2歧義
13.3面對歧義的搜索
13.4動態(tài)規(guī)劃剖析方法
13.4.1CKY剖析
13.4.2Earley算法
13.4.3線圖剖析
13.5局部剖析
13.5.1基于規(guī)則的有限狀態(tài)組塊分析
13.5.2基于機器學(xué)習(xí)的組塊分析方法
13.5.3組塊分析系統(tǒng)的評測
13.6小結(jié)
13.7文獻和歷史說明
第14章統(tǒng)計剖析
14.1概率上下文無關(guān)語法
14.1.1 PCFG用于排歧
14.1.2PCFG用于語言建模
14.2PCFG的概率CKY剖析
14.3PCFG規(guī)則概率的學(xué)習(xí)途徑
14.4PCFG的問題
14.4.1獨立性假設(shè)忽略了規(guī)則之間的結(jié)構(gòu)依存關(guān)系
14.4.2缺乏對詞匯依存關(guān)系的敏感性
14.5使用分離非終極符號的辦法來改進PCFG
14.6概率詞匯化的CFG
14.6.1Collins剖析器
14.6.2高級問題:Collins剖析器更多的細節(jié)
14.7剖析器的評測
14.8高級問題:分辨再排序
14.9高級問題:基于剖析器的語言模型
14.10人的剖析
14.11小結(jié)
14.12文獻和歷史說明
第15章特征與合一
15.1特征結(jié)構(gòu)
15.2特征結(jié)構(gòu)的合一
15.3語法中的特征結(jié)構(gòu)
15.3.1一致關(guān)系
15.3.2中心語特征
15.3.3次范疇化
15.3.4長距離依存關(guān)系
15.4合一的實現(xiàn)
15.4.1合一的數(shù)據(jù)結(jié)構(gòu)
15.4.2合一算法
15.5帶有合一約束的剖析
15.5.1把合一結(jié)合到Earley剖析器中
15.5.2基于合一的剖析
15.6類型與繼承
15.6.1高級問題:類型的擴充
15.6.2合一的其他擴充
15.7小結(jié)
15.8文獻和歷史說明
第16章語言和復(fù)雜性
16.1Chomsky 層級
16.2怎么判斷一種語言不是正則的
16.2.1抽吸引理
16.2.2證明各種自然語言不是正則語言
16.3自然語言是上下文無關(guān)的嗎
16.4計算復(fù)雜性和人的語言處理
16.5小結(jié)
16.6文獻和歷史說明
第四部分語義和語用的計算機處理
第17章意義的表示
17.1意義表示的計算要求
17.1.1可驗證性
17.1.2無歧義性
17.1.3規(guī)范形式
17.1.4推理與變量
17.1.5表達能力
17.2模型論語義學(xué)
17.3一階邏輯
17.3.1一階邏輯基礎(chǔ)
17.3.2變量和量詞
17.3.3λ表示法
17.3.4一階邏輯的語義
17.3.5推理
17.4事件與狀態(tài)的表示
17.4.1時間表示
17.4.2體
17.5描述邏輯