本書主要介紹了機(jī)器翻譯系統(tǒng)開發(fā)過程中的主要問題、機(jī)器翻譯的發(fā)展歷程及*新進(jìn)展。其中著重闡述了機(jī)器翻譯領(lǐng)域的主要方法:基于規(guī)則的方法、基于示例的范式、目前*流行的統(tǒng)計范式和基于分段的方法以及目前*先進(jìn)的深度學(xué)習(xí)機(jī)器翻譯。
*后還討論了機(jī)器翻譯的評價問題,以及該領(lǐng)域內(nèi)的主要參與者和商業(yè)化現(xiàn)狀。
本書可作為機(jī)器翻譯領(lǐng)域技術(shù)人員的參考用書,同時也可供廣大計算機(jī)科學(xué)、人工智能領(lǐng)域?qū)ψ匀徽Z言處理感興趣的讀者閱讀。
譯者序
原書致謝
第一章
緒 論 / 001
第二章
翻譯難點 / 007
? 翻譯的本質(zhì)是什么 / 007
? 什么是恰當(dāng)翻譯 / 008
? 恰當(dāng)翻譯的標(biāo)準(zhǔn) / 010
? 機(jī)器翻譯的影響 / 011
? 為什么用計算機(jī)分析自然語言是非常困難的 / 014
? 自然語言與歧義 / 014
? 機(jī)器翻譯產(chǎn)生的主要問題 / 019
目 錄
目 錄
VII
? 自動翻譯系統(tǒng)和人工翻譯系統(tǒng) / 020
第三章
機(jī)器翻譯發(fā)展概述 / 023
? 基于規(guī)則的系統(tǒng):從直接方法到語際方法 / 023
? 統(tǒng)計機(jī)器翻譯系統(tǒng)的變革 / 029
? 發(fā)展歷史快速回顧 / 031
第四章
計算機(jī)出現(xiàn)之前 / 035
? 通用語言問題 / 035
? 歷史悠久的傳統(tǒng) / 036
? 人工語言 / 038
? 第二次世界大戰(zhàn)期間機(jī)器翻譯系統(tǒng)的發(fā)展 / 040
?Artsrouni 機(jī)械大腦 / 040
?Smirnov-Trojanskij 輔助翻譯環(huán)境 / 042
第五章
機(jī)器翻譯的開端:第一個基于規(guī)則的系統(tǒng) / 045
? 先驅(qū)者 / 046
VIII
機(jī)
器
翻
譯
? 早期實驗 / 046
?Weaver 的備忘錄 / 047
? 機(jī)器翻譯的真正開端(1950~1960 年) / 055
? 早期 / 055
? 第一個基于規(guī)則的系統(tǒng)的發(fā)展:Turmoil 和 Enthusiasm / 057
? 美國之外的研究 / 061
? 覺醒期(1960~1964 年) / 063
?Bar-Hillel 的批評 / 064
? 討論 / 066
第六章
1966 年的 ALPAC 報告及其影響 / 069
? 報告內(nèi)容 / 070
? 報告的直接后果 / 074
?1965~1990 年:長期停頓 / 076
? 更廣泛的研究工作 / 076
? 第一個商用系統(tǒng) / 079
第七章
平行語料庫與語句對齊 / 083
目 錄
IX
? 平行語料庫或雙文本的概念 / 083
? 平行語料庫的可用性 / 087
? 現(xiàn)有語料庫 / 087
? 平行語料庫的自動創(chuàng)建 / 089
? 語句對齊 / 092
? 基于語句相對長度的對齊 / 093
? 詞匯法 / 096
? 混合法 / 098
第八章
基于示例的機(jī)器翻譯 / 099
? 基于示例的機(jī)器翻譯概述 / 101
? 翻譯示例的搜索 / 103
? 基于示例的機(jī)器翻譯的優(yōu)缺點 / 105
第九章
統(tǒng)計機(jī)器翻譯與詞對齊 / 109
? 一些示例 / 110
? 機(jī)器翻譯的基本方程 / 113
? 詞匯對齊的不同方法:IBM 公司模型 / 118
X
機(jī)
器
翻
譯
? 模型 1 / 119
? 模型 2 / 124
? 模型 3 / 124
? 模型 4 / 125
? 模型 5 / 126
? 翻譯(或處理)階段 / 127
? 返回到研究領(lǐng)域的根源 / 130
第十章
基于分段的機(jī)器翻譯 / 131
? 面向分段的機(jī)器翻譯 / 131
? 雙重對齊 / 132
? 基于分段的機(jī)器翻譯一般問題 / 133
? 在統(tǒng)計模型中引入語言信息 / 138
? 考慮句法的對齊模型 / 139
? 考慮語義的對齊模型 / 142
第十一章
統(tǒng)計機(jī)器翻譯的挑戰(zhàn)與不足 / 145
? 語言多樣性問題 / 146
目 錄
XI
? 稀有語言的案例與中樞語言的回歸 / 147
? 如何快速開發(fā)針對新語言的機(jī)器翻譯系統(tǒng) / 152
? 混合機(jī)器翻譯系統(tǒng) / 152
? 基于規(guī)則的系統(tǒng)現(xiàn)狀 / 154
? 當(dāng)前挑戰(zhàn):新語言對機(jī)器翻譯系統(tǒng)的快速發(fā)展 / 155
? 是否統(tǒng)計過多 / 156
? 基于統(tǒng)計的翻譯系統(tǒng)的主要局限性 / 156
? 統(tǒng)計并不排斥語義 / 157
第十二章
深度學(xué)習(xí)機(jī)器翻譯 / 161
? 深度學(xué)習(xí)機(jī)器翻譯概述 / 162
? 深度學(xué)習(xí)機(jī)器翻譯當(dāng)前所面臨的挑戰(zhàn) / 168
第十三章
機(jī)器翻譯系統(tǒng)的評價 / 175
? 第一次評價活動 / 178
? 綜合評價 / 179
? 評價小組 / 180
XII
機(jī)
器
翻
譯
? 充分性和流暢性 / 181
? 人工輔助翻譯 / 181
? 尋求自動評測 / 183
?BLEU / 183
?NIST / 184
?METEOR / 185
? 自動評價方法評述 / 186
? 評價活動的擴(kuò)大 / 187
? 自動評價的經(jīng)驗教訓(xùn) / 189
? 根據(jù)語言對的任務(wù)難度評測 / 189
? 翻譯錯誤類型 / 194
第十四章
機(jī)器翻譯產(chǎn)業(yè):專業(yè)與大眾市場間的應(yīng)用 / 197
? 主要市場,難以評價 / 197
? 市場概覽 / 198
? 免費在線軟件 / 202
? 商業(yè)化產(chǎn)品 / 206
目 錄
XIII
?Systran 公司案例 / 208
? 全球市場 / 210
? 機(jī)器翻譯的新應(yīng)用 / 211
? 跨語言信息檢索 / 213
? 自動字幕和說明 / 214
? 多語對話的直譯 / 214
? 手機(jī)和通信對象 / 216
? 翻譯輔助工具 / 217
第十五章
結(jié)論:機(jī)器翻譯的未來 / 221
? 商業(yè)化挑戰(zhàn) / 221
? 機(jī)器翻譯的認(rèn)知方法 / 224
附錄
/ 229
? 附錄 A 術(shù)語 / 229
? 附錄 B 推薦與擴(kuò)展閱讀書目 / 238