數(shù)據(jù)標(biāo)注工程——語(yǔ)言數(shù)據(jù)與結(jié)構(gòu)
定 價(jià):68 元
- 作者:饒高琦
- 出版時(shí)間:2023/8/1
- ISBN:9787121459542
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁(yè)碼:216
- 紙張:
- 版次:01
- 開本:16開
本書是數(shù)據(jù)標(biāo)注領(lǐng)域領(lǐng)先的實(shí)訓(xùn)講義。本書著重對(duì)常見的文本、語(yǔ)音和圖像標(biāo)注任務(wù)類型進(jìn)行介紹,幫助從事標(biāo)注工作的學(xué)習(xí)者快速地完成系統(tǒng)化學(xué)習(xí),進(jìn)行標(biāo)注實(shí)戰(zhàn)。 本書對(duì)文本、語(yǔ)音及圖像標(biāo)注的多種任務(wù)類型逐一進(jìn)行講解和分析,每種標(biāo)注類型均配有對(duì)應(yīng)的規(guī)范、舉例分析、習(xí)題及解析。同時(shí),本書還針對(duì)各類標(biāo)注配套多種子任務(wù)類型或多個(gè)領(lǐng)域的實(shí)操練習(xí)題,以幫助本書學(xué)習(xí)者增長(zhǎng)見識(shí),實(shí)現(xiàn)系統(tǒng)的、完整的學(xué)習(xí),培養(yǎng)實(shí)戰(zhàn)能力。
饒高琦,中國(guó)中文信息學(xué)會(huì)青年工作委員會(huì)委員、中國(guó)人工智能學(xué)會(huì)多語(yǔ)智能信息處理專委會(huì)宣傳委員、面向教育應(yīng)用的自然語(yǔ)言處理工作坊聯(lián)合主席。
目錄
第1章 語(yǔ)言和語(yǔ)言數(shù)據(jù) 001
1.1 自然語(yǔ)言 002
1.1.1 什么是自然語(yǔ)言 002
1.1.2 世界語(yǔ)言概況 005
1.2 語(yǔ)言智能 006
1.2.1 語(yǔ)言智能是什么 006
1.2.2 語(yǔ)言智能的常見任務(wù)和應(yīng)用 007
1.3 語(yǔ)言資源 013
1.3.1 什么是語(yǔ)言資源 013
1.3.2 為什么語(yǔ)言資源是語(yǔ)言智能的基礎(chǔ) 014
1.3.3 語(yǔ)言資源建設(shè)概況 015
第2章 語(yǔ)音和語(yǔ)音數(shù)據(jù) 017
2.1 語(yǔ)音和語(yǔ)音信息處理 018
2.1.1 語(yǔ)音合成 018
2.1.2 語(yǔ)音識(shí)別 019
2.2 語(yǔ)音的語(yǔ)言學(xué)結(jié)構(gòu) 019
2.2.1 語(yǔ)音的屬性 019
2.2.2 音節(jié)和音位 022
2.2.3 輔音和聲母 023
2.2.4 元音和韻母 024
2.3 語(yǔ)音的信息結(jié)構(gòu) 026
2.3.1 時(shí)域信息 027
2.3.2 頻域信息 028
第3章 漢字和文字?jǐn)?shù)據(jù) 030
3.1 漢字信息處理 031
3.2 漢字的結(jié)構(gòu) 032
3.2.1 漢字的演化 032
3.2.2 漢字的特點(diǎn) 034
3.3 漢字的信息化 036
3.3.1 字符編碼 036
3.3.2 漢字編碼 037
3.3.3 漢字的字符集 039
第4章 詞法和詞義 043
4.1 詞與詞處理 044
4.1.1 分詞 045
4.1.2 命名實(shí)體識(shí)別 046
4.1.3 詞性標(biāo)注 047
4.2 詞匯的結(jié)構(gòu) 048
4.2.1 詞匯的結(jié)構(gòu)單元 048
4.2.2 詞語(yǔ)的類型 052
4.2.3 特殊類型的詞 055
4.3 詞匯的語(yǔ)法功能:詞性 061
4.3.1 實(shí)詞 062
4.3.2 虛詞 070
4.4 詞匯的語(yǔ)義 075
4.4.1 詞義的構(gòu)成 075
4.4.2 詞義的聚合關(guān)系 080
4.4.3 詞典和詞語(yǔ)的釋義 084
4.5 詞語(yǔ)數(shù)據(jù)資源 087
4.5.1 漢語(yǔ)詞表資源 087
4.5.2 漢語(yǔ)詞典資源 091
4.5.3 其他重要漢語(yǔ)詞匯語(yǔ)義資源 105
第5章 句法和句義 109
5.1 句與句處理 110
5.1.1 句法分析 110
5.1.2 句義分析 111
5.2 句子的結(jié)構(gòu) 113
5.2.1 句法成分 113
5.2.2 句子的結(jié)構(gòu)類型 118
5.2.3 句子的特殊類型 123
5.2.4 句子的語(yǔ)氣類型 128
5.3 句法信息的表示形式 135
5.3.1 短語(yǔ)結(jié)構(gòu)文法 135
5.3.2 依存文法 139
5.4 句子的語(yǔ)義 141
5.4.1 句子的語(yǔ)義種類 141
5.4.2 句子的語(yǔ)義結(jié)構(gòu) 144
5.4.3 句子中的歧義 149
5.4.4 語(yǔ)義的表現(xiàn)形式:語(yǔ)義角色 153
5.4.5 語(yǔ)義的表現(xiàn)形式:語(yǔ)義依存 155
5.4.6 語(yǔ)義的表現(xiàn)形式:抽象語(yǔ)義表示 156
5.4.7 語(yǔ)義的表現(xiàn)形式:邏輯命題表示 160
5.5 句級(jí)數(shù)據(jù)資源 162
5.5.1 樹庫(kù)資源 162
5.5.2 句級(jí)語(yǔ)義資源 167
5.5.3 平行語(yǔ)料庫(kù) 167
第6章 篇章和篇章信息處理 169
6.1 對(duì)篇章的信息處理 169
6.1.1 文本分類 170
6.1.2 自動(dòng)摘要 170
6.1.3 信息抽取 171
6.2 修辭和語(yǔ)體 171
6.2.1 修辭 171
6.2.2 語(yǔ)體和體裁 183
6.3 修辭結(jié)構(gòu)理論 190
6.3.1 修辭結(jié)構(gòu)理論起源 190
6.3.2 定義關(guān)系 191
6.3.3 認(rèn)知圖式 198
6.4 篇章的數(shù)據(jù)資源 200
6.4.1 修辭結(jié)構(gòu)篇章樹庫(kù) 200
6.4.2 文本分類 201
6.4.3 面向話題指稱結(jié)構(gòu)的語(yǔ)料庫(kù)資源 202
6.4.4 篇章意圖資源 203
6.4.5 漢語(yǔ)篇章廣義話題結(jié)構(gòu)資源 203
6.4.6 基于主述位理論的漢語(yǔ)微觀話題語(yǔ)料庫(kù)資源 204