本書(shū)是一本全面介紹人工智能領(lǐng)域的專業(yè)教材。分為八章,人工智能概述、人工智能數(shù)學(xué)基礎(chǔ)、人工智能基礎(chǔ)模型、人工智能編程框架、視覺(jué)智能處理技術(shù)、語(yǔ)言智能處理技術(shù)、語(yǔ)音智能處理技術(shù)和人工智能的未來(lái)發(fā)展趨勢(shì)。首先介紹人工智能的相關(guān)基礎(chǔ)知識(shí),包括人工智能相關(guān)概念、人工智能的數(shù)學(xué)基礎(chǔ)、人工智能的模型基礎(chǔ)以及相關(guān)編程基礎(chǔ),然后分別介紹視覺(jué)、語(yǔ)音、語(yǔ)言三個(gè)領(lǐng)域中的人工智能原理、方法以及技術(shù)應(yīng)用,最后對(duì)人工智能的發(fā)展趨勢(shì)做出了總結(jié)、思考和前瞻。本書(shū)除了提供全面的人工智能基礎(chǔ)知識(shí)外,還通過(guò)豐富的實(shí)踐案例和具體的應(yīng)用介紹,幫助讀者更深刻地理解和應(yīng)用所學(xué)知識(shí)。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
第1章 人工智能概述 1
1.1 人工智能的概念 1
1.2 人工智能的意義和目標(biāo) 2
1.2.1 人工智能的意義 2
1.2.2 人工智能的目標(biāo) 2
1.3 人工智能的起源和發(fā)展 2
1.4 人工智能的方向和內(nèi)容 6
1.4.1 機(jī)器學(xué)習(xí) 6
1.4.2 視覺(jué)信息處理 7
1.4.3 自然語(yǔ)言處理 8
1.4.4 語(yǔ)音信號(hào)處理 9
1.4.5 多模態(tài)信息處理 9
1.4.6 人工智能自動(dòng)生成內(nèi)容 10
習(xí)題 10
第2章 人工智能數(shù)學(xué)基礎(chǔ) 11
2.1 線性代數(shù) 11
2.1.1 基本數(shù)學(xué)對(duì)象 11
2.1.2 向量運(yùn)算 13
2.1.3 矩陣乘法 13
2.1.4 矩陣運(yùn)算 14
2.1.5 向量組與向量空間 15
2.1.6 特征分解 17
2.1.7 奇異值分解 18
2.1.8 特殊的矩陣 19
2.1.9 范數(shù) 20
2.2 微積分 20
2.2.1 導(dǎo)數(shù)與微分 21
2.2.2 鏈?zhǔn)椒▌t 22
2.2.3 函數(shù)極值 23
2.2.4 積分 23
2.2.5 矩陣微積分 24
2.2.6 泰勒公式 26
2.2.7 常用函數(shù)及其導(dǎo)數(shù) 26
2.3 概率與信息論 28
2.3.1 隨機(jī)變量 28
2.3.2 概率分布 28
2.3.3 期望和方差 30
2.3.4 條件概率 32
2.3.5 貝葉斯定理 33
2.3.6 信息論與熵 33
2.3.7 交叉熵與散度 34
2.4 數(shù)值計(jì)算 35
2.4.1 最優(yōu)化問(wèn)題的基礎(chǔ)模型 35
2.4.2 最優(yōu)化問(wèn)題分類 36
2.4.3 最小二乘法 37
2.4.4 梯度下降法 38
2.4.5 共軛梯度法 40
2.4.6 深度學(xué)習(xí)中常用的優(yōu)化方法 42
習(xí)題 47
第3章 人工智能基礎(chǔ)模型 48
3.1 卷積神經(jīng)網(wǎng)絡(luò) 48
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)的背景介紹 49
3.1.2 卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 49
3.1.3 卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算 51
3.1.4 典型卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 56
3.2 循環(huán)神經(jīng)網(wǎng)絡(luò) 58
3.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)的背景介紹 58
3.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 58
3.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)的計(jì)算 61
3.2.4 典型循環(huán)神經(jīng)網(wǎng)絡(luò)的應(yīng)用 64
3.3 生成對(duì)抗網(wǎng)絡(luò) 64
3.3.1 生成對(duì)抗網(wǎng)絡(luò)的背景介紹 65
3.3.2 生成對(duì)抗網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 65
3.3.3 生成對(duì)抗網(wǎng)絡(luò)的計(jì)算 68
3.3.4 典型生成對(duì)抗網(wǎng)絡(luò)的應(yīng)用 69
3.4 擴(kuò)散模型 71
3.4.1 擴(kuò)散模型的背景介紹 71
3.4.2 擴(kuò)散模型的基礎(chǔ)結(jié)構(gòu) 72
3.4.3 擴(kuò)散模型的計(jì)算 73
3.4.4 典型擴(kuò)散模型的應(yīng)用 81
3.5 圖神經(jīng)網(wǎng)絡(luò) 83
3.5.1 圖神經(jīng)網(wǎng)絡(luò)的背景介紹 84
3.5.2 圖神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 86
3.5.3 圖神經(jīng)網(wǎng)絡(luò)的計(jì)算 88
3.5.4 典型圖神經(jīng)網(wǎng)絡(luò)的應(yīng)用 91
3.6 Transformer 92
3.6.1 Transformer的背景介紹 92
3.6.2 Transformer的基礎(chǔ)結(jié)構(gòu) 94
3.6.3 Transformer的計(jì)算 98
3.6.4 典型Transformer的應(yīng)用 99
習(xí)題 101
第4章 人工智能編程框架 102
4.1 Python基礎(chǔ) 102
4.1.1 Python簡(jiǎn)介 102
4.1.2 Python基本語(yǔ)法 107
4.1.3 Python數(shù)據(jù)類型 108
4.1.4 Python程序結(jié)構(gòu) 119
4.1.5 Python函數(shù) 123
4.1.6 Python類 124
4.1.7 Python庫(kù) 125
4.2 PyTorch框架 130
4.2.1 環(huán)境配置 131
4.2.2 模型實(shí)現(xiàn)示例 135
4.3 其他人工智能框架 140
習(xí)題 141
第5章 視覺(jué)智能處理技術(shù) 142
5.1 視覺(jué)智能處理基礎(chǔ)知識(shí) 142
5.1.1 圖像表示與處理 142
5.1.2 特征提取與描述 146
5.1.3 視覺(jué)智能處理基本任務(wù) 149
5.2 目標(biāo)檢測(cè)與圖像分割技術(shù) 151
5.2.1 目標(biāo)檢測(cè)與圖像分割中的基礎(chǔ)知識(shí) 152
5.2.2 基于CNN的目標(biāo)檢測(cè)與圖像分割 157
5.2.3 結(jié)合Transformer的目標(biāo)檢測(cè)與圖像分割 161
5.3 三維視覺(jué)技術(shù) 166
5.3.1 點(diǎn)云數(shù)據(jù)的表示 166
5.3.2 點(diǎn)云物體分類與分割 167
5.3.3 基于點(diǎn)云的生成技術(shù) 174
5.4 視頻理解和處理技術(shù) 180
5.4.1 基本概念 180
5.4.2 視頻對(duì)象分割 186
5.4.3 視頻增強(qiáng) 193
習(xí)題 201
第6章 語(yǔ)言智能處理技術(shù) 202
6.1 語(yǔ)言智能處理基礎(chǔ)知識(shí) 202
6.1.1 文本表示與嵌入 202
6.1.2 句法分析 207
6.1.3 關(guān)鍵詞提取 210
6.2 神經(jīng)機(jī)器翻譯 212
6.2.1 神經(jīng)機(jī)器翻譯介紹 213
6.2.2 基于深度神經(jīng)網(wǎng)絡(luò)的神經(jīng)機(jī)器翻譯模型 216
6.2.3 BERT-fused模型 220
6.2.4 mRASP模型 224
6.3 共指解析技術(shù) 226
6.3.1 共指解析的基本概念 228
6.3.2 共指解析的評(píng)估標(biāo)準(zhǔn) 229
6.3.3 端到端的共指解析模型 232
6.4 智能問(wèn)答技術(shù) 237
6.4.1 智能問(wèn)答系統(tǒng)發(fā)展歷程 238
6.4.2 智能問(wèn)答系統(tǒng)架構(gòu) 238
6.4.3 智能問(wèn)答基礎(chǔ) 239
6.4.4 大語(yǔ)言模型 244
6.4.5 智能問(wèn)答系統(tǒng) 247
習(xí)題 248
第7章 語(yǔ)音智能處理技術(shù) 249
7.1 語(yǔ)音信號(hào)處理技術(shù) 249
7.1.1 語(yǔ)音信號(hào)的特性與數(shù)字化表示 249
7.1.2 語(yǔ)音信號(hào)的預(yù)處理 251
7.1.3 語(yǔ)音信號(hào)的特征提取 254
7.2 語(yǔ)音識(shí)別技術(shù) 257
7.2.1 傳統(tǒng)的語(yǔ)音識(shí)別技術(shù) 258
7.2.2 端到端的語(yǔ)音識(shí)別技術(shù) 258
7.3 語(yǔ)音合成及轉(zhuǎn)換技術(shù) 265
7.3.1 語(yǔ)音合成技術(shù) 265
7.3.2 語(yǔ)音轉(zhuǎn)換技術(shù) 273
7.4 語(yǔ)音增強(qiáng)技術(shù) 276
7.4.1 語(yǔ)音增強(qiáng)介紹 276
7.4.2 冗余卷積編碼器-解碼器 279
7.4.3 語(yǔ)音增強(qiáng)生成對(duì)抗網(wǎng)絡(luò) 281
7.4.4 用于語(yǔ)音增強(qiáng)的條件擴(kuò)散模型 283
習(xí)題 286
第8章 人工智能的未來(lái)發(fā)展趨勢(shì) 287
8.1 生成式人工智能技術(shù) 287
8.1.1 小波擴(kuò)散模型 288
8.1.2 偏移擴(kuò)散模型 290
8.1.3 對(duì)未來(lái)技術(shù)的思考和展望 294
8.2 可解釋人工智能技術(shù) 294
8.2.1 PIP-Net模型 295
8.2.2 LaBo模型 298
8.2.3 對(duì)未來(lái)技術(shù)的思考和展望 301
8.3 多模態(tài)人工智能技術(shù) 302
8.3.1 Lynx模型 302
8.3.2 BLIP-2模型 304
8.3.3 對(duì)未來(lái)技術(shù)的思考和展望 307
8.4 具身智能技術(shù) 307
8.4.1 PaLM-E模型 308
8.4.2 EmbodiedGPT模型 311
8.4.3 對(duì)未來(lái)技術(shù)的思考和展望 314
習(xí)題 315
參考文獻(xiàn) 316