scikit-learn機(jī)器學(xué)習(xí) 第2版
定 價(jià):59 元
叢書名:Python
- 作者:[美]加文·?耍℅avin Hackeling)
- 出版時(shí)間:2019/2/1
- ISBN:9787115503404
- 出 版 社:人民郵電出版社
- 中圖法分類:TP181
- 頁碼:199
- 紙張:
- 版次:01
- 開本:16開
近年來,Python語言成為了廣受歡迎的編程語言,而它在機(jī)器學(xué)習(xí)領(lǐng)域也有很好的表現(xiàn)。scikit-learn是一個(gè)用Python語言編寫的機(jī)器學(xué)習(xí)算法庫(kù),它可以實(shí)現(xiàn)一系列常用的機(jī)器學(xué)習(xí)算法,是一個(gè)好工具。
本書通過14章內(nèi)容,詳細(xì)地介紹了一系列機(jī)器學(xué)習(xí)模型和scikit-learn的使用技巧。本書從機(jī)器學(xué)習(xí)的基礎(chǔ)理論講起,涵蓋了簡(jiǎn)單線性回歸、K-近鄰算法、特征提取、多元線性回歸、邏輯回歸、樸素貝葉斯、非線性分類、決策樹回歸、隨機(jī)森林、感知機(jī)、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、K-均值算法、主成分分析等重要話題。
本書適合機(jī)器學(xué)習(xí)領(lǐng)域的工程師學(xué)習(xí),也適合想要了解scikit-learn的數(shù)據(jù)科學(xué)家閱讀。通過閱讀本書,讀者將有效提升自己在機(jī)器學(xué)習(xí)模型的構(gòu)建和評(píng)估方面的能力,并能夠高效地解決機(jī)器學(xué)習(xí)難題。
機(jī)器學(xué)習(xí)是一個(gè)非常熱門的技術(shù),本書內(nèi)容涵蓋多種機(jī)器學(xué)習(xí)模型,包括流行的機(jī)器學(xué)習(xí)算法,例如K近鄰算法、邏輯回歸、樸素貝葉斯、K 均值算法、決策樹以及人工神經(jīng)網(wǎng)絡(luò)。與此同時(shí),還討論了數(shù)據(jù)預(yù)處理、超參數(shù)優(yōu)化和集成方法等主題。
閱讀完本書之后,讀者將學(xué)會(huì)構(gòu)建用于文檔分類、圖像識(shí)別、廣告檢測(cè)等任務(wù)的系統(tǒng),還將學(xué)到如何使用scikit-learn類庫(kù)的API從類別變量、文本和圖像中提取特征,如何評(píng)估模型的性能,并對(duì)如何提升模型的性能建立直覺。除此之外,還將掌握在實(shí)踐中運(yùn)用scikit-learn構(gòu)建高效模型所需的技能,并能夠通過實(shí)用的策略完成高級(jí)任務(wù)。
Gavin Hackeling 是一名數(shù)據(jù)科學(xué)家和作家。他研究過各種各樣的機(jī)器學(xué)習(xí)問題,包括自動(dòng)語音識(shí)別、文檔分類、目標(biāo)識(shí)別、以及語義切分。Gavin Hackeling 畢業(yè)于北卡羅來納大學(xué)和紐約大學(xué),目前和他的妻子和貓生活在布魯克林。
第 1章 機(jī)器學(xué)習(xí)基礎(chǔ) 1
1.1 定義機(jī)器學(xué)習(xí) 1
1.2 從經(jīng)驗(yàn)中學(xué)習(xí) 2
1.3 機(jī)器學(xué)習(xí)任務(wù) 3
1.4 訓(xùn)練數(shù)據(jù)、測(cè)試數(shù)據(jù)和驗(yàn)證數(shù)據(jù) 4
1.5 偏差和方差 6
1.6 scikit-learn簡(jiǎn)介 8
1.7 安裝scikit-learn 8
1.7.1 使用pip安裝 9
1.7.2 在Windows系統(tǒng)下安裝 9
1.7.3 在Ubuntu 16.04系統(tǒng)下安裝 10
1.7.4 在Mac OS系統(tǒng)下安裝 10
1.7.5 安裝Anaconda 10
1.7.6 驗(yàn)證安裝 10
1.8 安裝pandas、Pillow、NLTK和matplotlib 11
1.9 小結(jié) 11
第 2章 簡(jiǎn)單線性回歸 12
2.1 簡(jiǎn)單線性回歸 12
2.1.1 用代價(jià)函數(shù)評(píng)價(jià)模型的擬合性 15
2.1.2 求解簡(jiǎn)單線性回歸的OLS 17
2.2 評(píng)價(jià)模型 19
2.3 小結(jié) 21
第3章 用K-近鄰算法分類和回歸 22
3.1 K-近鄰模型 22
3.2 惰性學(xué)習(xí)和非參數(shù)模型 23
3.3 KNN模型分類 23
3.4 KNN模型回歸 31
3.5 小結(jié) 36
第4章 特征提取 37
4.1 從類別變量中提取特征 37
4.2 特征標(biāo)準(zhǔn)化 38
4.3 從文本中提取特征 39
4.3.1 詞袋模型 39
4.3.2 停用詞過濾 42
4.3.3 詞干提取和詞形還原 43
4.3.4 tf-idf權(quán)重?cái)U(kuò)展詞包 45
4.3.5 空間有效特征向量化與哈希技巧 48
4.3.6 詞向量 49
4.4 從圖像中提取特征 52
4.4.1 從像素強(qiáng)度中提取特征 53
4.4.2 使用卷積神經(jīng)網(wǎng)絡(luò)激活項(xiàng)作為特征 54
4.5 小結(jié) 56
第5章 從簡(jiǎn)單線性回歸到多元線性回歸 58
5.1 多元線性回歸 58
5.2 多項(xiàng)式回歸 62
5.3 正則化 66
5.4 應(yīng)用線性回歸 67
5.4.1 探索數(shù)據(jù) 67
5.4.2 擬合和評(píng)估模型 69
5.5 梯度下降法 72
5.6 小結(jié) 76
第6章 從線性回歸到邏輯回歸 77
6.1 使用邏輯回歸進(jìn)行二元分類 77
6.2 垃圾郵件過濾 79
6.2.1 二元分類性能指標(biāo) 81
6.2.2 準(zhǔn)確率 82
6.2.3 精準(zhǔn)率和召回率 83
6.2.4 計(jì)算F1值 84
6.2.5 ROC AUC 84
6.3 使用網(wǎng)格搜索微調(diào)模型 86
6.4 多類別分類 88
6.5 多標(biāo)簽分類和問題轉(zhuǎn)換 93
6.6 小結(jié) 97
第7章 樸素貝葉斯 98
7.1 貝葉斯定理 98
7.2 生成模型和判別模型 100
7.3 樸素貝葉斯 100
7.4 在scikit-learn中使用樸素貝葉斯 102
7.5 小結(jié) 106
第8章 非線性分類和決策樹回歸 107
8.1 決策樹 107
8.2 訓(xùn)練決策樹 108
8.2.1 選擇問題 109
8.2.2 基尼不純度 116
8.3 使用scikit-learn類庫(kù)創(chuàng)建決策樹 117
8.4 小結(jié) 120
第9章 集成方法:從決策樹到隨機(jī)森林 121
9.1 套袋法 121
9.2 推進(jìn)法 124
9.3 堆疊法 126
9.4 小結(jié) 128
第 10章 感知機(jī) 129
10.1 感知機(jī) 129
10.1.1 激活函數(shù) 130
10.1.2 感知機(jī)學(xué)習(xí)算法 131
10.1.3 使用感知機(jī)進(jìn)行二元分類 132
10.1.4 使用感知機(jī)進(jìn)行文檔分類 138
10.2 感知機(jī)的局限性 139
10.3 小結(jié) 140
第 11章 從感知機(jī)到支持向量機(jī) 141
11.1 核與核技巧 141
11.2 最大間隔分類和支持向量 145
11.3 用scikit-learn分類字符 147
11.3.1 手寫數(shù)字分類 147
11.3.2 自然圖片字符分類 150
11.4 小結(jié) 152
第 12章 從感知機(jī)到人工神經(jīng)網(wǎng)絡(luò) 153
12.1 非線性決策邊界 154
12.2 前饋人工神經(jīng)網(wǎng)絡(luò)和反饋人工神經(jīng)網(wǎng)絡(luò) 155
12.3 多層感知機(jī) 155
12.4 訓(xùn)練多層感知機(jī) 157
12.4.1 反向傳播 158
12.4.2 訓(xùn)練一個(gè)多層感知機(jī)逼近XOR函數(shù) 162
12.4.3 訓(xùn)練一個(gè)多層感知機(jī)分類手寫數(shù)字 164
12.5 小結(jié) 165
第 13章 K-均值算法 166
13.1 聚類 166
13.2 K-均值算法 168
13.2.1 局部最優(yōu)值 172
13.2.2 用肘部法選擇K值 173
13.3 評(píng)估聚類 176
13.4 圖像量化 178
13.5 通過聚類學(xué)習(xí)特征 180
13.6 小結(jié) 184
第 14章 使用主成分分析降維 185
14.1 主成分分析 185
14.1.1 方差、協(xié)方差和協(xié)方差矩陣 188
14.1.2 特征向量和特征值 190
14.1.3 進(jìn)行主成分分析 192
14.2 使用PCA對(duì)高維數(shù)據(jù)可視化 194
14.3 使用PCA進(jìn)行面部識(shí)別 196
14.4 小結(jié) 199