隨著計算機技術(shù)迅猛地發(fā)展,人工智能與機器學習已經(jīng)滲透到我們?nèi)粘I畹母鱾領(lǐng)域。為此,中國人民大學專門為全校財經(jīng)和人文專業(yè)的學生開設(shè)了“人工智能與機器學習”課程,本書的所有作者都參與了該門課程的教學實踐,相互配合,總結(jié)教學經(jīng)驗,共同打磨而成《人工智能與機器學習》一書。書中通過豐富現(xiàn)實案例的詳細講解,引導學生了解各種機器學習模型的基本原理與實踐用法。避開了大量的數(shù)學模型和復雜編程知識,讓學生熟悉當下流行的一些機器學習和數(shù)據(jù)處理工具的使用,來解決現(xiàn)實領(lǐng)域遇到的各種數(shù)據(jù)分析和預測問題。
王秋月,中國人民大學信息學院計算機系講師。主要研究領(lǐng)域是數(shù)據(jù)庫、信息檢索、知識庫的構(gòu)建與應用等。她在香港中文大學取得博士學位,在德國奧格斯堡大學做了兩年博士后工作,并于2014年訪問德國馬克斯普朗克計算機科學研究所一年。她于2010年至2013年負責組織國際信息檢索評測會議INEX中的Data-Centric Track和Linked-Data Track,并擔任過SIGIR、TKDE等國際會議和雜志的評委,在國內(nèi)外期刊和會議上發(fā)表論文30余篇。主持或參與國家自然科學基金青年項目、面上項目、重點項目及國家重點研發(fā)計劃項目等多項。
覃雄派,中國人民大學信息學院計算機系副教授。2009年畢業(yè)于中國人民大學信息學院,獲得工學博士學位。目前主要從事高性能數(shù)據(jù)庫、大數(shù)據(jù)分析、信息檢索等方面的研究工作,主持1項國家自然科學基金面上項目,參與多項國家“863”計劃、“973”計劃及國家自然科學基金項目,在國內(nèi)外期刊和會議上發(fā)表論文30余篇。
趙素云,中國人民大學信息學院計算機系副教授。2009年畢業(yè)于香港理工大學,獲博士學位。主要研究方向為機器學習,不確定信息處理,以及隱私保護在數(shù)據(jù)挖掘中的應用等。主持國家自然科學基金項目兩項,并參與國家自然科學基金重點項目、核高基等多項,F(xiàn)已發(fā)表學術(shù)論文30余篇(其中SCI檢索論文10余篇)。目前,文章他引次數(shù)合計近1000次。
張靜,中國人民大學信息學院計算機系講師。2016年畢業(yè)于清華大學計算機科學與技術(shù)系,獲博士學位。研究興趣為數(shù)據(jù)挖掘。發(fā)表多篇數(shù)據(jù)挖掘國際頂級會議與期刊論文,包括TKDE,TKDD, KDD,IJCAI, AAAI等。Google統(tǒng)計論文引用量達到2000多次。
目錄
第1章人工智能簡介
11什么是人工智能
12人工智能簡史(1956年以前)
13人工智能簡史(1956—1980年)
14人工智能簡史(1980—2010年)
15人工智能簡史(2010年至今)
第2章機器學習簡介
21什么是機器學習
22機器學習分類
第3章Python簡介
31環(huán)境配置
32Python基礎(chǔ)編程
33Numpy
34Matplotlib
35Pandas
第4章K近鄰
41什么是K近鄰
42如何度量距離或者相似性
43數(shù)據(jù)縮放
44選擇合適的K值
45Scikitlearn KNN分類器介紹
46案例一:鳶尾花分類
第5章模型選擇
51偏差與方差
52訓練集與測試集
53交叉驗證
54案例二:鳶尾花分類(案例一續(xù))
第6章線性回歸
61什么是線性回歸
62損失函數(shù)
63增加多項式特征
64正則化
65超參數(shù)調(diào)優(yōu)
66案例三:波士頓房價預測
第7章邏輯回歸
71什么是邏輯回歸
72決策邊界
73損失函數(shù)
74線性回歸和邏輯回歸的異同
75多分類
76案例四:泰坦尼克號乘客生還預測
第8章分類評價指標
81混淆矩陣
82查準率與查全率、F1分數(shù)
83ROC曲線和AUC
84多分類評價指標
85案例五:泰坦尼克號乘客生還預測(案例四續(xù))
第9章樸素貝葉斯
91貝葉斯定理
92樸素貝葉斯分類器
93不同的樸素貝葉斯模型
94文本分類
95案例六:垃圾郵件識別
第10章支持向量機
101什么是支持向量機
102核函數(shù)
103支持向量機的參數(shù)優(yōu)化
104案例七:垃圾郵件識別(案例六續(xù))
105總結(jié)
第11章決策樹
111什么是決策樹
112構(gòu)建決策樹
113修剪決策樹
114決策樹的優(yōu)缺點和使用方法
115案例八:泰坦尼克號乘客生還預測
第12章集成學習
121袋裝
122提升
123堆疊
124案例九:泰坦尼克號乘客生還預測(案例八續(xù))
第13章聚類
131什么是聚類
132Kmeans算法
133聚類結(jié)果的評價
134不同的距離指標
135聚合式層次聚類
136案例十:商場客戶聚類
第14章深度學習
141深度學習發(fā)展簡史
142多層感知器
143損失函數(shù)
144優(yōu)化算法:反向傳播算法
145案例十一:手寫數(shù)字識別
146深度學習技巧
147卷積神經(jīng)網(wǎng)絡(luò)
148案例十二:圖像識別
第15章Kaggle競賽
151Kaggle平臺簡介
152Kaggle競賽簡介
153Kaggle競賽案例分析:泰坦尼克號乘客生還預測