本書為十四五高等職業(yè)教育新形態(tài)一體化教材之一,通過貼近生活的挑橘子一例引出機(jī)器學(xué)習(xí)的概念,并展開介紹了機(jī)器學(xué)習(xí)的完整流程、算法分類以及常用工具等。 本書以項(xiàng)目任務(wù)的組織方式,以通俗的情境作為項(xiàng)目導(dǎo)入,制定明確的項(xiàng)目目標(biāo),以算法的基本原理為知識導(dǎo)入,然后開始項(xiàng)目實(shí)施環(huán)節(jié),以多個(gè)實(shí)訓(xùn)任務(wù)分別練習(xí)算法在解決回歸、分類或聚類問題時(shí)的一般流程,最后以習(xí)題的形式鞏固所學(xué)知識和技能。本書的實(shí)訓(xùn)項(xiàng)目主要包含機(jī)器學(xué)習(xí)中基礎(chǔ)的算法應(yīng)用,即線性回歸算法、k-近鄰算法、邏輯回歸算法、決策樹算法、聚類算法、樸素貝葉斯算法。 通讀本書,你會了解機(jī)器學(xué)習(xí)解決的是什么問題,目前它應(yīng)用在我們生活中的哪些場景;跟著本書動手實(shí)踐,你會清楚數(shù)據(jù)怎么來、怎么加工,以及模型是什么,怎么訓(xùn)練與調(diào)用;另外,面對一個(gè)實(shí)際問題,你能夠有依據(jù)地選擇合適的算法。本書適合作為高等職業(yè)院校人工智能技術(shù)應(yīng)用專業(yè)的教材,也適用于有編程基礎(chǔ)的學(xué)生以及對機(jī)器學(xué)習(xí)感興趣且亟需入門的社會工作者。
機(jī)器學(xué)習(xí)領(lǐng)域的著名學(xué)者湯姆·米切爾(Tom Mitchell)將機(jī)器學(xué)習(xí)定義為:對于計(jì)算機(jī)
程序有經(jīng)驗(yàn) E、學(xué)習(xí)任務(wù) T 和性能度量 P,如果計(jì)算機(jī)程序針對任務(wù) T 的性能 P 隨著經(jīng)驗(yàn) E 不
斷增長,就稱這個(gè)計(jì)算機(jī)程序從經(jīng)驗(yàn) E 學(xué)習(xí)。 這一概念對于大多數(shù)人而言確實(shí)過于抽象簡潔。
如果其定義為用計(jì)算機(jī)通過算法來學(xué)習(xí)數(shù)據(jù)中包含的內(nèi)在規(guī)律和信息,從而獲得新的經(jīng)驗(yàn)和
知識,以提高計(jì)算機(jī)的智能性,使計(jì)算機(jī)面對問題時(shí)能夠做出與人類相似的決策,則更加符合
大家對機(jī)器學(xué)習(xí)的認(rèn)知。
近年來,隨著機(jī)器學(xué)習(xí)向各行各業(yè)的滲透,機(jī)器學(xué)習(xí)算法在普羅大眾中也得到了一定的認(rèn)
可。 從事相關(guān)領(lǐng)域工作的人員提到機(jī)器學(xué)習(xí),想必都會了解甚至十分熟悉監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)
習(xí)和強(qiáng)化學(xué)習(xí)這三個(gè)分類,對于樸素貝葉斯算法、k-均值算法、回歸算法都耳熟能詳。 然而如
何利用機(jī)器學(xué)習(xí)解決自身領(lǐng)域的問題卻又有些不知如何下手。 面對如依據(jù)天氣、時(shí)間等因素推
薦一種合適的通勤工具,或者預(yù)測自身體重的變化,抑或分析員工離職情況這類數(shù)據(jù)結(jié)構(gòu)相對
簡單、數(shù)據(jù)來源相對單一的問題時(shí),很多人很難將機(jī)器學(xué)習(xí)的理論和技術(shù)應(yīng)用其中,更不要提
構(gòu)建符合行業(yè)要求的機(jī)器學(xué)習(xí)算法。
當(dāng)想進(jìn)一步深入了解時(shí),發(fā)現(xiàn)需要面對汗牛充棟的理論、公式和編程技術(shù),令人望而
卻步。 如果你也面臨類似的問題,那么本書適合你;本書也適合機(jī)器學(xué)習(xí)零基礎(chǔ)的讀者學(xué)習(xí)。
本書編者在機(jī)器學(xué)習(xí)高等教育領(lǐng)域辛勤耕耘十余年,此次將自身豐富的教學(xué)經(jīng)驗(yàn)以及較深
厚的理論知識進(jìn)行融合,并配以生動且貼近生活的應(yīng)用實(shí)例,將機(jī)器學(xué)習(xí)算法的知識體系、應(yīng)
用場景、實(shí)施方式與步驟進(jìn)行了細(xì)致的說明。
本書的緒論向讀者介紹了機(jī)器學(xué)習(xí)的概念、機(jī)器學(xué)習(xí)的應(yīng)用與分類等基礎(chǔ)知識,同時(shí)對本
書代碼實(shí)現(xiàn)的核心開源庫 sklearn 進(jìn)行了說明。 此后各項(xiàng)目分別對應(yīng)了線性回歸算法、k-近鄰
算法、邏輯回歸算法、決策樹、聚類算法以及樸素貝葉斯算法,在每種算法介紹前通過知識導(dǎo)
入,對背景知識、學(xué)習(xí)前需要掌握的技術(shù)能力進(jìn)行詳細(xì)說明,以方便讀者學(xué)習(xí);在正文中通過
生動形象的實(shí)例深入淺出地講解不同項(xiàng)目的目標(biāo)、主要知識點(diǎn)以及編程實(shí)現(xiàn)步驟;最后通過習(xí)
題的形式鞏固本項(xiàng)目學(xué)習(xí)成果。
本書注意貫徹落實(shí)立德樹人根本任務(wù),堅(jiān)定文化自信,踐行二十大報(bào)告精神,充分體現(xiàn)黨
的二十大報(bào)告提出的實(shí)施科教興國戰(zhàn)略,強(qiáng)化現(xiàn)代人才建設(shè)支撐的精神,落實(shí)加強(qiáng)教材
建設(shè)和管理新要求。
本書由杜輝、葛鵬、趙瑞豐任主編,王亞楠、王磊、劉明浩任副主編,丁雷、金光浩、汪勝平
參與編寫。 在此,感謝所有在本書的內(nèi)容制作、代碼驗(yàn)證及編排校對工作中付出辛苦勞動和支
持的同志。 本書配套的相關(guān)資源可通過派 Lab人工智能教學(xué)實(shí)訓(xùn)平臺(平臺網(wǎng)址:lab.
314ai.com)查看和動手實(shí)踐,還可與本書編者聯(lián)系(E-mail:1318475816@ qq.com)。
機(jī)器學(xué)習(xí)技術(shù)是一門前景廣闊的新興技術(shù),本書力圖從實(shí)用性角度為高職同學(xué)打開一條通
往未來世界的通道。
由于編者水平有限,書中難免有不足之處,歡迎廣大讀者予以指正。
編 者
2023 年 6 月