統(tǒng)計學(xué)習(xí)要素:機器學(xué)習(xí)中的數(shù)據(jù)挖掘、推斷與預(yù)測(第2版)
定 價:159 元
- 作者:[美] 特雷弗·哈斯蒂,[美] 羅伯特·提布施拉 著
- 出版時間:2020/12/1
- ISBN:9787302557395
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP181
- 頁碼:576
- 紙張:膠版紙
- 版次:1
- 開本:16
《統(tǒng)計學(xué)習(xí)要素:機器學(xué)習(xí)中的數(shù)據(jù)挖掘、推斷與預(yù)測(第2版)》在一個通用的概念框架中描述通用于數(shù)據(jù)挖掘、機器學(xué)習(xí)和生物信息學(xué)等領(lǐng)域的重要思想和概念。這些統(tǒng)計學(xué)范疇下的概念是人工智能與機器學(xué)習(xí)的基礎(chǔ)。全書共18 章,主題包括監(jiān)督學(xué)習(xí)、回歸的線性方法、分類的線性方法、基展開和正則化、核光滑方法、模型評估和選擇、模型推斷和平均、加性模型、樹和相關(guān)方法、Boosting 和加性樹、神經(jīng)網(wǎng)絡(luò)、支持向量機和柔性判斷、原型方法和最近鄰、非監(jiān)督學(xué)習(xí)、隨機森林、集成學(xué)習(xí)、無向圖模型和高維問題等。
《統(tǒng)計學(xué)習(xí)要素:機器學(xué)習(xí)中的數(shù)據(jù)挖掘、推斷與預(yù)測(第2版)》主題全面,是一本經(jīng)典的統(tǒng)計學(xué)習(xí)教材,適合本科高年級學(xué)生和研究生使用和參考。
第2版前言
“我們信靠上帝,其他的只信數(shù)據(jù)!”
— 威廉·愛德華·戴明(William Edwards Deming, 1900—1993) ①②
本書第1 版受到了廣大讀者的肯定和歡迎,讓我們備受鼓舞。同時,自此書出版以來,統(tǒng)計學(xué)習(xí)領(lǐng)域的研究步伐也日新月異。這些促使我們將本書更新至第2 版。
我們增加了4 章新的內(nèi)容,并更新了已有章節(jié)的部分內(nèi)容?紤]到許多讀者對第1 版的布局比較熟悉,我們嘗試了盡量少改動本書的結(jié)構(gòu)。下表總結(jié)一些主要的變化。
章 新增內(nèi)容
1. 概述
2. 監(jiān)督學(xué)習(xí)綜述
3. 回歸的線性方法 最小角度回歸(Least Angle Regression,LAR)
算法和Lasso 的推廣
4. 分類的線性方法 用于邏輯斯特回歸(logistic)的Lasso 路徑
5. 基展開與正則化 增加了對重建核希爾伯特空間(RKHS)的描述
6. 核平滑方法
7. 模型的評估和選擇 交叉驗證的優(yōu)勢和陷阱
8. 模型的推斷和平均
9. 加性模型、樹和相關(guān)方法
10. Boosting 和加性樹 一個生態(tài)學(xué)的新示例, 一些內(nèi)容被轉(zhuǎn)到第16章
11. 神經(jīng)網(wǎng)絡(luò) 貝葉斯神經(jīng)網(wǎng)和NIPS 2003 挑戰(zhàn)
12. 支持向量機和柔性判別分析 支持向量機(SVM)分類器的路徑算法
13. 原型方法與最近鄰
14. 非監(jiān)督學(xué)習(xí) 譜聚類,核主成分分析(PCA),稀疏PCA,非
負矩陣分解中的典型分析,非線性維數(shù)約簡,谷
歌的頁面排名(Page Rank)算法,一個實現(xiàn)獨
立分量分析(ICA)的直接方法
15. 隨機森林 新
16. 集成學(xué)習(xí) 新
17. 無向圖模型 新
18. 高維問題:?? ? ?? 新
① 在網(wǎng)絡(luò)上,這一引語曾經(jīng)廣泛認為是戴明(Deming)和海登(Robert W. Hayden)提出的。
然而,海登教授告訴我們,他從未說過此話。比較搞笑的是,我們也沒有找到“數(shù)據(jù)”來證實戴
明實際上說過這句話。
② 中文版編注:在NASA 有一間會議室的墻上,有這樣一句原話:“In God we trust, all others
bring data.”
其他說明如下。
? 第1 版對色盲讀者不是太友好,特別是我們偏好采用會引起麻煩的紅/綠對比。在新版中,我們對顏色配置進行了較大的改進,用橙色/藍色對比來代替原來的紅/綠對比。
? 我們將第6章的標(biāo)題從“核方法”改成“核平滑方法”,以免與第12章中的支持向量機部分以及第5章和第14章、在機器學(xué)習(xí)框架下廣泛討論的核方法混淆。
? 在第1 版中,因為沒有明確區(qū)分條件誤差率(以訓(xùn)練集為條件)和無條件誤差率,所以第7 章關(guān)于誤差率估計的討論有些湊合。在新版中,我們已經(jīng)修正這一問題。
? 第15章和第16章是從第10章自然發(fā)展而來的,讀者最好能按這個順序來閱讀。
? 在第17章,我們沒有試圖涵蓋圖模型的全部內(nèi)容,而是只討論了無向圖模型以及估計它們的一些新方法。具體來說,由于篇幅限制,我們在本書中忽略了與有向圖模型相關(guān)的內(nèi)容。
? 第18章探索了高維特征空間學(xué)習(xí)中的?? ? ?? 問題。這一問題在很多領(lǐng)域(如基因組、蛋白質(zhì)組和文本分類)中都廣泛存在。
我們感謝在第1 版中發(fā)現(xiàn)(大量)錯誤的眾多讀者。在新版本里,我們?yōu)槟切╁e誤表示歉意,并盡我們最大的努力來避免錯誤再次發(fā)生。我們感謝馬克(Mark Segal)、巴拉(Bala Rajaratnam)和拉瑞(Larry Wasserman)對新增各章的內(nèi)容提出建議,也感謝斯坦福的許多研究生和博士后提出的建議,尤其是默罕默德(Mohammed AlQuraishi)、約翰(John Boik)、霍爾格(Holger Hoefling)、阿瑞(Arian Maleki)、多拉爾(Donal McMahon)、撒哈榮(Saharon Rosset)、巴巴克(Babak Shababa)、丹尼爾拉(DanielaWitten)、朱奇(Ji Zhu)和鄒輝(Hui Zou)。我們感謝約翰(John Kimmel),因為他耐心指導(dǎo)我們完成了新的版本。羅伯特(Robert Tibshirani)將此書獻給安娜(Anna McPhee)。
特雷弗·哈斯蒂(Trevor Hastie)
羅伯特·提布施拉尼(Robert Tibshirani)
杰羅姆·弗雷曼(Jerome Friedman)
加州,斯坦福大學(xué)
2008 年8 月
斯坦福大學(xué)統(tǒng)計學(xué)教授。三人是該領(lǐng)域的杰出研究人員。哈斯蒂在新澤西州的AT&T貝爾實驗室以技術(shù)人員身份工作9年之后,于1994年8月加入斯坦福大學(xué)任教。哈斯蒂用S-PLUS寫了許多統(tǒng)計建模軟件,并發(fā)明了主要曲線和曲面。他和提布施拉尼共同開發(fā)了廣義加性模型并寫了這一主題的熱門書。提布施拉尼提出了Lasso,參與創(chuàng)作了《Bootstrap概論》,這本書取得了相當(dāng)大的成功。弗雷曼是許多數(shù)據(jù)挖掘工具的共同發(fā)明人,包括CART、MARS、投影追蹤和梯度Boosting。
譯者簡介
張軍平
復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授,博導(dǎo),主要研究方向是人工智能、機器學(xué)習(xí)、生物認證和智能交通。曾經(jīng)主持多個國j級項目。他是人工智能著名期刊 IEEE Intelligent Systems 編委,擔(dān)任《軟件學(xué)報》和《自動化學(xué)報》等國內(nèi)權(quán)威期刊責(zé)任編輯。他是中國自動化學(xué)會混合智能專業(yè)委員會副主任。他在人工智能及相關(guān)專業(yè)領(lǐng)域發(fā)表了100余篇論文,包括 IEEE TPAMI,TNNLS,ToC,TAC和TITS等期刊以及ICML, AAAI和 ECCV等國際會議上。他的人工智能科普暢銷書《愛犯錯的智能體》榮獲了2019年中國自動化學(xué)會科普獎。2020年中國科普作家協(xié)會第六屆優(yōu)秀作品獎(中國科普創(chuàng)作領(lǐng)域z高獎)金獎以及2020年第十屆吳文俊人工智能科技進步獎(科普項目)。