任何足夠先進的技術初看都與魔法無異。
自動駕駛汽車已經(jīng)在很多國家上路,網(wǎng)飛的算法能主動預測你喜歡的電影,DeepMind的計算機程序通關了雅達利游戲,AlphaGo在古老的圍棋領域攻克了人類智能的防線。
這一切是如何發(fā)生的?智能機器究竟如何思考?
在這本書中,作者用幾乎人人都能讀懂的語言展示了人工智能領域的前沿成果,深入解讀了感知算法、強化學習、智能體、卷積神經(jīng)網(wǎng)絡、深度語音識別、圖片識別等科技巨頭紛紛擁抱的概念,正是它們讓當今的機器如此智能。
DARPA和ImageNet的挑戰(zhàn)賽給未來播撒了怎樣的種子?
網(wǎng)飛的電影推薦為什么如此準確?
人工智能怎么打DOTA?
AlphaGo除了下圍棋還會做別的嗎?
神經(jīng)網(wǎng)絡如何做到能聽、能說、能記憶?
我們?yōu)槭裁匆粩嘀圃炷軓椭迫祟愔橇托袨榈臋C器?
這本書將為你打開機器學習與神經(jīng)網(wǎng)絡的黑匣子,讓你看懂魔法背后的機制。關于自動駕駛汽車、網(wǎng)飛算法、會玩游戲的人工智能以及AlphaGo,這本書幾乎囊括了你想知道的一切。
1. 這是一本技術小白和技術大咖都愛讀的機器學習指南。谷歌前工程專家、機器學習極客肖恩格里什的重磅作品。
2. 深度神經(jīng)網(wǎng)絡是新一波人工智能熱潮的推動引擎。圍繞這一前沿工具展開的對話,推動著自動駕駛汽車、網(wǎng)飛的推薦算法、AlphaGo,甚至會打DOTA游戲的人工智能的發(fā)展,任何想要參與這一時代對話的人都應該讀讀這本書。
3. 作者用通俗的類比和鼓舞人心的故事,厘清了許多神秘而前衛(wèi)的新概念:感知算法、強化學習、卷積神經(jīng)網(wǎng)絡、深度語音識別、圖片識別等。掌握這些概念,你才能更好地判斷,哪些關于人工智能的言論值得相信,哪些說得天花亂墜的謬論應該被拋棄,這本書將助力你的AI創(chuàng)業(yè)與投資之路。
4. 微軟CTO凱文斯科特親筆作序、谷歌工程總監(jiān)雷庫茲韋爾、美國人工智能協(xié)會院士佩德羅多明戈斯、谷歌研究科學家凱文墨菲、微軟亞洲研究院副院長潘天佑、馭勢科技CEO吳甘沙鼎力推薦!
推薦序
10多年前,我遇見了肖恩。當時我在谷歌領導團隊,負責開發(fā)為谷歌的搜索廣告業(yè)務提供支持的許多大型機器學習系統(tǒng)。肖恩是我們小組里最頂尖的工程師之一,當時他正在研究機器學習前沿領域的一系列具有挑戰(zhàn)性的問題。我們一起工作以來,體現(xiàn)在統(tǒng)計機器學習技術中的各類人工智能已經(jīng)從相對難以觸及的神秘技術、研究人員和高科技公司的專屬領域,發(fā)展成為日益平易近人的、卓有成效的工具和技術,值得每一位軟件開發(fā)人員使用。
目前機器學習領域取得的快速進展,在一定程度上是由以下因素推動的:數(shù)據(jù)爆炸,高性能計算機體系結構的復興,云提供商競相為開發(fā)人員和研究人員構建可擴展的人工智能平臺,人們將實時智能嵌入移動設備、汽車、其他消費電子產(chǎn)品和日益普遍的連接到云端的計算設備的熱潮。這種快速進步中包括一些驚世駭俗的成就,機器在許多狹窄的領域已經(jīng)接近于或超過了人類的能力,例如在圖像中標記物體、識別語音、玩策略游戲以及翻譯語言,但我們?nèi)蕴幱谶@些技術發(fā)展的初期,擺在我們面前的是長達幾十年的創(chuàng)新和發(fā)現(xiàn)之旅。
對開發(fā)人員和研究人員而言,理解機器學習的工作原理是一個明智的職業(yè)選擇。目前,全球的科技巨頭公司對這些技術的專業(yè)知識都有很高的需求。微軟、亞馬遜、谷歌、蘋果、百度等許多公司都提供應用程序接口、工具包和云計算基礎設施,將機器學習的開發(fā)工作交給全世界數(shù)以千萬計的開發(fā)人員。未來幾年,隨著越來越多的應用程序包含智能功能,大多數(shù)開發(fā)人員都需要掌握一些機器學習技術。這正是這本書的寶貴價值所在。
這本書誕生自肖恩對了解現(xiàn)代機器學習成功之路的渴望。在用清晰易懂的方式描述這些系統(tǒng)的本質(zhì)時,肖恩利用10多年的行業(yè)和學術經(jīng)驗解決了機器學習帶來的一些最棘手的問題。鑒于機器學習系統(tǒng)能夠復制某些方面的人類智能,等到某個突破點臨近,原本由人類特有的創(chuàng)造詩意詞句的能力或許也會被機器復制。肖恩對這些技術嚴謹實用的描述反映了他在科研戰(zhàn)壕中的歲月,不時令人感到痛苦的反復試驗讓戰(zhàn)壕中的人們了解到,機器學習并不是魔法。如果你知道如何應用它,了解它的局限所在,它就是強有力的前沿工具;如果你不知道,它就幾乎一文不值。
肖恩通過列舉現(xiàn)實世界的例子,回避不必要的術語,使現(xiàn)代機器學習的概念變得通俗易懂。這本書假設讀者在機器學習或計算機科學領域的知識相對較少,因此對更廣泛的受眾而言非常友好。鑒于當前圍繞機器學習和人工智能的對話頗為活躍,并且這些技術可能對我們的未來產(chǎn)生影響,任何想要參與這場對話的人都應該盡可能地學習。由于市場上缺乏對機器學習通俗易懂的專業(yè)介紹,這本書將成為引導你理解底層技術的理想方法,它可以幫助你更好地判斷哪些言論值得相信,哪些說得天花亂墜的謬論應該被拋棄。
微軟CTO(首席技術官)
凱文斯科特(Kevin Scott)
肖恩格里什(Sean Gerrish)
谷歌前工程專家,普林斯頓大學的機器學習博士,機器學習極客。
曾在高頻交易機構泰莎科技擔任工程師,并在谷歌擔任機器學習和數(shù)據(jù)科學團隊的工程專家。
推薦序 IX
前言 XIII
1 自動機的秘密
長笛演奏者 003
今天的自動機 005
鐘擺的擺動007
這本書中的自動機 008
2 自動駕駛汽車:挑戰(zhàn)不可能
沙漠中的百萬美元競賽 015
如何打造自動駕駛汽車 017
規(guī)劃路徑 021
路徑搜索 022
導航025
無人車挑戰(zhàn)賽的獲勝者 028
一場失敗的比賽 031
3 保持在車道內(nèi)行駛:自動駕駛汽車的感知
第二次無人車挑戰(zhàn)賽 035
自動駕駛汽車中的機器學習 037
斯坦利的架構 038
避開障礙物 040
尋找道路的邊緣 043
開眼看路 045
路徑規(guī)劃 047
斯坦利大腦的各個部分如何相互交流 049
4 在十字路口避讓:自動駕駛汽車的大腦
城市挑戰(zhàn)賽 055
感知抽象 057
比賽 059
老板的高層次推理層 061
攻克交通堵塞 068
三層架構 071
對自動駕駛汽車看到的物體進行分類 076
自動駕駛汽車是復雜的系統(tǒng) 077
自動駕駛汽車的軌跡 078
5 網(wǎng)飛和推薦引擎的挑戰(zhàn)
百萬美元大獎 083
競爭者 084
如何訓練分類器 085
比賽的目標 089
龐大的評分矩陣 091
矩陣分解 096
第一年結束 102
6 團隊融合:網(wǎng)飛獎的贏家
縮小競爭者之間的差距 107
第一年末 108
隨時間變化的預測 111
過度擬合 114
模型混合 115
第二年 119
最后一年 120
賽后 124
7 用獎勵教導計算機
DeepMind玩雅達利游戲 129
強化學習 132
教導智能體 134
為智能體編寫程序 36
智能體如何觀察環(huán)境 140
經(jīng)驗金塊 141
用強化學習玩雅達利游戲 148
8 如何用神經(jīng)網(wǎng)絡攻克雅達利游戲
神經(jīng)信息處理系統(tǒng) 153
近似,而非完美 153
用作數(shù)學函數(shù)的神經(jīng)網(wǎng)絡 155
雅達利游戲神經(jīng)網(wǎng)絡的結構 161
深入研究神經(jīng)網(wǎng)絡 170
9 人工神經(jīng)網(wǎng)絡的世界觀
人工智能的奧秘 175
國際象棋自動機土耳其人 177
神經(jīng)網(wǎng)絡中的誤導 179
識別圖像中的物體 180
過度擬合 183
ImageNet 185
卷積神經(jīng)網(wǎng)絡 188
為什么是深度網(wǎng)絡? 194
數(shù)據(jù)瓶頸 197
10 深入了解深度神經(jīng)網(wǎng)絡的內(nèi)部秘密
計算機生成圖片 203
壓縮函數(shù) 204
ReLU激活函數(shù) 207
機器人之夢 211
11 能聽、能說、能記憶的神經(jīng)網(wǎng)絡
對機器而言,理解意味著什么? 221
深度語音識別 222
循環(huán)神經(jīng)網(wǎng)絡 223
為圖像生成字幕 230
長短時記憶網(wǎng)絡 233
對抗數(shù)據(jù) 235
12 理解自然語言
宣傳噱頭還是人工智能研究的福音? 239
IBM的沃森 240
攻克《危險邊緣》所遇到的挑戰(zhàn) 241
浩如煙海的知識 242
《危險邊緣》挑戰(zhàn)賽的誕生 245
DeepQA 247
問題分析 249
沃森如何解讀句子 252
13 挖掘《危險邊緣》的最佳答案
地下室基準 261
生成候選答案 263
查找答案 266
輕量級過濾器 269
證據(jù)檢索 270
評分 274
匯總和排名 277
調(diào)整沃森 281
重新審視DeepQA 282
沃森有智能嗎? 283
14 用蠻力搜索找到好策略
通過搜索玩游戲 289
數(shù)獨 290
樹的大小 294
分支因子 297
游戲中的不確定性 297
克勞德香農(nóng)與信息論 302
評價函數(shù) 303
深藍 308
加入IBM 310
搜索與神經(jīng)網(wǎng)絡 311
西洋雙陸棋程序 313
搜索的局限 315
15 職業(yè)水平的圍棋
計算機圍棋 319
圍棋 321
通過抽樣走子來建立直覺 324
神之一手 330
蒙特卡洛樹搜索 333
單臂老虎機 337
AlphaGo是否需要如此復雜 339
AlphaGo的局限 341
16 實時人工智能與《星際爭霸》
構建更好的游戲機器人 345
《星際爭霸》與人工智能 346
簡化游戲 348
實用《星際爭霸》機器人 351
OpenAI與《DOTA 2》 354
《星際爭霸》機器人的未來 357
17 50年后或更遙遠的未來
人工智能起起伏伏的發(fā)展過程 363
如何復制這本書中的成功 364
數(shù)據(jù)的普遍使用 368
下一步去向何方 369
致謝 373
注釋 375