圖靈獎得主、深度學習三巨頭之一、卷積神經(jīng)網(wǎng)絡之父……由于在人工智能領(lǐng)域的突出貢獻,楊立昆被中國計算機科學界和企業(yè)界所熟知。
楊立昆的科學之路,譜寫了一段關(guān)于勇氣的宣言。他為了知識本身求學,而不是文憑,他用自己的經(jīng)歷,證明了通過激烈的考試競爭進入名校不是科學成功的窄門。他廣泛閱讀,為他科學思維的形成奠定了堅實的理論基礎(chǔ)。他特立獨行,做自己感興趣的事情,即便那件事在短時間里不被人看好。在人工神經(jīng)網(wǎng)絡研究的低谷期,他寂寞地堅持,終于取得了舉世矚目的成就。
人工智能正在顛覆人類社會,未來機器能思考嗎?楊立昆的這部著作,講述正是人工智能在我們面前崛起這個歷史上的時刻發(fā)生的故事。
推薦序
從科學思考到科學思維
吳軍
計算機科學家,《智能時代》作者
我非常榮幸能有機會為圖靈獎獲得者楊立昆博士的新書《科學之路:人、機器與未來》撰寫序言。
楊立昆博士因為在深度學習方面的杰出貢獻獲得了2018年度的圖靈獎,他的大名在中國的計算機科學界和企業(yè)界幾乎是家喻戶曉。他的這本結(jié)合了自傳和科普的新書非常值得一讀,無論是學術(shù)界,工業(yè)界的人士,還是普通讀者,讀了之后都會獲益良多。
在《科學之路》一書的自傳部分,楊立昆博士介紹了自己求學和科研的經(jīng)歷。他的求學經(jīng)歷和對教育的理解在當下對中國家長非常具有啟發(fā)意義。楊立昆是法國人。在法國,如果要想成為任何一個領(lǐng)域的精英,通常要進入招生人數(shù)非常少的高等?茖W院(grandes écoles,也被稱為大學校),比如做科學家和工程師就需要進入巴黎高師或者巴黎綜合理工這樣的精英學校學習。而為了考入這些錄取率極低的學校,又要花兩年左右的時間先學習大學預修課程備考。我想如果一個中國家長在法國,會讓孩子去走這條路。但是楊立昆卻走了一條與眾不同的求學道路,他高中畢業(yè)后就直接進入了一所名氣不算太大的大學巴黎電子工程學院(ESIEE)學習。楊立昆做出這樣的決定有兩個原因。其一,這所大學不需要參加預科課程的學習和考試就能直接申請;其二,在這所學校他可以獲得更多的學習自主權(quán)。楊立昆講,他用自己的經(jīng)歷證明了通過激烈的考試競爭進入名校,不是科學成功的窄門。
楊立昆在人工智能領(lǐng)域的研究生涯,可以追述到他在大學時廣泛地閱讀課程之外的經(jīng)典科學著作。在他讀書的年代,人工智能是一個熱門但是發(fā)展并不成熟的研究領(lǐng)域。楊立昆對此有非常大的興趣,并且閱讀了包括喬姆斯基等人在內(nèi)的很多科學家的論著,特別是前蘇聯(lián)偉大的數(shù)學家、公理化概率論的奠基人柯爾莫哥洛夫等人的著作,這為楊立昆打下了堅實的數(shù)學基礎(chǔ)和計算機科學理論基礎(chǔ)。從大學開始,楊立昆就沉溺于人工神經(jīng)網(wǎng)絡的研究,并且敏銳地注意到這個研究領(lǐng)域一個新的技術(shù)方向神經(jīng)網(wǎng)絡的反向訓練。后來他進入到當時的巴黎皮埃爾-瑪麗-居里大學(今天的索邦大學)攻讀博士學位,并且反向訓練上取得了卓越的成績。他的成果很快就有了法國一家公司買單,而且讓他得以進入當時學術(shù)氛圍非常自由的貝爾實驗室工作。楊立昆用自己的經(jīng)歷告訴我們,接受教育重要的是獲得知識本身,而不是獲得名校的光環(huán)。在以后的學術(shù)生涯中,楊立昆一直保持這種特立獨行的做法,特別是在全世界都不看好人工神經(jīng)網(wǎng)絡這個研究領(lǐng)域的時候,投身到這項研究當中。
楊立昆進入貝爾實驗室時,正趕上那個曾經(jīng)的世界科學殿堂后的輝煌時期,但是很快這個龐大的實驗室就解體了。所幸的是,楊立昆得以在紐約大學擔任了教職。不過,當時正趕上人工神經(jīng)網(wǎng)絡研究的低谷,雖然楊立昆堅信這項技術(shù)會在圖像識別大放光彩,并且設計出一個簡單的人臉識別系統(tǒng),但是他的成果并沒有引起太多科學家的重視。在從2003到2013大約十年的時間里,楊立昆和他曾經(jīng)的領(lǐng)路人辛頓等人一直在默默地從事著各種人工神經(jīng)網(wǎng)絡算法特別是卷積網(wǎng)絡算法的研究。他們的成果當時并不引人矚目,但是正是這些研究成果,奠定了今天深度學習算法的基礎(chǔ)。2013年之后,隨著并行計算的進步和數(shù)據(jù)量的增加,以人工神經(jīng)網(wǎng)絡為基礎(chǔ)的深度學習突然在很多應用領(lǐng)域顯示出巨大前景并且在一個又一個應用中,比如人臉識別,語音識別,機器翻譯,計算機博弈,取得驕人的成績,楊立昆等人的工作一下子被全世界所矚目,并且讓他和辛頓,本杰歐一到獲得了計算機科學領(lǐng)域的獎圖靈獎。
如果要總結(jié)楊立昆的成功經(jīng)驗,可以用這樣四句話來概括:
1. 求學是為了知識本身,而不是文憑;
2. 廣泛地閱讀高水平的專業(yè)著作,培養(yǎng)科學的品味;
3. 特立獨行,做自己感興趣的事情,即便那件事在短時間里不被人看好;
4. 長期的堅持。
《科學之路》一書的第二部分講述了基于深度學習的人工智能的原理。雖然楊立昆博士使用了一些公式,但這部分內(nèi)容依然通俗易懂。
楊立昆博士用幾個例子講述了今天人工智能的本質(zhì),就是數(shù)學公式 計算能力 大量的數(shù)據(jù)。
首先,我們要將模式識別等問題轉(zhuǎn)化成數(shù)學公式。今天計算機的智能從實現(xiàn)的方式上講完全不等同于人的智能。但是,從結(jié)果上講,和人的智能等價。你可以認為這是兩種道路殊途同歸。楊立昆博士用了一些典型的模式識別的例子告訴我們?nèi)斯ぶ悄苁侨绾螌崿F(xiàn)的,讀著朋友即便對里面的公式細節(jié)不感興趣,也能體會到人工智能和人的智能之間的不同。不過,計算機在獲得智能的方法上,有一點和人是相同的,那就是從觀察到的現(xiàn)象中總結(jié)出規(guī)律,然后用規(guī)律再來預測現(xiàn)象。楊立昆在書中舉了伽利略研究速度的例子,他通過觀察找到了物體運動的規(guī)律并且將它變成了數(shù)學公式,然后再把這個公式應用于計算各種運動物體的速度。機器學習也是如此,只不過機器學習的公式不那么直觀。
接下來,就需要獲取數(shù)據(jù),供計算機進行學習。在任何人工智能的應用領(lǐng)域,原始的數(shù)據(jù),比如圖像本身是無法直接提供給學習,這中間要進行一個轉(zhuǎn)化。這個轉(zhuǎn)化的過程被稱為特征提取,簡單地講,就是講真實世界的目標對象轉(zhuǎn)化中計算機能夠讀懂的數(shù)據(jù)。楊立昆博士用模式識別的例子說明了特征提取是如何進行的。當然,如果讀者朋友不想關(guān)心具體的步驟,至少需要明白一點,那就是計算機學習需要大量的數(shù)據(jù)。
當數(shù)據(jù)量大了之后,就需要數(shù)學模型足夠復雜才能反映出大量數(shù)據(jù)之中所包含的各個細節(jié)。雖然奧卡姆剃刀原理通常很有效,但是在機器學習領(lǐng)域并非如此。事實上,過去基于人工神經(jīng)網(wǎng)絡的機器智能水平之所以不高,就是因為那個網(wǎng)絡過于簡單。因此,楊立昆等人提出了更為龐大而復雜的深度學習人工神經(jīng)網(wǎng)絡。于是這就有遇到了第三個問題,計算能力的問題。楊立昆博士對這部分內(nèi)容沒有做太多的論述,畢竟這部分工作主要是由Google,F(xiàn)acebook和亞馬遜等公司工程師完成的,而非是科學家關(guān)注的重點。
《科學之路》一書的第三部分講述今天人工智能的各種應用,從語音和圖像識別、自然語言對話系統(tǒng),到無人駕駛汽車和醫(yī)學影像識別。這些名詞大家都不陌生,但是如果想了解其中的細節(jié),楊立昆博士的講述既權(quán)威,又直白。
《科學之路》一書的第四部分,也是后一個部分講述今天人工智能的局限性,這包括技術(shù)上的不足之處,以及人工智能所帶來的社會風險。這部分內(nèi)容是各種介紹人工智能的書籍常常忽略的。楊立昆博士提醒我們所有技術(shù)革命都有其陰暗面,但是他堅信這些問題都能夠得到解決。他在書的后還談了一些有趣的話題,比如機器人是否該擁有權(quán)利,又該遵守什么樣的法律。
總的來講,這是一本全面介紹人工智能技術(shù),兼顧科普和專業(yè)論著特點的宏篇大作。其中有價值的部分是楊立昆博士作為深度學習算法的發(fā)明人之一,講述他如何思考機器智能的問題,如何將這種現(xiàn)實世界里的具體問題,轉(zhuǎn)化為計算機能夠處理的問題。從這個角度上講,它又是一本教科書,教大家如何思考科學問題。我相信通過閱讀這本書,各個層次,不同背景的讀者朋友都會有巨大的收獲!
楊立昆是法國人,名字原文為Yann Le Cun,姓氏為Le Cun,因在美國常被誤縮寫為Y.L.Cun,于是把LeCun合寫在一起。中文譯名原為揚勒丘恩,華人AI圈一直親切地稱他為楊樂康,他本人聽聞后,干脆自己給自己取了中文名字楊立昆。
他被譽為 卷積神經(jīng)網(wǎng)絡之父,2019年3月,因在人工智能深度學習方面的貢獻獲得2018年度圖靈獎。此外,他還獲得了2014年IEEE神經(jīng)網(wǎng)絡先鋒獎(Neural Network Pioneer Award)、2015 年 IEEE PAMI 杰出研究獎和2016 年 Lovie 終身成就獎。
他為卷積神經(jīng)網(wǎng)絡(CNN,Convolutional Neural Networks)和圖像識別領(lǐng)域做出了重要貢獻,以手寫字體識別、圖像壓縮和人工智能硬件等主題發(fā)表過190多份論文,研發(fā)了很多關(guān)于深度學習的項目,并且擁有14項相關(guān)的美國專利。研究領(lǐng)域包括人工智能、機器學習、機器感知、移動機器人學和計算神經(jīng)學。