關于我們
書單推薦
新書推薦
|
數據智能科學技術導論
本書沿著時間的軌跡,講述了物理世界中宇宙和地球的誕生與演變,探討了生物世界中生命和人類的誕生與進化,討論了數字世界中科學技術的產生與進步。數據與物質和能量并駕齊驅,構成了人類宇宙的三個基本要素,并以此為基礎建立了物理、生物和數字三個各有千秋卻密切相連的世界。“三個世界”的概念和框架構成了本書討論數據智能的基礎,為認識、理解數據和智能的起源與發(fā)展提供了一個宏觀的問題視角和理論平臺。介紹和討論數據、信息和知識的概念定義、運作法則與實際應用,全面系統地描述和討論了從原始數據到主觀信息,最終到抽象知識的提煉與升華過程。對執(zhí)行和實現此過程的自然和人工智能系統的模型、算法和功能等的基本原理和**進展進行系統的介紹和研討。
本書可作為高校電子信息類、計算機類、自動化類等相關專業(yè)大一新生的入門級通識課程教材,也可供從事信息科學、技術和應用的工程技術人員參考。
(1)三個世界理論框架:跨越時間與空間維度描述、分析和探索數據智能科學與技術的發(fā)展和演變,將信息科學與數學、物理、生命以及哲學交叉融合,形成新的視角,產生新的洞見。
(2)數據的基本法則:總結并提出數據的三個基本法則,揭示作為反映世界事物符號的數據產生、運動和驅動的基本特征和規(guī)律,建立數據與人類的相互聯系和作用規(guī)律。 (3)信息的紐帶作用:指出信息作為聯系“未知”與“有知”數據的紐帶,主要作用是消除數據的形式、含義和效用的不確定性,深入淺出地介紹現代信息論的基本編碼原理及其在數據壓縮、糾錯和加密方面的應用。 (4)知識的神奇作用效用:討論知識的基本概念與特征,獲取知識的途徑與方式,運營知識的動機與作用,指出數據智能時代人類獲取、掌握和運用知識的挑戰(zhàn)。 (5)智能的奧秘與威力:分析自然和人工智能的概念與定義,比較自然智能的理論模型,綜述人工智能科學的**發(fā)展,探索混合智能發(fā)展的趨勢和問題。 前言
本書起源于作者自2014年起在山東大學信息科學與工程學院為本科一年級學生開設的入門級通識課程。初衷是希望通過一門必修課,使新入學的學生對信息科學、技術與應用有一個較為全面和系統的了解,以避免和糾正“只見樹木,不見森林”的局限與偏見。同時,通過課堂內外師生之間有組織的分組分享與交流,開拓知識視野,激發(fā)學習興趣,鼓勵獨立思考。
作為通識課,首先要強調的是“基礎性”,即重點講述數據與智能的基本概念和原理; 其次是“啟發(fā)性”,提倡學生圍繞所講述和討論的問題進行主動學習與獨立思考。當代大學生都屬于數字網絡時代的“原住民”,在充分消費享受數字資源和智能技術帶來的便利和快樂的同時,能否培養(yǎng)自己主動學習和獨立思考的能力與習慣,將決定未來事業(yè)和人生的發(fā)展和前途。對于這些經過長期應試教育培訓和激烈考試競爭脫穎而出的年輕人來說,通過一種全新的跨時空、多學科跨界融合的視角 ,講述和討論關于數據智能的科學、技術與應用,可以更好地幫助他們應對大學學習以及未來的職業(yè)選擇和人生規(guī)劃 。
我們也在思考和探索關于大學教育的一些基本問題。在人類知識不斷數字網絡化和人工智能迅速專業(yè)化、普及化的大趨勢下,大學本科生的教學內容和培養(yǎng)方式面臨“百年未有之大變局”,特別是大學工程教育和創(chuàng)新實踐方面的問題和危機更為突出和嚴峻。人類所創(chuàng)造和掌握的知識被數字化和網絡化后大規(guī)模向機器遷移,而具有專業(yè)知識和學習能力的機器則開始具有更專業(yè) 甚至更高級的智能,能夠在許多專業(yè)細分領域代替甚至超過人類的水平。數據智能科學與技術將從根本上改變人類與機器在知識與智能方面的分工與協作,同時也將給工業(yè)革命以來所建立的傳統大學教育內容和培養(yǎng)方式帶來新的問題與挑戰(zhàn)。大學的專業(yè)劃分越來越細致,課程內容越來越繁多,但學生對自己所學知識的理解與掌握卻越來越膚淺,對數字網絡媒體的依賴和困惑越來越嚴重,對未來人生的選擇和價值取向越來越迷茫。從這個意義上講,本課程和本書是作者思考和推動大學本科教育的一項創(chuàng)新性探索。我們認為應該在學生選擇專業(yè)領域和職業(yè)方向之前,為他們提供更寬泛、更基礎和更系統的通識入門教育,在此基礎上和過程中使得他們能夠以更高、更廣的視角認識和理解相關學科的豐富內涵、基本概念、基礎原理以及由此發(fā)展出來的技術和應用。毋庸置疑,信息科學特別是數據智能科學正在與物理、化學、生命、社會等學科深度交叉融合并在許多專業(yè)領域內產生了許多革命性技術和創(chuàng)新性應用。因此,新一代從事信息科學、技術和應用的專業(yè)人士和相關人員必須具備足夠的知識基礎和科學意識以迎接和擁抱正在發(fā)生的變革。
本書所涉及的大數據和人工智能等是目前科技界和社會上極流行和高熱度的話題。但對這些科學概念和技術原理的認識和傳播卻往往過于片面、簡化,以致造成誤解甚至錯誤。關于數據與智能的書籍大體可以分為兩類: 一類是面向大眾的通俗讀物,內容往往比較寬泛淺顯,更傾向于描述事物是什么和能做什么,而對事物深層和背后的科學概念和技術原理缺乏嚴格、系統的描述和討論。這種快餐式和碎片化的學習和知識很難幫助讀者建立一個較為全面、系統的知識體系,更不可能激發(fā)有價值的獨立思考與創(chuàng)新,其娛樂和商業(yè)成分往往高于科學技術成分。另一類是專業(yè)的教科書和參考書,主要針對從事數據科學和人工智能技術的專業(yè)人士,內容涉及某些專業(yè)技術領域的程序性專業(yè)知識,但往往缺乏內容廣度和學科交叉融合的宏觀視角。對于數據、信息、知識、智慧、智能以及相關的基本概念和基礎理論,在大眾常識和專業(yè)討論中經常出現混淆、誤解和錯誤等現象。而這些概念和模型不僅是專業(yè)人士從事更高級科技創(chuàng)新工作的理論基礎,也是非專業(yè)人士認識和理解相關科學、技術與應用的必要條件。從一個更加宏觀和長遠的視角,對通識的理解掌握和融會貫通正是人類區(qū)別于機器的獨特優(yōu)勢。當未來人類社會中眾多的科學技術專家的職能和工作被具有智能與知識的專門算法和機器所替代和承擔之后,人類的想象力和創(chuàng)造力將更加依賴和取決于對世界上實際問題的獨特視角和科學技術的融合知識。與今天“專家”所建立和統治的世界不同,未來的世界也許將由那些具有創(chuàng)新能力和融合知識的個人和組織來推動和發(fā)展;谶@種認識和動機,我們希望通過一本通識但不失專業(yè)性的入門級教科書,對數據智能科學、技術和應用的基礎概念和基本原理、歷史背景和目前現狀,以及存在的問題和未來預測等做一個比較全面、系統與科學的描述和解釋。數據智能科學、技術與應用所涉及的知識范圍廣、內容更新快,開設這樣一門課程,特別是撰寫這樣一本教科書無疑是一項極具挑戰(zhàn)性的任務和工作。為此,我們盡量選取最基本的概念、假設、模型、推論和證據等,同時指出和討論它們的局限性和近似性,鼓勵和激發(fā)學生與讀者批判性獨立思考和大膽創(chuàng)新是本課程和本書最核心的目標。耶魯大學前校長理查德·萊文(Richard Levin,1947— )曾經講過: “真正的教育不傳授任何知識和技能,卻能令人勝任任何學科和職業(yè),這才是真正的教育!边@無疑是一種極高的境界,現實中可能很難達到。但他還說: “本科教育的核心是通識,是培養(yǎng)學生批判性獨立思考的能力,并為終身學習打下基礎!痹谏綎|大學的課堂上,我們希望能夠實現這個教育的核心目標并正在為此做出努力。通過本書,我們希望能夠在更大的范圍內取得同樣的效果。是否能夠達到這個目的,只能由學生和讀者來做最終的評判。
本書副標題 “追尋數據的足跡,探索智能的奧秘”概括了本書所遵循的基本思路與邏輯。數據、物質和能量并駕齊驅,構成了人類宇宙的三種基本要素, 并以此為基礎建立了物理、生物和數字三個各有千秋、密切相連的世界。首先,我們沿著時間的軌跡,講述了物理世界中宇宙和地球的起源與演變,探討了生物世界中生命和人類的誕生與進化,討論了數字世界中科學技術的產生與進步。同時,為了講述的系統性和內容的完整性,我們簡單明了地說明和解釋了與物質、能量和數據相關的一些基本概念、理論模型與主要結論等!叭齻世界”的概念和框架構成了本書討論數據智能的基礎,為認識和理解數據與智能的起源和發(fā)展提供了一個宏觀的問題視角和基本的理論框架。接下來我們通過三個獨立的篇章分別介紹與討論數據、信息和知識的概念定義、運作法則和實際應用,全面、系統地描述和討論從原始數據到主觀信息, 最終到抽象知識的提煉與升華過程。需要特別提及的是,數據(data)、信息(information)、知識(knowledge)和智慧(wisdom)這些人們習以為常的概念在學術界和社會上并沒有一個被普遍接受的定義與解釋。關于這些概念的討論不僅會得出不同甚至相互矛盾的結論,也會引起一些不必要的混淆、誤解和爭論。為此,我們對文獻中關于這些基本概念和模型的各種觀點和理論做了盡可能全面、系統的梳理、分析和總結,最終選擇和提出了一套我們認為相對合理和自洽的體系。
在“數據法則”一篇中,我們給出了數據的嚴格定義、表現形式和度量方法,并且提出和討論了數據所遵循的三個基本法則及推論,描述了數據所具有的客觀性、物理性和生物性!翱陀^性”是指可以觀測的客觀世界可以被數據化,同時指出數據化的過程需要某種自然或人造的數據系統才能完成!拔锢硇浴笔侵笖祿拇嬖诤瓦\動離不開物理世界的物質與能量并受到其物理規(guī)律的限制,同時也說明人類所發(fā)現和發(fā)明的科學技術不斷減少處理和運用數據比特所需要的物質和消耗的能量!吧镄浴笔侵笖祿侨祟愊嗷ソ涣鞯拿浇楹驼J識世界的工具。通過對世界數據化,人類建立了一個虛擬化的數字世界,它既是客觀物理和生物世界的反映,更是人類主觀世界的擴展和升華。在“信息紐帶”一篇中,我們首先討論數據中結構形式、內容含義和預期效用的不確定性,進而引入用來消除這些不確定性的信息。我們將信息定義為基于某種形式、含義和效用,通過編碼所得到的數據。信息源于數據,但不等于數據。在引入概率的基本概念之后,系統地介紹和解釋了香農基于數據中符號分布的隨機性進行編碼的基本理論,講述了對數據進行壓縮、糾錯和加密的基本原理和典型例子。接下來 ,通過一些生動和有啟發(fā)性的事例對信息的含義和效用問題做了闡述,并指出了香農信息論的局限性和擴展信息論模型考慮含義與效用的核心問題和可能思路。在“知識升華”一篇中,我們首先指出信息是連接數據與知識的紐帶: 消除數據中的不確定性而產生信息必須以先驗知識為重要依據,信息是知識的前提; 而知識本身又需要通過信息不斷充實和豐富,知識是信息的歸宿。從信息到知識的過程是一個不斷消除不確定性的迭代過程。其次,引入了知識的定義,指出了知識本身具有客觀與主觀的雙重特性,并進一步提出和討論了知識的分類。我們總結和引入的關于知識的三個基本法則,分別對應知識的來源、過程和作用。最后,指出并討論了科學技術進步引發(fā)知識爆炸和數字網絡化,導致知識遷移,為人類帶來的挑戰(zhàn)性問題和可能影響,并且鼓勵 、啟發(fā)學生和讀者思考、探索應對和解決的方法與途徑。
從數據到信息、知識最終到智慧的過程,從形式上講是一個從具體到抽象的數據壓縮過程,而實質上卻是一個從客觀到主觀的數據加工處理過程。能夠駕馭這個過程的系統則是目前宇宙中“唯一”存在的人類智能系統,也包括人類所創(chuàng)造的人工智能系統。智能是目前科技等各個行業(yè)中曝光率很高的一個術語,卻又是被誤讀、曲解、濫用甚至錯用最多的 概念之一。從本質上講,知識和智慧均是數據,而智能卻是數據系統的功能,兩者不能混為一談。關于智能,我們將 通過 兩篇的內容介紹和討論自然智能和人工智能的課題。所謂“自然智能”,主要是指人類的智力,它屬于心智能力的一部分,主要是指通過數據獲取知識、通過知識做出決定和基于決定改變行為的能力。智能可以通過生理、心理和行為等測試來衡量。智能的最終目的是能夠在所處環(huán)境和條件下實現有價值和意義的目標。而“人工智能”則是一種數學模型、計算程序和執(zhí)行系統,包括軟件和硬件,能夠勝任和完成由人類或自然智能所具有的職能和任務。關于自然智能,我們介紹并討論了基于心理測試、認知過程、生物機理以及認知與環(huán)境相互作用所建立的理論模型。雖然這些模型在一定程度上解釋了自然智能的許多現象,但并沒有真正回答和解決人類智能與大腦神經網絡的關系等最根本的問題。在“人工智能”一篇中,我們重點介紹和討論了機器學習和推理的模型、算法和應用。 人工智能模型雖然的確受到自然智能現象的啟發(fā)和影響,但本質上講卻屬于一種基于數學算法和算力資源的數據系統。人工智能是目前科技和工業(yè)界最活躍和動態(tài)的前沿領域。除了盡可能跟蹤和介紹前沿科技和最新應用外,我們特別提出了人工智能作為人類的工具會帶來哪些價值、會有哪些風險等問題。信息與生物科學的融合所帶來的人工與自然智能的融合若真正發(fā)生,將會從根本上改變人工智能作為被動工具的原始屬性。經過人工智能加強、升級和擴展的未來人類最終會進化成為什么樣的物種?這是一個看起來符合邏輯而又極其敏感的問題。對此,我們不應該回避,而是應該認真嚴肅地提出、思考與討論。
本書涉及數學、物理、生物和信息等不同學科,知識跨度大、強度高,同時不同學科之間的交叉融合度高,為學習、認識和研究數據智能科學、技術和應用提供了一個全新的視角。書中所涉及的知識點數量多,需要學生和讀者潛心研讀、用心思考。對于大學一年級的學生,這是一門具有相當寬度和一定深度的通識課,但具有中學數理化生基礎的讀者應該能夠理解和接受。我們近年來的教學實踐在很大程度上可以證明這個判斷。對于希望了解和學習數據智能科學、技術和應用的讀者,這也許是一本相對 嚴肅的教科書,知識性較強,娛樂性較差。如果將學習和掌握知識的過程比喻為通過飲食獲取營養(yǎng)的過程,內容的娛樂性和通俗性就像食品的色彩和味道,色香味俱全的食品可以激發(fā)食欲,但不一定具有足夠的營養(yǎng); 通俗有趣的內容可以吸引眼球,但不一定具有所需要的知識。作為本書的作者和讀者,我們將一起追尋數據的足跡,領略廣闊宇宙物理世界的起源與演變,目睹地球奇妙生物世界的誕生與進化,感受人類創(chuàng)造的數字世界的輝煌和偉大。生物世界孕育了人類的自然智能,而智能的人類又創(chuàng)造了機器智能。探索智能的奧秘,我們充滿好奇,不斷提問、思索、解答和迭代。大自然在物質與能量之上進化出了神奇強大的人類自然智能,人類的自然智能創(chuàng)造出美麗驚艷的數字虛擬世界。這是一個前所未有的世界,充滿了機遇與挑戰(zhàn)。正如狄更斯 在《雙城記》中所說: “這是最好的時代,也是最壞的時代; 這是智慧的年代,也是愚蠢的年代; 這是信仰的時期,也是懷疑的時期; 這是光明的季節(jié),也是黑暗的季節(jié); 這是希望的春天,也是失望的冬天; 我們面前應有盡有,我們面前一無所有; 我們正在直登天堂,我們正在直落地獄!泵鎸@個充滿變化和未知的世界,人類所擁有的不只是智能,更有駕馭這些智能的主觀意識與自由意志。智能的終結問題不在于智能本身,科技的終結問題也不在科技本身,而在于擁有智能和掌握科技的人類主觀意識和自由意志所做出的選擇與堅持。人類只有做出和堅持正確的選擇,才有可能避免“聰明反被聰明誤”的悲劇。
最后,本書的出版不僅是山東大學信息科學與工程學院的同事和作者在高等學校新工科教育改革與創(chuàng)新探索過程中的一項標志性成果,也是作者學術和教育生涯中的第一部著作。我少年求學時期因當時信息知識貧乏,加之社會動蕩,未能得到足夠的書本知識和文化熏陶。1977年,我有幸考入山東大學電子系,開啟了對科學知識追求、探索和創(chuàng)新之旅。從1982—1989年在中國科學技術大學和美國麻省理工學院的研究生學習,到1989—2013年在加拿大滑鐵盧大學和麥克馬斯特大學執(zhí)教的幾十年里,我所關注和聚焦的領域均屬于應用物理與工程學科的光電子學,知識與技能的積累也集中在其相關領域。在山東大學任教的八年中,我開始對數據、信息、知識和智能等科學、技術和應用產生好奇與興趣,并在開設和建設信息學院本科生入門通識課的過程中 進行學習、思考與探索,不僅使我對信息科學技術的前沿發(fā)展有了新的了解和認識,也在一定程度上彌補了我 過去知識圖譜中的空白與不足。與大多數20世紀50年代末期出生的同齡人相似,我們生長在一個以“貧乏”與“饑餓”為標志的年代,當時的社會不僅存在物質與能量貧乏而導致的饑寒,更有信息和知識的缺乏帶來的無知和愚昧。作為時代變遷中的“幸存者”和“幸運兒”,我沒有經歷過饑餓的痛苦,但親身感受到了無知的困惑,目睹了知識和科技對人生帶來的巨大影響。在那個“讀書無用”,甚至“知識越多越反動”的年代,我感謝父母賦予我生命中好奇的基因,更加感恩在我困惑迷茫時幫我指點迷津、撥云散霧的家人、朋友和同學。也許正如經受過物質饑餓的人對食物會具有一種本能的珍惜與分享一樣,受過精神饑餓的人則對知識具有一種本能的好奇與分享的沖動與渴望。斯里蘭卡傳教士奈爾斯(D.T.Niles,1908—1970)曾經說過: 我們就像乞丐一樣,試圖告訴其他乞丐我們在哪里找到了面包。他所指的是傳遞上帝的福音,而我所講的是傳播科學的知識。對于作者來講,創(chuàng)作與教學的過程中最大的挑戰(zhàn)、最大的樂趣是對新知識的學習與理解以及對新問題的思考與探索。特別是在生物學基礎、信息學理論以及人工智能科學技術等領域,作者原有的知識基礎膚淺,對前沿成果的了解有限。借助開設課程和編寫本書的機會,我不得不閱讀相關基礎和專業(yè)書籍以及大量的原始論文。 本書的編寫得到了很多領域專家學者的指導與幫助。特別是周洪超教授在信息和人工智能理論方面,澄清和解答了我的許多疑問和不解。周斌教授在人工智能前沿研究和最新成果等方面提供了許多極具價值的材料,激發(fā)和鼓勵我不斷學習的熱情和動力。在本書寫作和成書過程中,我得到了許多同事和朋友的指點、鼓勵和幫助。海信集團的原副總裁、我的發(fā)小王志浩先生對我最初幾章的手稿做了詳細的審閱,提出了許多珍貴的意見和建議。山東大學信息學院的張東升書記、劉琚教授、孫寶清教授、吳強教授不僅幫助糾正了書中的一些錯誤,也對本書提出了建設性的修改意見。在本書內容準備、講授和研討的過程中,山東大學信息學院的信息科學技術通識課的助教老師和本科生,不僅提出了許多極具啟發(fā)的洞見和評論,也為我堅持最終完成此書提供了持續(xù)的激勵與鞭策。最后,感謝山東大學張涵女士在本書編輯過程中給予的幫助和支持,經過她繪制和美化的插圖為本書增色添彩。清華大學出版社的文怡編輯在本書出版的整個過程中給予了專業(yè)指導和精心審閱,最終促成了本書的最終落地出版。在此一并表示感謝! 作者 2021年12月
黃衛(wèi)平,博士,特聘教授、國家特聘專家,山東大學信息科學與工程學院院長。1982年畢業(yè)于山東大學,1984年和1989年獲中國科技大學碩士和美國麻省理工學院博士學位。1989—2013年在加拿大滑鐵盧大學和麥克馬斯特大學任教,從事光電子及光通信方面的研究與創(chuàng)新。1995年創(chuàng)辦Apollo Photonics公司,成功開發(fā)推廣全球領先的光電子芯片設計軟件,1999年被美國Nanovation公司收購。2003年創(chuàng)辦海信寬帶多媒體技術公司,發(fā)展成為通信光模塊領軍企業(yè),2020年全球銷售額排名第三。2013年回國出任海信集團首席科學家和山東大學信息科學與工程學院院長,積極推動企業(yè)技術創(chuàng)新和高校教育改革,取得了一些標志性成果。在集成光電子學理論和設計算法方面做出了一系列開創(chuàng)性學術成果,在國際學術刊物和專業(yè)會議上發(fā)表300多篇論文,2020 年斯坦福大學發(fā)布全球前2%科學家,獲得多項國家高層次人才稱號和榮譽。
目錄 第1篇三個世界
1.1物理世界
1.1.1物質的概念
1.1.2能量的概念
1.1.3波粒二象性
1.1.4物質與能量的關系
1.1.5宇宙的起源
1.1.6地球的形成
1.1.7宇宙的熵增
1.2生物世界
1.2.1生命的概念
1.2.2生物圈
1.2.3細胞
1.2.4蛋白質
1.2.5DNA
1.2.6生命的起源
1.2.7人類的進化
1.2.8生命體的復雜性和有序性
1.3數字世界
1.3.1數據的起源
1.3.2DNA和基因中的數據
1.3.3大腦中的數據
1.3.4感官數據
1.3.5語言數據
1.4三個世界
本篇小結
討論問題
研究課題
第2篇數據法則
2.1數據的概念
2.2數據科學第一法則
2.3數據科學第二法則
2.4數據科學第三法則
本篇小結
討論課題
研究課題
第3篇信息紐帶
3.1信息的定義
3.2概率基礎知識
3.3信息的法則
3.4信息的形式
3.4.1壓縮編碼
3.4.2糾錯編碼
3.4.3加密編碼
3.5信息的含義
3.6信息的效用
本篇小結
討論課題
研究課題
第4篇知識升華
4.1知識的定義
4.2知識的分類
4.2.1描述性與程序性知識
4.2.2顯性與隱性知識
4.2.3公共與私密知識
4.3...
你還可能感興趣
我要評論
|