大數(shù)據(jù):統(tǒng)計理論、方法與應(yīng)用
定 價:98 元
- 作者:朱建平,富,謝邦昌,馬雙鴿,張德富,方匡南,潘璠
- 出版時間:2019/9/1
- ISBN:9787301307106
- 出 版 社:北京大學(xué)出版社
- 中圖法分類:TP274
- 頁碼:408
- 紙張:
- 版次:1
- 開本:16開
從統(tǒng)計學(xué)科與計算機(jī)科學(xué)的性質(zhì)認(rèn)知,大數(shù)據(jù)是指那些超過傳統(tǒng)數(shù)據(jù)系統(tǒng)處理能力、超出經(jīng)典統(tǒng)計思想研究范圍、不借用網(wǎng)絡(luò)無法用主流軟件工具及技術(shù)進(jìn)行單機(jī)分析的復(fù)雜數(shù)據(jù)的集合,對于這一數(shù)據(jù)集合,在一定的條件下和合理的時間內(nèi),我們可以通過現(xiàn)代計算機(jī)技術(shù)和創(chuàng)新的統(tǒng)計方法,有目的地進(jìn)行設(shè)計、獲取、管理、分析,揭示隱藏在其中的有價值的模式和知識。
本書共分五章,其內(nèi)容包括大數(shù)據(jù)下的統(tǒng)計理論體系、大數(shù)據(jù)下的數(shù)據(jù)集整合分析、大數(shù)據(jù)下的高維變量選擇方法、大數(shù)據(jù)下的統(tǒng)計方法并行計算和大數(shù)據(jù)下的統(tǒng)計方法應(yīng)用——網(wǎng)絡(luò)輿情分析。
本書內(nèi)容新穎,取材國內(nèi)外資料,同時認(rèn)真總結(jié)了作者近年來的科研成果,重點(diǎn)反映統(tǒng)計學(xué)對大數(shù)據(jù)發(fā)展的影響,突出五大特點(diǎn):
(1)充分體現(xiàn)學(xué)科融合;
(2)拓展統(tǒng)計研究對象;
(3)豐富統(tǒng)計計算規(guī)范;
(4)改進(jìn)統(tǒng)計研究方式;
(5)擴(kuò)展統(tǒng)計應(yīng)用范圍。
本書對從事大數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能和數(shù)據(jù)分析的科技人員具有重要的參考價值,可以用作統(tǒng)計學(xué)、計算機(jī)技術(shù)、人工智能和大數(shù)據(jù)管理等專業(yè)或研究方向博士生、碩士生的教材。
朱建平,南開大學(xué)理學(xué)博士,F(xiàn)為廈門大學(xué)管理學(xué)院教授、博士生導(dǎo)師,廈門大學(xué)健康醫(yī)療大數(shù)據(jù)國家研究院副院長,廈門大學(xué)數(shù)據(jù)挖掘研究中心主任。主要研究方向?yàn)閿?shù)理統(tǒng)計、數(shù)據(jù)挖掘、健康醫(yī)療大數(shù)據(jù)、數(shù)據(jù)科學(xué)與商業(yè)智能等。
謝邦昌,臺灣大學(xué)生物統(tǒng)計學(xué)博士,F(xiàn)為臺北醫(yī)學(xué)大學(xué)教授、博士生導(dǎo)師,臺北醫(yī)學(xué)大學(xué)管理學(xué)院院長、臺北醫(yī)學(xué)大學(xué)大資料研究中心主任。主要研究方向?yàn)閿?shù)理統(tǒng)計、生物統(tǒng)計、統(tǒng)計調(diào)查研究、大數(shù)據(jù)挖掘、醫(yī)學(xué)統(tǒng)計等。
馬雙鴿,美國威斯康星大學(xué)統(tǒng)計學(xué)博士、華盛頓大學(xué)生物統(tǒng)計博士后,F(xiàn)為美國耶魯大學(xué)生物統(tǒng)計系教授。美國統(tǒng)計學(xué)會會士、國際統(tǒng)計學(xué)會當(dāng)選會員。主要研究方向?yàn)楦呔S數(shù)據(jù)分析、生存分析、衛(wèi)生經(jīng)濟(jì)、癌癥等。
張德富,華中科技大學(xué)工學(xué)博士、廈門東南融通博士后,F(xiàn)為廈門大學(xué)信息學(xué)院教授、博士生導(dǎo)師,廈門大學(xué)大數(shù)據(jù)與計算智能團(tuán)隊帶頭人。廈門“雙百計劃”領(lǐng)軍型創(chuàng)業(yè)人才、閩江科學(xué)傳播學(xué)者、廈門市科技經(jīng)濟(jì)促進(jìn)會高級顧問、中國大數(shù)據(jù)學(xué)術(shù)創(chuàng)新百人、公益慈善中國行活動專家。主要研究方向?yàn)榇髷?shù)據(jù)、計算智能、數(shù)據(jù)挖掘、大規(guī)模優(yōu)化算法、知識圖譜等。
方匡南,廈門大學(xué)統(tǒng)計學(xué)博士、美國耶魯大學(xué)博士后,F(xiàn)為廈門大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系教授、博士生導(dǎo)師,廈門大學(xué)數(shù)據(jù)挖掘研究中心副主任。主要研究方向?yàn)閿?shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、應(yīng)用統(tǒng)計、金融大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)等。
潘璠,華中科技大學(xué)經(jīng)濟(jì)學(xué)博士,高級統(tǒng)計師,國家統(tǒng)計局統(tǒng)計科學(xué)研究所原所長。
第一章 大數(shù)據(jù)下的統(tǒng)計理論體系
1.1 背景與意義
1.2 文獻(xiàn)回顧與評述
1.3 大數(shù)據(jù)及其對統(tǒng)計學(xué)科的影響
1.4 從統(tǒng)計學(xué)到數(shù)據(jù)科學(xué)范式的興起
1.5 大數(shù)據(jù)背景下的統(tǒng)計學(xué)科建設(shè)
1.6 總結(jié)與展望
參考文獻(xiàn)
第二章 大數(shù)據(jù)下的數(shù)據(jù)集整合分析
2.1 背景和意義
2.2 綜述
2.3 AFT在異構(gòu)性模型的整合分析
2.4 對癌癥結(jié)果中多維度組學(xué)數(shù)據(jù)的整合分析
2.5 多亞型癌癥預(yù)后數(shù)據(jù)整合分析
2.6 基于對比懲罰的高通量癌癥研究整合分析
2.7 總結(jié)與展望
參考文獻(xiàn)
第三章 大數(shù)據(jù)下的高維變量選擇方法
3.1 背景和意義
3.2 高維數(shù)據(jù)的群組變量選擇方法
3.3 基于自適應(yīng)稀疏組Lasso的雙層變量選擇
3.4 基于網(wǎng)絡(luò)結(jié)構(gòu)Logistic模型的企業(yè)信用風(fēng)險預(yù)警
3.5 用懲罰方法來識別兩部分模型的比例結(jié)構(gòu)
3.6 總結(jié)與展望
參考文獻(xiàn)
第四章 大數(shù)據(jù)下的統(tǒng)計方法并行計算
4.1 背景和意義
4.2 綜述
4.3 基于Map-Reduce的馬爾可夫毯貝葉斯網(wǎng)絡(luò)學(xué)習(xí)
4.4 基于Hadoop的并行關(guān)聯(lián)規(guī)則挖掘方法
4.5 基于分類問題的特征排序算法
4.6 模糊時間序列預(yù)測模型
4.7 精準(zhǔn)營銷決策框架
4.8 總結(jié)及展望
參考文獻(xiàn)
第五章 大數(shù)據(jù)下的統(tǒng)計方法應(yīng)用——網(wǎng)絡(luò)輿情分析
5.1 背景和意義
5.2 網(wǎng)絡(luò)輿情分析研究方法
5.3 網(wǎng)絡(luò)輿情分析中的主題發(fā)現(xiàn)
5.4 網(wǎng)絡(luò)輿情分析中的關(guān)聯(lián)分析
5.5 網(wǎng)絡(luò)輿情分析中的情感傾向性分析
5.6 應(yīng)用研究
5.7 總結(jié)與展望
參考文獻(xiàn)