Python數(shù)據(jù)科學(xué)實(shí)踐
《Python數(shù)據(jù)科學(xué)實(shí)踐》是由狗熊會(huì)推出的一本利用Python介紹數(shù)據(jù)科學(xué)基本過(guò)程的著作。本書(shū)以Python語(yǔ)言為基礎(chǔ),介紹利用Python進(jìn)行數(shù)據(jù)科學(xué)研究與商業(yè)分析的全貌。其核心的設(shè)計(jì)理念是通過(guò)經(jīng)典的商業(yè)應(yīng)用案例對(duì)數(shù)據(jù)爬取、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)建模的核心Python模塊做相應(yīng)的介紹。
本書(shū)的特點(diǎn)是強(qiáng)調(diào)數(shù)據(jù)科學(xué)帶來(lái)的商業(yè)價(jià)值理念,所以其可以作為高等學(xué)校數(shù)據(jù)科學(xué)、大數(shù)據(jù)管理與應(yīng)用、統(tǒng)計(jì)或相關(guān)專(zhuān)業(yè)的教材,也適合從事數(shù)據(jù)分析的工作者和愛(ài)好者閱讀。
本書(shū)是狗熊會(huì)政委團(tuán)隊(duì)力作,特別適合數(shù)據(jù)科學(xué)領(lǐng)域的Python小白快速上手。
——王漢生(北京大學(xué)光華管理學(xué)院教授)
本書(shū)依托數(shù)據(jù)科學(xué)精品案例并結(jié)合大量場(chǎng)景和行業(yè)應(yīng)用,讓Python不再枯燥,更加有用、有趣。
——李廣雨(狗熊會(huì)CEO)
仿照本書(shū)第8章的方法,我對(duì)本書(shū)書(shū)名進(jìn)行了一次分詞:Python、數(shù)據(jù)科學(xué)、實(shí)踐。這三個(gè)關(guān)鍵詞各自都擁有海量的書(shū)籍資料,但用生動(dòng)有趣的語(yǔ)言將三者結(jié)合起來(lái),卻是一件極為難的事情。在閱讀本書(shū)的過(guò)程中,我驚奇地發(fā)現(xiàn)原來(lái)日常生活中形形色色的數(shù)據(jù)能與Python編程發(fā)生如此奇妙的“化學(xué)反應(yīng)”,而本書(shū)正是通過(guò)這種方式讓讀者真切地感受到數(shù)據(jù)科學(xué)的魅力。
——邱怡軒(美國(guó)普渡大學(xué)統(tǒng)計(jì)學(xué)專(zhuān)業(yè)博士,卡內(nèi)基梅隆大學(xué)博士后)
常象宇,西安交通大學(xué)管理學(xué)院副教授,西安交通大學(xué)應(yīng)用數(shù)學(xué)系與加州大學(xué)伯克利分校統(tǒng)計(jì)系聯(lián)合培養(yǎng)博士,華盛頓大學(xué)西雅圖分校工業(yè)與系統(tǒng)工程系客座副教授,狗熊會(huì)聯(lián)合創(chuàng)始人,負(fù)責(zé)歐亞·狗熊會(huì)數(shù)據(jù)科學(xué)研究院的工作。對(duì)人工智能、統(tǒng)計(jì)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等有深入研究。
曾智億,畢業(yè)于西南交通大學(xué)金融學(xué)專(zhuān)業(yè),曾參與西南交通大學(xué)智慧營(yíng)銷(xiāo)實(shí)驗(yàn)室、平安證券、建設(shè)銀行、榮耀電商、三一重工等實(shí)習(xí)或駐場(chǎng)項(xiàng)目,對(duì)爬蟲(chóng)數(shù)據(jù)采集、數(shù)據(jù)分析、自然語(yǔ)言處理等有深入研究。
李春艷,西安交通大學(xué)工業(yè)工程專(zhuān)業(yè)碩士在讀,曾參與狗熊會(huì)火鍋系列精品案例的編寫(xiě),以及參與新浪微博和百詞斬等項(xiàng)目實(shí)踐,對(duì)商務(wù)統(tǒng)計(jì)分析有深入研究。
程茜,西安歐亞學(xué)院金融學(xué)院教師。2015年進(jìn)入狗熊會(huì)數(shù)據(jù)分析研究院,2017年開(kāi)始承擔(dān)金融學(xué)院數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)教學(xué)工作,教授課程有編程和程序設(shè)計(jì)、回歸分析和數(shù)據(jù)挖掘等。
第1章 基于Python的數(shù)據(jù)科學(xué)環(huán)境搭建 1
1.1 Python是數(shù)據(jù)科學(xué) “大勢(shì)所趨”2
1.2 Anaconda入門(mén) ——工欲善其事,必先利其器 4
1.3 Jupyter Notebook入門(mén) 15
1.4 Markdown單元格的使用 25
1.5 Spyder入門(mén) 34
1.6 小結(jié) 38
第2章 Python基礎(chǔ) 39
2.1 “火鍋團(tuán)購(gòu)數(shù)據(jù)”簡(jiǎn)介 40
2.2 讀寫(xiě)數(shù)據(jù) 41
2.3 Python數(shù)據(jù)類(lèi)型與結(jié)構(gòu) 44
2.4 控制流、函數(shù)與模塊 58
2.5 面向?qū)ο缶幊痰幕靖拍?66
2.6 Numpy簡(jiǎn)介 72
2.7 小結(jié) 77
第3章 Python的數(shù)據(jù)處理模塊 78
3.1 初級(jí)篇 ——相遇 Pandas79
3.2 進(jìn)階篇 ——相識(shí) Pandas90
3.3 小結(jié) 99
第4章 Python的繪圖模塊 100
4.1 為什么需要數(shù)據(jù)可視化 101
4.2 初級(jí)篇 ——Matplotlib基礎(chǔ) 102
4.3 高級(jí)篇 ——Plotly基礎(chǔ) 121
4.4 小結(jié) 139
第5章 Python的統(tǒng)計(jì)建模模塊 141
5.1 Statsmodels簡(jiǎn)介 142
5.2 數(shù)據(jù)接入 143
5.3 統(tǒng)計(jì)模型參數(shù)估計(jì) 145
5.4 統(tǒng)計(jì)假設(shè)檢驗(yàn) 153
5.5 探索分析 159
5.6 小結(jié) 165
第6章 Python的機(jī)器學(xué)習(xí)模塊 166
6.1 機(jī)器學(xué)習(xí)的定義 167
6.2 使用 scikit -learn169
6.3 小結(jié) 182
第7章 Python的爬蟲(chóng)模塊 183
7.1 爬蟲(chóng)的定義 184
7.2 初級(jí)篇 ——單頁(yè)面靜態(tài)爬蟲(chóng) 185
7.3 中級(jí)篇 ——多頁(yè)面靜態(tài)爬蟲(chóng) 197
7.4 高級(jí)篇 ——爬蟲(chóng)的偽裝 205
7.5 終級(jí)篇 ——?jiǎng)討B(tài)爬蟲(chóng) 212
7.6 爬蟲(chóng)注意事項(xiàng) 217
7.7 小結(jié) 217
第8章 Python的文本分析模塊 218
8.1 準(zhǔn)備 :理解文本分析流程 219
8.2 實(shí)戰(zhàn) 224
8.3 小結(jié) 232
第9章 Python的數(shù)據(jù)庫(kù)模塊 233
9.1 為什么需要數(shù)據(jù)庫(kù) 234
9.2 初級(jí)篇 ——SQLAlchemy的基本使用 235
9.3 高級(jí)篇 244
9.4 小結(jié) 248
第10章 精品案例——火鍋團(tuán)購(gòu)分析 249
10.1 背景介紹 250
10.2 數(shù)據(jù)描述 252
10.3 建模分析 264
10.4 小結(jié) 269