普通高等院校應(yīng)用型人才培養(yǎng)“十三五”規(guī)劃教材:Python數(shù)據(jù)分析
定 價:45 元
叢書名:普通高等院校應(yīng)用型人才培養(yǎng)“十三五”規(guī)劃教材
- 作者:[中國]吳道君;朱家榮
- 出版時間:2019/9/1
- ISBN:9787113258719
- 出 版 社:中國鐵道出版社
- 中圖法分類:TP311.561
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書全面講解Python數(shù)據(jù)分析的相關(guān)知識和技術(shù),內(nèi)容包括Python數(shù)據(jù)分析概述、NumPy數(shù)值計算、Matplotlib數(shù)據(jù)可視化、Pandas數(shù)據(jù)分析、數(shù)據(jù)預(yù)處理、Sklearn機器學(xué)習(xí)。本書以培養(yǎng)學(xué)生編程能力和數(shù)據(jù)分析能力為目標,注重技術(shù)應(yīng)用能力的培養(yǎng)。本書內(nèi)容充實、結(jié)構(gòu)合理、實用性強,具有明確的應(yīng)用能力培養(yǎng)目標,易于接受和理解,學(xué)完本書后,可以具備數(shù)據(jù)分析的基本能力。本書適合作為普通高等院校人工智能、數(shù)據(jù)科學(xué)與大數(shù)據(jù)以及計算機相關(guān)專業(yè)課程的教材,也可以作為相關(guān)從業(yè)人員的技術(shù)參考用書。
微課版,本書重視技術(shù)應(yīng)用和實踐教學(xué),以眾多示例形象展示應(yīng)用,以實驗操作提升學(xué)生能力。
數(shù)據(jù)的價值越來越被公眾認可和推崇,而數(shù)據(jù)分析的作用就是通過一定的方法找出數(shù)據(jù)的價值。近年來,隨著大數(shù)據(jù)技術(shù)和人工智能技術(shù)的發(fā)展,Python已經(jīng)成為數(shù)據(jù)科學(xué)領(lǐng)域重要的語言和工具。Python是一種面向?qū)ο、解釋型的計算機程序設(shè)計語言,其語法簡潔清晰、成熟穩(wěn)定。Python重要的是具有豐富和強大的庫,例如在數(shù)據(jù)分析領(lǐng)域的NumPy、Matplotlib、Pandas和Sklean等,這些庫基本上包含了數(shù)據(jù)分析的所有方面,為數(shù)據(jù)分析提供了強大的功能支持。有了這些數(shù)據(jù)分析庫,就可以非常容易地對數(shù)據(jù)進行分析,不再需要從基礎(chǔ)做起,大大降低了數(shù)據(jù)分析的難度和復(fù)雜度。本書主要講解使用Python以及Python的庫進行數(shù)據(jù)分析的技術(shù),全書共分為6章,主要內(nèi)容如下:第1章Python數(shù)據(jù)分析概述,主要講解數(shù)據(jù)分析的相關(guān)概念及其應(yīng)用、Python在數(shù)據(jù)分析領(lǐng)域的優(yōu)勢、Python數(shù)據(jù)分析的第三方類庫、Python數(shù)據(jù)分析環(huán)境庫的安裝、Jupyter Notebook工具的基本使用。第2章NumPy數(shù)值計算,主要講解NumPy數(shù)組的概念,NumPy數(shù)組的創(chuàng)建方法、屬性和數(shù)據(jù)類型,常用數(shù)組操作方法的使用,數(shù)組的切片和索引方法,數(shù)組的各類運算方法和使用,NumPy的線性代數(shù)運算函數(shù),數(shù)組的存取操作方法。第3章Matplotlib數(shù)據(jù)可視化,主要講解線形圖的繪制,線形圖的線的顏色、線型、坐標點、線寬設(shè)置;散點圖、柱狀圖、條形圖、餅圖、直方圖、箱線圖的繪制;圖例、坐標網(wǎng)格、坐標系、樣式的設(shè)置,樣式、RC設(shè)置和文本注解;子圖的繪制、子圖坐標系的設(shè)置、圖形嵌套;三維圖形的繪制。第4章Pandas數(shù)據(jù)分析,主要講解Pandas的數(shù)據(jù)結(jié)構(gòu),常用的DataFrame數(shù)據(jù)結(jié)構(gòu);DataFrame的基本功能,DataFrame的行操作與列操作;Pandas操作外部數(shù)據(jù)的方法,讀取CVS、數(shù)據(jù)庫數(shù)據(jù)的方法;DataFrame的重建索引、更換索引和層次化索引的使用;Series、DataFrame的數(shù)據(jù)運算,函數(shù)應(yīng)用與映射、排序、迭代方法;描述性統(tǒng)計函數(shù),協(xié)方差、相關(guān)性等的計算方法;分組與聚合的概念、分組聚合的方法使用;透視表、交叉表的方法。第5章數(shù)據(jù)預(yù)處理,主要講解數(shù)據(jù)清洗的概念和方法,重復(fù)值、缺失值和異常值的檢測與處理;DataFrame對象的合并連接與重塑方法;數(shù)據(jù)變換的種類、常用的數(shù)據(jù)變換方法。第6章Sklearn機器學(xué)習(xí),主要講解機器學(xué)習(xí)的有關(guān)概念,Sklearn數(shù)據(jù)集,Sklearn數(shù)據(jù)預(yù)處理,降維、回歸、聚類和分類算法,模型的選擇、訓(xùn)練、預(yù)測和評估等。本書配有完善的教學(xué)資源,包括教學(xué)課件、電子教案、教學(xué)大綱、教學(xué)計劃、實驗參考、習(xí)題答案等,可以在http://www.tdpress.com/51eds中下載。在教學(xué)過程中如果遇到任何問題,可以通過電子郵箱qingxiwang1111@163.com與作者進行交流。本書由廣東嶺南職業(yè)技術(shù)學(xué)院吳道君、廣西民族師范學(xué)院朱家榮任主編,信陽學(xué)院毛鳳翔、洛陽師范學(xué)院郭洪濤、哈爾濱華務(wù)學(xué)院宋毅和孫海龍任副主編,其中宋毅編寫了第1章, 吳道君編寫了第2章,朱家榮編寫了第3章,毛鳳翔編寫了第4章,孫海龍編寫了第5章,郭洪濤編寫了第6章。全書由王慶喜主審。本書得到相關(guān)領(lǐng)導(dǎo)、同事和有關(guān)學(xué)生的熱情幫助和支持,在此向他們表示衷心的感謝。由于時間倉促,編者水平有限,書中難免存在疏漏和不足之處,敬請讀者批評指正。編 者 2019年5月
吳道君,男,廣東嶺南職業(yè)技術(shù)學(xué)院講師、高級軟件工程師,承擔編程基礎(chǔ)C++、軟件工程、J2EE編程開發(fā)、.net開發(fā)等多門課程的教學(xué)任務(wù)。2011年12月指導(dǎo)學(xué)生參加第二屆“國信藍點杯”全國軟件專業(yè)人才設(shè)計與開發(fā)大賽并獲得個人賽全國總決賽“二等獎”,2013年在廣東省首屆信息技術(shù)類專業(yè)帶頭人“說專業(yè)”競賽中獲得“二等獎”。主編2016年9月于我社出版的《Java程序設(shè)計》一書。朱家榮:本科,就職于廣西師范大學(xué),從事數(shù)學(xué)、計算機等學(xué)科的課程教學(xué),近10年主要擔任《現(xiàn)代教育技術(shù)》、《教育技術(shù)與多媒體課件制作(含微課制作)》、《計算機應(yīng)用基礎(chǔ)》等課程教學(xué)。主持(或主要參與)完成廣西教育廳科研項目,廣西教育廳新世紀教改革工程項目等10多項,發(fā)表學(xué)術(shù)論文20多篇、主編參編教材多部,參與的《競賽驅(qū)動 雙向融通 地方高師院校師范生教師職業(yè)能力提升的研究與實踐》項目獲2017年廣西高等教育自治區(qū)級教學(xué)成果獎一等獎。
第1章 Python數(shù)據(jù)分析概述 11.1 數(shù)據(jù)分析的概念、流程和應(yīng)用 11.1.1 數(shù)據(jù)分析的概念 11.1.2 數(shù)據(jù)分析的流程 21.1.3 數(shù)據(jù)分析的應(yīng)用 21.2 數(shù)據(jù)分析工具 31.2.1 常用工具 41.2.2 Python數(shù)據(jù)分析 41.3 Python數(shù)據(jù)分析環(huán)境 5小結(jié) 9習(xí)題 9實驗 10第2章 NumPy數(shù)值計算 152.1 NumPy多維數(shù)組 152.1.1 數(shù)組創(chuàng)建 152.1.2 數(shù)組對象屬性 222.1.3 數(shù)組數(shù)據(jù)類型 232.2 數(shù)組操作 242.2.1 修改數(shù)組形狀 242.2.2 翻轉(zhuǎn)數(shù)組 262.2.3 連接數(shù)組 272.2.4 分割數(shù)組 282.2.5 數(shù)組元素添加與刪除 302.3 數(shù)組索引與切片 322.3.1 數(shù)組索引 322.3.2 數(shù)組切片 332.3.3 布爾型索引 342.3.4 花式索引 352.4 數(shù)組的運算 352.4.1 數(shù)組和標量間的運算 352.4.2 廣播 362.4.3 算術(shù)函數(shù) 372.4.4 集合運算 402.4.5 統(tǒng)計運算 412.4.6 排序 432.4.7 搜索 442.5 線性代數(shù) 452.5.1 數(shù)組相乘 462.5.2 矩陣行列式 462.5.3 逆矩陣 462.5.4 線性方程組 472.5.5 特征值和特征向量 472.6 數(shù)組的存取 48小結(jié) 48習(xí)題 48實驗 51第3章 Matplotlib數(shù)據(jù)可視化 543.1 線形圖 543.1.1 繪制線形圖 543.1.2 顏色設(shè)置 553.1.3 線型設(shè)置 563.1.4 坐標點設(shè)置 573.1.5 線寬設(shè)置 593.2 其他圖形 593.2.1 散點圖 593.2.2 柱形圖 613.2.3 條形圖 633.2.4 餅圖 643.2.5 直方圖 653.2.6 箱線圖 673.3 自定義設(shè)置 693.3.1 圖例設(shè)置 693.3.2 坐標網(wǎng)格設(shè)置 703.3.3 坐標系設(shè)置 713.3.4 樣式設(shè)置與注解 723.3.5 RC設(shè)置 733.4 子圖 743.4.1 創(chuàng)建子圖 743.4.2 子圖坐標系設(shè)置 763.4.3 圖形嵌套 773.5 繪制三維圖形 78小結(jié) 81習(xí)題 82實驗 82第4章 Pandas數(shù)據(jù)分析 894.1 Pandas數(shù)據(jù)結(jié)構(gòu) 894.2 DataFrame基本功能 944.3 讀取外部數(shù)據(jù) 954.3.1 CSV文件 964.3.2 Sqlite數(shù)據(jù)庫 984.4 數(shù)據(jù)幀的列操作和行操作 994.4.1 列操作 994.4.2 行操作 1014.5 高級索引 1034.5.1 重建索引 1034.5.2 更換索引 1064.5.3 層次化索引 1074.6 Pandas數(shù)據(jù)運算 1084.6.1 算術(shù)運算 1084.6.2 函數(shù)應(yīng)用與映射運算 1094.6.3 排序 1114.6.4 迭代 1134.6.5 唯一值與值計數(shù) 1154.7 統(tǒng)計函數(shù) 1164.7.1 描述性統(tǒng)計 1164.7.2 變化率 1194.7.3 協(xié)方差 1204.7.4 相關(guān)性 1204.7.5 數(shù)據(jù)排名 1214.8 分組與聚合 1224.8.1 分組 1224.8.2 聚合 1244.9 透視表與交叉表 1274.9.1 透視表 1274.9.2 交叉表 128小結(jié) 129習(xí)題 129實驗 129第5章 數(shù)據(jù)預(yù)處理 1345.1 數(shù)據(jù)清洗 1345.1.1 重復(fù)值 1345.1.2 缺失值 1355.1.3 異常值 1405.2 合并連接與重塑 1425.2.1 merge合并 1425.2.2 concat合并 1445.2.3 combine_first合并 1465.2.4 數(shù)據(jù)重塑 1475.3 數(shù)據(jù)變換 1495.3.1 虛擬變量 1495.3.2 函數(shù)變換 1505.3.3 連續(xù)屬性離散化 1515.3.4 規(guī)范化 1525.3.5 隨機采樣 154小結(jié) 156習(xí)題 156實驗 156第6章 Sklearn機器學(xué)習(xí) 1626.1 術(shù)語 1626.2 Sklearn 1646.2.1 Sklearn數(shù)據(jù)集 1656.2.2 Sklearn常用算法 1716.2.3 數(shù)據(jù)預(yù)處理 1756.2.4 數(shù)據(jù)集拆分 1776.2.5 模型評估 1776.2.6 Sklearn常用方法 1786.2.7 模型的保存和載入 1796.3 降維 1796.3.1 PCA(主成分分析) 1796.3.2 LDA(線性評價分析) 1816.4 回歸 1826.4.1 線性回歸 1836.4.2 邏輯回歸 1846.4.3 回歸決策樹 1856.5 分類 1866.5.1 樸素貝葉斯 1876.5.2 分類決策樹 1886.5.3 SVM(支持向量機) 1896.5.4 神經(jīng)網(wǎng)絡(luò) 1906.5.5 K?近鄰算法 1916.6 聚類 1926.6.1 K?means算法 1936.2.2 DBSCAN 194小結(jié) 195習(xí)題 195實驗 196參考文獻 200