偷国产乱人伦偷精品视频,国产成人一区二区三区在线观看

本書作為數(shù)據(jù)分析的入門圖書，以Python語(yǔ)言為基礎(chǔ)，介紹了數(shù)據(jù)分析的整個(gè)流程。本書內(nèi)容涵蓋數(shù)據(jù)的獲�。ḿ淳W(wǎng)絡(luò)爬蟲程序的設(shè)計(jì)）、前期數(shù)據(jù)的清洗和處理、運(yùn)用機(jī)器學(xué)習(xí)算法進(jìn)行建模分析，以及使用可視化的方法展示數(shù)據(jù)及結(jié)果。首先，書中不會(huì)涉及過于高級(jí)的語(yǔ)法，不過還是希望讀者有一定的語(yǔ)法基礎(chǔ)，這樣可以更好地理解本書的內(nèi)容。其次，本書重點(diǎn)在于應(yīng)用Python來完成一些數(shù)據(jù)分析和數(shù)據(jù)處理的工作，即如何使用Python來完成工作而非專注于Python語(yǔ)言語(yǔ)法等原理的講解。本書的目的是讓初學(xué)者不論對(duì)數(shù)據(jù)分析流程本身還是Python語(yǔ)言，都能有一個(gè)十分直觀的感受，為以后的深入學(xué)習(xí)打下基礎(chǔ)。*后，讀者不必須按順序通讀本書，因?yàn)楦鱾€(gè)章節(jié)層次比較分明，可以根據(jù)興趣或者需要來自行安排。例如第5章介紹了一些實(shí)戰(zhàn)的小項(xiàng)目，有趣且難度不大，大家可以在學(xué)習(xí)前面內(nèi)容之余來閱讀這部分內(nèi)容。

Python作為一門優(yōu)秀的編程語(yǔ)言，近年來受到很多編程愛好者的青睞。一是因?yàn)镻ython本身具有簡(jiǎn)捷優(yōu)美、易學(xué)易用的特點(diǎn)；二是由于互聯(lián)網(wǎng)的飛速發(fā)展，我們正迎來大數(shù)據(jù)的時(shí)代，而Python無(wú)論是在數(shù)據(jù)的采集與處理方面，還是在數(shù)據(jù)分析與可視化方面都有獨(dú)特的優(yōu)勢(shì)。我們可以利用Python便捷地開展與數(shù)據(jù)相關(guān)的項(xiàng)目，以很低的學(xué)習(xí)成本快速完成項(xiàng)目的研究。本書本著實(shí)用性的目的，著眼于整個(gè)數(shù)據(jù)分析的流程，介紹了從數(shù)據(jù)采集到可視化的大致流程。希望借此為Python初學(xué)者打開數(shù)據(jù)分析領(lǐng)域的大門，初窺數(shù)據(jù)分析的奧秘。
本書的主要內(nèi)容
第1章主要講解了在Ubuntu和Windows系統(tǒng)下，Python集成開發(fā)環(huán)境的搭建�？紤]到初學(xué)者容易為安裝第三方庫(kù)犯難，又介紹了三種簡(jiǎn)單實(shí)用的方法來安裝這些常見的庫(kù)。接著對(duì)幾個(gè)后面要用到的高級(jí)語(yǔ)法進(jìn)行了簡(jiǎn)單介紹，為之后的應(yīng)用打下基礎(chǔ)。
第2章集中講解了數(shù)據(jù)采集的流程，即網(wǎng)絡(luò)爬蟲程序的設(shè)計(jì)與實(shí)現(xiàn)。首先本章沒有拘泥于使用Python的內(nèi)置庫(kù)urllib庫(kù)進(jìn)行實(shí)現(xiàn)，而是直接介紹了requests和其他更加簡(jiǎn)捷強(qiáng)大的庫(kù)來完成程序的設(shè)計(jì)。在進(jìn)階內(nèi)容中，對(duì)常見的編碼問題、異常處理、代理IP、驗(yàn)證碼、機(jī)器人協(xié)議、模擬登錄，以及多線程等相關(guān)問題給出了解決的方案。
第3章講解數(shù)據(jù)的清洗問題。在具體講解清洗數(shù)據(jù)之前，先介紹了TXT、XLSX、JSON、CSV等各種文件的導(dǎo)入和導(dǎo)出的方法，并介紹了Python與MySQL數(shù)據(jù)庫(kù)交互的方式。接著介紹了NumPy和pandas庫(kù)的基本使用方法，這是我們用于數(shù)據(jù)處理和科學(xué)計(jì)算的兩個(gè)強(qiáng)大的工具。最后綜合以上的學(xué)習(xí)介紹了數(shù)據(jù)的去重、缺失值的填補(bǔ)等經(jīng)典的數(shù)據(jù)清洗方法。
第4章首先講解探索性數(shù)據(jù)分析的應(yīng)用，并且簡(jiǎn)單介紹了機(jī)器學(xué)習(xí)基本知識(shí)。然后演示如何應(yīng)用sklearn庫(kù)提供的決策樹和最鄰近算法來處理分類問題，并嘗試根據(jù)算法原理手動(dòng)實(shí)現(xiàn)最鄰近算法。最后介紹如何使用pandas、matplotlib和seaborn這三個(gè)庫(kù)來實(shí)現(xiàn)數(shù)據(jù)的可視化。
第5章是綜合性學(xué)習(xí)的章節(jié)，講解了三個(gè)小項(xiàng)目的完整實(shí)現(xiàn)過程，旨在通過操作生活中真正的數(shù)據(jù)來強(qiáng)化前面基礎(chǔ)內(nèi)容的學(xué)習(xí)。
本書的讀者對(duì)象
本書面向想從事數(shù)據(jù)工作的Python初學(xué)者。由于本書并不對(duì)Python的基礎(chǔ)語(yǔ)法做詳細(xì)的講解，所以希望讀者有一定的語(yǔ)法基礎(chǔ)。
測(cè)試環(huán)境及代碼
我們使用的語(yǔ)法是基于Python 3的，具體是Python 3.6，用到的第三方庫(kù)也已經(jīng)全面支持此版本，所以讀者不必?fù)?dān)心相關(guān)的版本問題；測(cè)試環(huán)境為Ubuntu 16.04 LTS 64-Bit。本書中使用的全部代碼及相關(guān)數(shù)據(jù)已經(jīng)托管至Github, 讀者可以進(jìn)入https://github.com/shenxiangzhuang/PythonDataAnalysis進(jìn)行下載。
聯(lián)系作者
雖然本書只是入門級(jí)圖書，但是限于筆者水平有限，難免會(huì)存在一些錯(cuò)誤，有些地方的表述可能也不是那么準(zhǔn)確。非常歡迎讀者指出本書的不當(dāng)之處或提出建設(shè)性的意見。筆者的電子郵件地址是datahonor@gmail.com。
致謝
在本書的撰寫過程中受到過很多人的幫助，這里特別感謝劉松學(xué)長(zhǎng)，感謝學(xué)長(zhǎng)對(duì)筆者本人長(zhǎng)久以來的幫助，從他那里我學(xué)到了很多關(guān)于Python語(yǔ)言、機(jī)器學(xué)習(xí)以及計(jì)算機(jī)視覺等相關(guān)知識(shí)。另外，特別感謝IT工作者謝滿銳先生對(duì)本書的細(xì)心審校，也感謝他為本書的進(jìn)一步修改提出建設(shè)性意見。同時(shí)，感謝電子工業(yè)出版社石倩、楊嘉媛編輯的幫助。最后，本書參閱了大量的國(guó)內(nèi)外的文獻(xiàn)，這里對(duì)有關(guān)作者表示衷心的感謝。

你還可能感興趣

我要評(píng)論