關(guān)于我們
書單推薦
新書推薦

AI編程班:Python×ChatGPT網(wǎng)絡(luò)爬蟲從入門到精通

 AI編程班:Python×ChatGPT網(wǎng)絡(luò)爬蟲從入門到精通

定  價(jià):89 元

        

  • 作者:李杰臣 編著 ; 頡騰文化 出品
  • 出版時(shí)間:2024/2/1
  • ISBN:9787576333602
  • 出 版 社:北京理工大學(xué)出版社
  • 中圖法分類:TP18 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
3
8
3
7
3
5
6
7
0
6
2

全書共11章,以下是各章的主要內(nèi)容:

第1章:主要講解Python編程環(huán)境的搭建方法及Python語言的基礎(chǔ)語法知識(shí)等內(nèi)容。

第2章:主要講解AI工具的基本使用方法,以及如何在爬蟲編程中利用AI工具解決技術(shù)難題和提高開發(fā)效率。

第3章:主要講解如何對(duì)網(wǎng)頁進(jìn)行初步分析,包括查看網(wǎng)頁源代碼、剖析網(wǎng)頁的結(jié)構(gòu)、判斷網(wǎng)頁的類型等,為獲取網(wǎng)頁源代碼并提取數(shù)據(jù)奠定基礎(chǔ)。

第4、5章:分別講解靜態(tài)網(wǎng)頁和動(dòng)態(tài)網(wǎng)頁的爬取,主要內(nèi)容包括如何使用Requests模塊和Selenium模塊獲取網(wǎng)頁源代碼,如何使用正則表達(dá)式和BeautifulSoup模塊從網(wǎng)頁源代碼中提取所需數(shù)據(jù)。

第6章:主要講解如何使用pandas等模塊對(duì)獲取的數(shù)據(jù)進(jìn)行清洗、處理和分析,以提高數(shù)據(jù)的質(zhì)量,并從數(shù)據(jù)中提取有價(jià)值的信息。

第7章:進(jìn)一步探索Python網(wǎng)絡(luò)爬蟲的進(jìn)階技術(shù),例如,用pandas模塊爬取網(wǎng)頁表格數(shù)據(jù)、用數(shù)據(jù)接口爬取數(shù)據(jù)、開發(fā)帶圖形用戶界面的爬蟲程序等。

第8~11章:通過一系列實(shí)際應(yīng)用場景來實(shí)踐并強(qiáng)化之前所學(xué)的知識(shí)。這些場景涵蓋了財(cái)經(jīng)、社交媒體、電商等多個(gè)領(lǐng)域的數(shù)據(jù)爬取,以及媒體文件的下載。讀者將深入體會(huì)如何靈活運(yùn)用爬蟲技術(shù)解決實(shí)際問題,在遇到困難時(shí)如何借助AI工具見招拆招,從而踏上編程能力的持續(xù)自我提升之路。