關(guān)于我們
書單推薦
新書推薦

AI編程班:Python×ChatGPT網(wǎng)絡(luò)爬蟲從入門到精通

 AI編程班:Python×ChatGPT網(wǎng)絡(luò)爬蟲從入門到精通

定  價:89 元

        

  • 作者:李杰臣 編著 ; 頡騰文化 出品
  • 出版時間:2024/2/1
  • ISBN:9787576333602
  • 出 版 社:北京理工大學(xué)出版社
  • 中圖法分類:TP18 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
3
8
3
7
3
5
6
7
0
6
2

全書共11章,以下是各章的主要內(nèi)容:

第1章:主要講解Python編程環(huán)境的搭建方法及Python語言的基礎(chǔ)語法知識等內(nèi)容。

第2章:主要講解AI工具的基本使用方法,以及如何在爬蟲編程中利用AI工具解決技術(shù)難題和提高開發(fā)效率。

第3章:主要講解如何對網(wǎng)頁進行初步分析,包括查看網(wǎng)頁源代碼、剖析網(wǎng)頁的結(jié)構(gòu)、判斷網(wǎng)頁的類型等,為獲取網(wǎng)頁源代碼并提取數(shù)據(jù)奠定基礎(chǔ)。

第4、5章:分別講解靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁的爬取,主要內(nèi)容包括如何使用Requests模塊和Selenium模塊獲取網(wǎng)頁源代碼,如何使用正則表達式和BeautifulSoup模塊從網(wǎng)頁源代碼中提取所需數(shù)據(jù)。

第6章:主要講解如何使用pandas等模塊對獲取的數(shù)據(jù)進行清洗、處理和分析,以提高數(shù)據(jù)的質(zhì)量,并從數(shù)據(jù)中提取有價值的信息。

第7章:進一步探索Python網(wǎng)絡(luò)爬蟲的進階技術(shù),例如,用pandas模塊爬取網(wǎng)頁表格數(shù)據(jù)、用數(shù)據(jù)接口爬取數(shù)據(jù)、開發(fā)帶圖形用戶界面的爬蟲程序等。

第8~11章:通過一系列實際應(yīng)用場景來實踐并強化之前所學(xué)的知識。這些場景涵蓋了財經(jīng)、社交媒體、電商等多個領(lǐng)域的數(shù)據(jù)爬取,以及媒體文件的下載。讀者將深入體會如何靈活運用爬蟲技術(shù)解決實際問題,在遇到困難時如何借助AI工具見招拆招,從而踏上編程能力的持續(xù)自我提升之路。