關(guān)于我們
書單推薦
新書推薦

Python網(wǎng)絡(luò)爬蟲

Python網(wǎng)絡(luò)爬蟲

定  價:49 元

        

  • 作者:龔衛(wèi),郭嗣鑫主編
  • 出版時間:2023/9/1
  • ISBN:9787121468513
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:209頁
  • 紙張:
  • 版次:1
  • 開本:26cm
9
7
4
8
6
7
8
1
5
2
1
1
3

讀者對象:高校軟件工程專業(yè)師生

本教材是一門基于工作過程開發(fā)出來的學(xué)習(xí)領(lǐng)域教材,主要講解了爬取靜態(tài)網(wǎng)頁、爬取動態(tài)網(wǎng)頁、爬取APP數(shù)據(jù)、反爬蟲策略及解決辦法、爬蟲優(yōu)化策略,面向不同工作場景,劃分為若干個學(xué)習(xí)情境,內(nèi)容由淺入深,囊括了目前行業(yè)爬取數(shù)據(jù)的全部主流技術(shù)。第一部分是爬取靜態(tài)網(wǎng)頁,由三個學(xué)習(xí)情境講述:使用Requests+BeautifulSoup4+CSV,使用Mechanize+BeautifulSoup4+CSV,使用Scrapy+XPath+MySQL爬取數(shù)據(jù)。第二部分是爬取動態(tài)網(wǎng)頁,使用兩個學(xué)習(xí)情境描述:使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取數(shù)據(jù)。第三部分是爬取APP數(shù)據(jù)由使用Fiddler+Requests爬取新聞類APP接口數(shù)據(jù)描述。第四部分反爬蟲策略及解決辦法。由常見反爬蟲策略及解決辦法,處理輸入式驗證碼校驗講述。第五部分是爬蟲優(yōu)化策略,講述了Scrapy+Redis分布式爬取數(shù)據(jù)。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容