關(guān)于我們
書(shū)單推薦
新書(shū)推薦

Python網(wǎng)絡(luò)爬蟲(chóng)

Python網(wǎng)絡(luò)爬蟲(chóng)

定  價(jià):49 元

        

  • 作者:龔衛(wèi),郭嗣鑫主編
  • 出版時(shí)間:2023/9/1
  • ISBN:9787121468513
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類(lèi):TP311.561 
  • 頁(yè)碼:209頁(yè)
  • 紙張:
  • 版次:1
  • 開(kāi)本:26cm
9
7
4
8
6
7
8
1
5
2
1
1
3

讀者對(duì)象:高校軟件工程專業(yè)師生

本教材是一門(mén)基于工作過(guò)程開(kāi)發(fā)出來(lái)的學(xué)習(xí)領(lǐng)域教材,主要講解了爬取靜態(tài)網(wǎng)頁(yè)、爬取動(dòng)態(tài)網(wǎng)頁(yè)、爬取APP數(shù)據(jù)、反爬蟲(chóng)策略及解決辦法、爬蟲(chóng)優(yōu)化策略,面向不同工作場(chǎng)景,劃分為若干個(gè)學(xué)習(xí)情境,內(nèi)容由淺入深,囊括了目前行業(yè)爬取數(shù)據(jù)的全部主流技術(shù)。第一部分是爬取靜態(tài)網(wǎng)頁(yè),由三個(gè)學(xué)習(xí)情境講述:使用Requests+BeautifulSoup4+CSV,使用Mechanize+BeautifulSoup4+CSV,使用Scrapy+XPath+MySQL爬取數(shù)據(jù)。第二部分是爬取動(dòng)態(tài)網(wǎng)頁(yè),使用兩個(gè)學(xué)習(xí)情境描述:使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取數(shù)據(jù)。第三部分是爬取APP數(shù)據(jù)由使用Fiddler+Requests爬取新聞?lì)怉PP接口數(shù)據(jù)描述。第四部分反爬蟲(chóng)策略及解決辦法。由常見(jiàn)反爬蟲(chóng)策略及解決辦法,處理輸入式驗(yàn)證碼校驗(yàn)講述。第五部分是爬蟲(chóng)優(yōu)化策略,講述了Scrapy+Redis分布式爬取數(shù)據(jù)。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容