本書介紹基于Python語言的網(wǎng)絡(luò)數(shù)據(jù)采集技術(shù)的相關(guān)知識(shí),并為采集網(wǎng)絡(luò)中的各種數(shù)據(jù)類型提供全面指導(dǎo)。第1章重點(diǎn)介紹Scrapy框架及配置方法;第2~6章重點(diǎn)介紹網(wǎng)絡(luò)數(shù)據(jù)采集的基本原理,包括如何利用Python從網(wǎng)絡(luò)服務(wù)器請(qǐng)求信息,如何對(duì)服務(wù)器的響應(yīng)進(jìn)行基本處理,以及如何通過自動(dòng)化的手段與網(wǎng)站進(jìn)行交互;第7、8章介紹登錄
本書為大數(shù)據(jù)時(shí)代下的產(chǎn)物,由淺入深地介紹大數(shù)據(jù)及其相關(guān)知識(shí),在大數(shù)據(jù)的背景下著重介紹ETL數(shù)據(jù)處理技術(shù),同時(shí)引入數(shù)據(jù)清洗的知識(shí),理論與實(shí)際相結(jié)合,突出所長(zhǎng)。在理論上,本書突出重點(diǎn)與難點(diǎn),較為系統(tǒng)地介紹大數(shù)據(jù)的各項(xiàng)基本技術(shù)。在實(shí)踐操作上,本書貼近生活,切實(shí)理解,緊跟實(shí)驗(yàn)進(jìn)行,并從中萃取精華。同時(shí)本書還介紹ETL技術(shù)的主流
本書以常見的數(shù)據(jù)分析與大數(shù)據(jù)應(yīng)用方法為主線,按照數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與挖掘的邏輯關(guān)系分析大數(shù)據(jù)時(shí)代應(yīng)如何采用量化方法分析經(jīng)濟(jì)問題。本書在定性分析的基礎(chǔ)上,采用大量的實(shí)例和軟件操作插圖來直觀地解釋大數(shù)據(jù)分析方法的原理和應(yīng)用,為讀者提供“一站式”服務(wù)。同時(shí),通過對(duì)線性回歸、邏輯回歸等計(jì)量方法,主成
本書分為5篇,包括11章和3個(gè)附錄。大數(shù)據(jù)基礎(chǔ)篇包括第1章(緒論);大數(shù)據(jù)存儲(chǔ)篇包括第2~3章(HDFS分布式文件系統(tǒng)、NoSQL及其HBase分布式數(shù)據(jù)庫系統(tǒng));大數(shù)據(jù)計(jì)算篇包括第4~7章(MapReduce分布式計(jì)算、大數(shù)據(jù)的Spark內(nèi)存計(jì)算、大數(shù)據(jù)的流計(jì)算、大數(shù)據(jù)的圖計(jì)算);大數(shù)據(jù)管理、查詢分析及可視篇包括第8
本書主要根據(jù)作者近幾年在清華大學(xué)面向研究生和本科生開設(shè)的數(shù)據(jù)挖掘:方法與應(yīng)用課程的教學(xué)實(shí)踐與積累,參考近幾年國外著名大學(xué)相關(guān)課程的教學(xué)體系編寫而成。本書系統(tǒng)地介紹數(shù)據(jù)挖掘的基本概念和基本原理方法;結(jié)合一些典型的應(yīng)用實(shí)例展示用數(shù)據(jù)挖掘的思維方法求解問題的一般性模式與思路。本書可作為有一定數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫和程序設(shè)計(jì)基礎(chǔ)的研
本書將為大家全面而深入地介紹Hadoop、Spark和NoSQL平臺(tái)的構(gòu)建,深入淺出地講解Hadoop、Spark和NoSQL的基礎(chǔ)知識(shí)、架構(gòu)方案與實(shí)戰(zhàn)技巧等。通過閱讀本書,讀者可以對(duì)大數(shù)據(jù)平臺(tái)架構(gòu)有一個(gè)明確、清晰的認(rèn)識(shí),掌握Hadoop、Spark、NoSQL平臺(tái)的使用技巧,從而搭建一個(gè)安全可靠的大數(shù)據(jù)集群平臺(tái),來滿
作為面向全國高校師生舉辦的第二屆“慧源共享”全國高校開放數(shù)據(jù)創(chuàng)新研究大賽系列活動(dòng)的重要成果,本書主要分為三個(gè)部分,第一部分是數(shù)據(jù)論文,介紹圖書館業(yè)務(wù)數(shù)據(jù)、電子資源訪問行為數(shù)據(jù)、互聯(lián)網(wǎng)采集數(shù)據(jù)、特色數(shù)據(jù)4類數(shù)據(jù)的多個(gè)高價(jià)值數(shù)據(jù)集;第二部分收錄了大賽的8篇優(yōu)秀獲獎(jiǎng)?wù)撐?第三部分包括大賽的活動(dòng)介紹、專家寄語和訓(xùn)練營專家金句等
本書始終圍繞機(jī)電動(dòng)態(tài)系統(tǒng)的仿真及其工程應(yīng)用這個(gè)主題而展開,主要講解了有關(guān)機(jī)電動(dòng)態(tài)系統(tǒng)中的連桿機(jī)構(gòu)、齒輪機(jī)構(gòu)、液壓控制系統(tǒng)、液壓執(zhí)行元件、電子電路、電機(jī)、電力系統(tǒng)、測(cè)控系統(tǒng)、PID控制器、讀/寫外部數(shù)據(jù)等內(nèi)容。本書在第1版的基礎(chǔ)上對(duì)各章節(jié)內(nèi)容進(jìn)行了補(bǔ)充和完善,增加了讀/寫外部數(shù)據(jù)內(nèi)容。全書共15章,第1、2章回顧和總結(jié)M
本書主要研究了面向智慧旅游的視頻數(shù)據(jù)智能處理與挖掘相關(guān)技術(shù)及應(yīng)用,以提高旅游景區(qū)視頻大數(shù)據(jù)中異常事件檢測(cè)和識(shí)別的精度、魯棒性、實(shí)時(shí)性等性能為目的,從而實(shí)現(xiàn)對(duì)旅游突發(fā)事件及時(shí)預(yù)測(cè)和預(yù)警,保障旅游安全。本書首先研究了視頻大數(shù)據(jù)的去噪技術(shù),重點(diǎn)研究了基于殘差卷積神經(jīng)網(wǎng)絡(luò)的視頻去噪算法;然后研究了視頻大數(shù)據(jù)的超分辨率重建
本書從大數(shù)據(jù)基本概念開始引入,簡(jiǎn)介大數(shù)據(jù)目前的技術(shù)應(yīng)用以及技術(shù)流程,從而引出大數(shù)據(jù)時(shí)代下的數(shù)據(jù)便利性、價(jià)值以及隱患;列舉國內(nèi)外數(shù)據(jù)安全事件案例,引出數(shù)據(jù)治理、數(shù)據(jù)安全治理概念,介紹國內(nèi)外數(shù)據(jù)安全治理常用思路以及多個(gè)方法論,并以國內(nèi)GB/T37988-2019即DSMM數(shù)據(jù)安全能力成熟度為實(shí)踐思路選型,逐個(gè)介紹DSMM中