本書針對愿意加入大數(shù)據(jù)行業(yè)的初學(xué)者量身定做,以簡練風(fēng)趣的語言介紹了大數(shù)據(jù)程核心技術(shù)及相關(guān)案例。內(nèi)容包括了數(shù)據(jù)的基本概念、Hadoop的安裝與配置、HDFS、基于Hadoop3的HDFS高可用、Zookeeper、MapReduce、YARN、Sqoop、KafKa、Redis,每個知識點配有可運行的案例,同時結(jié)合企業(yè)實
本書從多個數(shù)據(jù)項目實例出發(fā),介紹爬蟲、反爬蟲的各種案例,使讀者了解到數(shù)據(jù)抓取和分析的完整過程。書中案例的難度由淺入深,以作者原創(chuàng)的代碼為主,不借助現(xiàn)成的框架,強調(diào)在數(shù)據(jù)采集過程中的發(fā)散思維,總結(jié)攻克反爬蟲的思維模式,實現(xiàn)以低成本的方式得到想要的數(shù)據(jù)的愿望。最后,用一個“愛飛狗”的例子,為讀者展示如何從0到1地開發(fā)一個大
線性延遲反饋控制使非線性系統(tǒng)產(chǎn)生了非常復(fù)雜的行為,包括混沌和分岔,延遲產(chǎn)生的混沌具有理論上的無窮維,可能通過簡單的方法獲得超混沌吸引子。針對線性延遲反饋的混沌產(chǎn)生機理,包括局部分岔,全局分岔,拓撲馬蹄等一系列問題進行了較為深入的分析,同時對混沌的應(yīng)用,如通信應(yīng)用,加密應(yīng)用和壓實機械中的應(yīng)用都進行了深入的研究,這些研究成
隨著計算機和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為人類獲取知識的最大平臺。在爬取了Web網(wǎng)頁語料后,需要通過數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析來獲取數(shù)據(jù)的價值,從而造福人類,推動社會發(fā)展。本書主要是Web大數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析的實戰(zhàn)指南,內(nèi)容包括三部分:基礎(chǔ)知識、基于Python的數(shù)據(jù)預(yù)處理、基于Python的數(shù)據(jù)分析
決策問題中存在大量的冗余信息,而且很多信息都具有不確定性,面對這些雜亂無章的海量數(shù)據(jù),決策者需花費大量時間分析,以至于可能錯失決策良機,因此研究具有不確定性的決策問題中冗余信息約簡是決策者亟待解決的關(guān)鍵問題。目前軟集合方法能夠較好地處理不確定決策問題,但軟集合約簡方法目前還不完善,致使對海量數(shù)據(jù)很難做出決策。本書主要以
天津濱海迅騰科技集團有限公司編著的《大數(shù)據(jù)高可用環(huán)境搭建與運維(企業(yè)級人才培養(yǎng)解決方案十三五規(guī)劃教材)》主要涉及11個項目,即大數(shù)據(jù)分布式集群、分布式集群基礎(chǔ)配置、ZooKeeper分布式協(xié)調(diào)系統(tǒng)、Hadoop高可用、Hive分布式數(shù)據(jù)倉庫工具、HBase分布式數(shù)據(jù)庫、大數(shù)據(jù)協(xié)作框架、Linux自動化部署、Ambari
本書將大數(shù)據(jù)技術(shù)生態(tài)圈主流技術(shù)框架的應(yīng)用與發(fā)展、搭建Hadoop大數(shù)據(jù)分布式系統(tǒng)集群平臺、大數(shù)據(jù)分布式文件系統(tǒng)HDFS(HadoopDistributedFileSystem)、大數(shù)據(jù)分布式并行計算框架MapReduce、大數(shù)據(jù)汽車銷售數(shù)據(jù)統(tǒng)計分析項目5大模塊分為11章內(nèi)容進行闡述。具體分布情況如下:第1章是大數(shù)據(jù)概論
本書采用理論與實踐相結(jié)合的方式,全面介紹了Hadoop大數(shù)據(jù)技術(shù)。主要內(nèi)容包括初識Hadoop大數(shù)據(jù)技術(shù)、Hadoop環(huán)境配置,分布式文件系統(tǒng)HDFS、資源調(diào)度框架YARN、分布式計算框架MapReduce、大數(shù)據(jù)數(shù)據(jù)倉庫Hive、分布式數(shù)據(jù)庫HBase、查詢大型半結(jié)構(gòu)化數(shù)據(jù)集的語言Pig、分布式日志采集工具Flume
“第1章認識商務(wù)智能”,解釋了BI的相關(guān)概念及理論基礎(chǔ);“第2章實施商務(wù)智能”,講述了BI項目的實施過程;“第3章分析商務(wù)智能案例”,展示了企業(yè)真實BI案例的實施細節(jié)、成果及價值所在;第4章至第6章為商務(wù)智能開發(fā)工具;“第7章商務(wù)智能的應(yīng)用與發(fā)展趨勢”,介紹了BI的應(yīng)用及未來發(fā)展趨勢。
本書從系統(tǒng)的角度出發(fā),按照大數(shù)據(jù)處理流程的順序,全面介紹了大數(shù)據(jù)技術(shù)的基礎(chǔ)知識,提升讀者對大數(shù)據(jù)的認知。全書分3個邏輯層次,共9章。 本書作為大數(shù)據(jù)技術(shù)的基礎(chǔ)教材,目的不在于讓讀者對具體的某個技術(shù)平臺細節(jié)有很深的理解,而是盡量讓讀者體會整個大數(shù)據(jù)處理的技術(shù)流程,使讀者能夠掌握大數(shù)據(jù)技術(shù)的整體框架,能夠在未來的學(xué)習(xí)和工作