本書由微信公眾號“狗熊會”(ID:CluBear)創(chuàng)始人王漢生教授(熊大)及其核心團隊聯(lián)合創(chuàng)作完成。本書可以被看作商業(yè)分析領(lǐng)域入門級通俗且有趣的讀物,深入淺出,雅俗共賞,適合數(shù)據(jù)分析師、工程師、產(chǎn)品經(jīng)理、銷售人員、商務拓展人員以及數(shù)據(jù)企業(yè)高管閱讀。本書主要由六章組成。第一章介紹了熊大樸素的數(shù)據(jù)價值觀,解讀數(shù)據(jù)與價值的邏輯關(guān)系;第二章介紹了最基本的數(shù)據(jù)可視化方法(統(tǒng)計圖表)的規(guī)范與有趣應用;第三章介紹了回歸分析,通過精彩案例展示了如何將一個業(yè)務問題定義成一個數(shù)據(jù)可分析問題;第四章介紹了機器學習,可
數(shù)字化轉(zhuǎn)型是企業(yè)在數(shù)字經(jīng)濟時代面對的重大戰(zhàn)略選擇,其本質(zhì)是通過有效地使用數(shù)據(jù)資源對業(yè)務進行全面的升級和優(yōu)化,提高企業(yè)的綜合產(chǎn)業(yè)競爭力。本書將數(shù)據(jù)科學作為出發(fā)點,結(jié)合大數(shù)據(jù)、人工智能技術(shù),以數(shù)據(jù)分析的方法和理論為觀察視角,介紹了企業(yè)數(shù)字化轉(zhuǎn)型的核心知識概念及主要的應用實踐策略。本書共8章,分為數(shù)據(jù)科學原理、數(shù)據(jù)科學技術(shù)、數(shù)字化業(yè)務實踐,以及數(shù)字化產(chǎn)業(yè)目標四個主要部分。數(shù)據(jù)科學原理部分(第2章)主要討論數(shù)據(jù)要素的核心價值體系及數(shù)據(jù)科學的基本理論范疇;數(shù)據(jù)科學技術(shù)部分(第3~6章)主要介紹數(shù)據(jù)獲取及預
2022年12月19日,《中共中央國務院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》是黨的二十大之后推動數(shù)字經(jīng)濟開新局的基礎(chǔ)性政策文件,備受各方關(guān)注。本書是清華大學社會科學學院經(jīng)濟學研究所結(jié)合近年來在數(shù)字經(jīng)濟、數(shù)據(jù)要素方面所做的研究和取得的成果,從數(shù)據(jù)產(chǎn)權(quán)制度、數(shù)據(jù)要素流通和交易制度、數(shù)據(jù)要素收益分配制度、數(shù)據(jù)要素治理制度、數(shù)據(jù)的宏觀與生態(tài)價值等五個維度帶領(lǐng)大家解讀“數(shù)據(jù)二十條”中的經(jīng)濟與法律問題,了解數(shù)據(jù)基礎(chǔ)制度建設(shè)、數(shù)據(jù)要素賦能實體經(jīng)濟所面臨的機遇與挑戰(zhàn)。
Spark數(shù)據(jù)處理引擎是一個驚人的分析工廠:輸入原始數(shù)據(jù),輸出洞察。PySpark用基于Python的API封裝了Spark的核心引擎。它有助于簡化Spark陡峭的學習曲線,并使這個強大的工具可供任何在Python數(shù)據(jù)生態(tài)系統(tǒng)中工作的人使用!禤ython和PySpark數(shù)據(jù)分析》幫助你使用PySpark解決數(shù)據(jù)科學的日常挑戰(zhàn)。你將學習如何跨多臺機器擴展處理能力,同時從任何來源(無論是Hadoop集群、云數(shù)據(jù)存儲還是本地數(shù)據(jù)文件)獲取數(shù)據(jù)。一旦掌握了基礎(chǔ)知識,就可以通過構(gòu)建機器學習管道,并配合P
從信息資源管理協(xié)同創(chuàng)新視角,分析了大數(shù)據(jù)治理面臨的挑戰(zhàn)、機遇和焦點議題,大數(shù)據(jù)治理研究的視角、立場及代表性觀點,大數(shù)據(jù)治理的框架類型及其構(gòu)成要素。以公共價值理論、數(shù)字連續(xù)性理論、利益相關(guān)者理論和協(xié)同創(chuàng)新理論為主要理論支持,從大數(shù)據(jù)治理目標、主體、治理客體、治理活動、治理環(huán)境等多個維度,分析了大數(shù)據(jù)治理的政策、標準和技術(shù)的現(xiàn)狀及發(fā)展方向。提出了大數(shù)據(jù)治理發(fā)展應用的綜合治理模式、運行模型、評估體系和評估方法等理論,并基于案例研究提出了大數(shù)據(jù)治理發(fā)展與應用的實踐路徑。此外,本書從信息資源管理協(xié)同創(chuàng)新視
魯棒預測控制是在預測控制的基礎(chǔ)上考慮到實際系統(tǒng)存在著模型不精確或者參數(shù)時變、未知擾動等各種不確定性而發(fā)展起來的先進控制技術(shù)。如何在魯棒預測控制的基礎(chǔ)上有效處理時變時滯對系統(tǒng)的影響成為工業(yè)過程控制亟待解決的問題。本書針對具有時變時滯的工業(yè)過程可能存在參數(shù)時變、強干擾、執(zhí)行器故障、非線性、多階段切換、時變跟蹤軌跡等問題,重點介紹了基于魯棒預測控制思想以解決這些問題的先進技術(shù)和方法。其主要內(nèi)容為作者和所在團隊的項目經(jīng)驗及科研成果,包括線性控制、容錯控制、非線性控制和切換控制等相關(guān)內(nèi)容。
復雜性是大數(shù)據(jù)區(qū)別于小數(shù)據(jù)的本質(zhì)特性,也是當前大數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)治理面臨的核心挑戰(zhàn)。本書圍繞大數(shù)據(jù)的復雜性開展研究,旨在探索當前數(shù)據(jù)資源建設(shè)與利用過程中面臨的挑戰(zhàn)和技術(shù)難題,促進數(shù)據(jù)價值的充分釋放。全書分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數(shù)據(jù)控制技術(shù)的基本概念和任務定位,以及國內(nèi)外的研究進展;第2部分實體分辨技術(shù)(第3~13章),研究了高維數(shù)據(jù)實體分辨、名稱分辨、XML數(shù)據(jù)實體分辨和跨模態(tài)數(shù)據(jù)實體分辨等;第3部分真值發(fā)現(xiàn)技術(shù)(第14~18章),研究了單真值發(fā)現(xiàn)、多真值發(fā)
本書分為10章,其中第1~9章探討了排序、推薦系統(tǒng)、聚類、線性回歸等內(nèi)容,每章都以一個具體的實際問題開始,其主要目的是激發(fā)對某一特定大數(shù)據(jù)分析技術(shù)的研究。接下來探討其背后的數(shù)學原理——包括重要的定義、輔助陳述和得出的結(jié)論。案例研究有助于將所學知識應用于跨學科的環(huán)境中,包括對逐步任務的描述和有用的提示。每章之后都配有習題,作為自學中不可缺少的一部分,有助于提高對基礎(chǔ)理論的理解。第10章提供了前9章的習題答案,以及Python代碼中的算法描述作為補充材料。本書適合作為大數(shù)據(jù)分析、應用數(shù)學及相關(guān)專業(yè)的
大數(shù)據(jù)技術(shù)與應用發(fā)展不僅改變著網(wǎng)絡信息環(huán)境,而且決定數(shù)據(jù)的存在形態(tài)與數(shù)字信息資源的分布和利用結(jié)構(gòu),直接關(guān)系到用戶的認知需求表達與數(shù)字信息交互機制。在這一背景下,本書從大數(shù)據(jù)技術(shù)基礎(chǔ)、數(shù)據(jù)內(nèi)容管理和數(shù)字信息利用出發(fā),按照大數(shù)據(jù)應用與服務基礎(chǔ)構(gòu)架進行理論和實踐的歸納;通過基本問題的分析和實證探索,圍繞大數(shù)據(jù)需求、數(shù)字資源形態(tài)和數(shù)據(jù)關(guān)聯(lián)關(guān)系,研究多模態(tài)大數(shù)據(jù)資源組織和面向應用的數(shù)字信息服務。本書在面向現(xiàn)實問題的研究中,對前沿性發(fā)展進行相應的展示,所涉及的問題因而具有拓展性。
本書的編寫目的是向讀者介紹大數(shù)據(jù)治理與安全的基本概念和相應的技術(shù)應用。本書共9章,內(nèi)容分別為數(shù)據(jù)治理概述、數(shù)據(jù)采集與數(shù)據(jù)道德、數(shù)據(jù)質(zhì)量與數(shù)據(jù)管理、數(shù)據(jù)交換與數(shù)據(jù)集成、數(shù)據(jù)庫設(shè)計與治理、架構(gòu)設(shè)計與治理、數(shù)據(jù)倉庫設(shè)計與治理、大數(shù)據(jù)安全與治理及綜合實訓。本書將理論與實踐操作相結(jié)合,通過大量的案例幫助讀者快速了解和應用大數(shù)據(jù)治理的相關(guān)技術(shù),并對書中重要的、核心的知識點加大練習的比例,以達到幫助讀者熟練應用的目的。本書可作為高等院校大數(shù)據(jù)專業(yè)、人工智能專業(yè)、軟件技術(shù)專業(yè)、云計算專業(yè)、計算機網(wǎng)絡專業(yè)的專業(yè)課