(教)Python在數據分析中的應用:統計分析方法與計量模型實踐
定 價:38 元
叢書名:“金課工程”系列教材·通用基礎系列,上海財經大學會計信息化研究中心項目,上海市浦江人才計劃項目成果
- 作者:饒艷超,張周編
- 出版時間:2022/2/1
- ISBN:9787542969989
- 出 版 社:立信會計出版社
- 中圖法分類:TP311.561
- 頁碼:185
- 紙張:膠版紙
- 版次:1
- 開本:16開
《Python在數據分析中的應用:統計分析方法與計量模型實踐》基于Python學習在進行數據分析時常用的統計分析方法,具體包括多元線性回歸模型擬合、多元非線性回歸模型擬合、多元統計分析推斷、模型變量的異方差性處理、處理面板數據的固定效應方法和隨機效應方法、時間序列數據處理的有限分布滯后模型等。
《Python在數據分析中的應用:統計分析方法與計量模型實踐》學習內容略過數據的獲取過程,不關注Python的爬蟲應用,僅關注在數據獲取之后應用Python實現利用不同的統計分析方法構建模型進行數據挖掘和發(fā)現數據規(guī)律!禤ython在數據分析中的應用:統計分析方法與計量模型實踐》共十一章的學習內容建立在對Python應用已有一定程度了解和掌握的基礎之上。如果學習者對Python了解不多,可以通過附錄部分,先學習應用Python進行數據分析的基礎,學習如何搭建Python數據分析環(huán)境,了解掌握Python數據處理和分析的常用算法庫和工具包。
人類社會發(fā)展進程中,通過數據來研究規(guī)律并發(fā)現規(guī)律貫穿了始終。從進入信息化時代開始,人類社會的各類信息系統就開始積累大量的業(yè)務數據,為了有效、充分利用這些數據支持日常管理和決策,數據分析成為越來越多崗位人員每天的基本工作。進入數字化時代后,不僅數據量越來越大,數據類型和數據形式也越來越多,各行各業(yè)對數據分析的需求也越來越強烈。
可以說,數據分析正在改變傳統崗位的工作方式,數據分析正成為最受人們青睞的工作崗位,數據分析能力是數字化時代各類人才的必備能力。為了增強學生在人才市場的競爭力,越來越多高校在基礎課程或專業(yè)必修、專業(yè)選修課程中加入了數據分析課程,或是至少在相關課程中加入了數據分析的教學內容。
數據分析是指將某一主題相關的數據收集整合,然后利用特定的方法分析這些主題數據,從中發(fā)現規(guī)律或是得到結論。社會和經濟領域中針對不同主題的決策場景進行數據分析有著不同的分析目的,分析目的不同,分析所基于的數據、方法和工具也會不同。因此,進行數據分析首先需要確定數據分析目標。例如,企業(yè)產品運營部門進行數據分析的目的之一是了解產品存在的問題并分析原因,然后在分析的基礎上思考優(yōu)化的運營方案。再如,投資部門進行數據分析的目的之一是深入分析備選投資方案的成本、收益和風險,以及分析哪些因素會怎樣影響投資成本、投資收益和投資風險,以支持投資決策。
就數據而言,數據分析所基于的數據有簡單的數據,也有復雜的數據;有數值數據,也有文本數據;有連續(xù)數值數據,也有斷點數值數據;有結構化數據,也有非結構化數據。就方法而言,統計學是數據分析的靈魂,統計分析方法是常用數據分析方法。就經濟領域的數據分析而言,計量經濟模型是常用的分析模型。
很多編程語言都可以實現數據分析,Python是當前在實務應用和課堂教學中的首選語言。這不僅因為Python語法簡單,代碼可讀性高,容易入門,有利于初學者學習,還因為Python在數據處理、分析和交互、探索性計算以及數據可視化等方面都有非常成熟的科學計算庫和工具。例如,在數據處理和分析方面,Python擁有NumPY、Pandas、Matplotlib、Scikit-learn、IPython等一系列非常優(yōu)秀的庫和工具。此外Python在爬蟲、Web、自動化運維甚至游戲等諸多領域也有廣泛應用。
本教材基于Python學習在進行數據分析時常用的統計分析方法,具體包括多元線性回歸模型擬合、多元非線性回歸模型擬合、多元統計分析推斷、模型變量的異方差性處理、處理面板數據的固定效應方法和隨機效應方法、時間序列數據處理的有限分布滯后模型等。本教材學習內容略過數據的獲取過程,不關注Python的爬蟲應用,僅關注在數據獲取之后應用Python實現利用不同的統計分析方法構建模型進行數據挖掘和發(fā)現數據規(guī)律。本教材共十一章的學習內容建立在對Python應用已有一定程度了解和掌握的基礎之上。如果學習者對Python了解不多,可以通過附錄部分,先學習應用Python進行數據分析的基礎,學習如何搭建Python數據分析環(huán)境,了解掌握Python數據處理和分析的常用算法庫和工具包。
第一章 應用Python擬合多元線性回歸模型
第一節(jié) 多元線性回歸模型
第二節(jié) 普通最小二乘法的Python實現
第二章 應用Python進行多元統計分析推斷
第一節(jié) 多元統計分析推斷的基本原理
第二節(jié) 單個總體參數的假設檢驗的Python實現
第三節(jié) 置信區(qū)間
第四節(jié) 線性組合假設檢驗
第三章 應用Python擬合多元非線性回歸模型
第一節(jié) 標準化回歸模型
第二節(jié) 含有其他形式的回歸模型
第三節(jié) 將回歸模型用于預測
第四章 應用Python檢驗模型設定和數據問題
第一節(jié) 模型誤設
第二節(jié) 代理變量
第三節(jié) 異常觀測值
第五章 應用Python處理含虛擬變量的多元回歸模型
第一節(jié) 自變量為二值虛擬變量的情形
第二節(jié) 自變量為多類別虛擬變量的情形
第三節(jié) 自變量為虛擬變量時的交互作用
第四節(jié) 因變量為二值虛擬變量的情形
第六章 應用Python處理異方差性
第一節(jié) 異方差性及其影響
第二節(jié) 異方差性檢驗
第三節(jié) 異方差性處理
第七章 應用Python處理簡單面板數據
第一節(jié) 獨立混合橫截面數據分析
第二節(jié) 兩期面板數據分析
第八章 應用Python估計工具變量
第一節(jié) 遺漏變量和工具變量
第二節(jié) 工具變量相關檢驗
第三節(jié) 其他條件下的2SLS應用
第九章 應用Python處理多期面板數據
第一節(jié) 面板數據處理的固定效應和隨機效應方法
第二節(jié) 使用Python工具包linearmodels處理面板數據
第十章 應用Python處理聯立方程組
第一節(jié) 聯立方程組的關鍵概念
第二節(jié) 方程組參數估計方法的Python實現
第十一章 應用Python處理時間序列數據
第一節(jié) 時間序列數據分析的基本模型
第二節(jié) 不同特征的時間序列數據分析
附錄 應用Python進行數據分析的基礎
第一節(jié) Python概述
第二節(jié) Python數據處理和計算
第三節(jié) Python繪圖
第四節(jié) 常用Python統計分析語法