統(tǒng)計模型是數(shù)據(jù)分析的重要工具,模型選擇則是統(tǒng)計學研究的核心問題之一正如英國統(tǒng)計學家George E.P.Box所言,“所有模型都是錯的,但其中有一些是有用的”、我們很難找到一個在任何情況下,表現(xiàn)都很出眾的模型,而模型平均作為模型選擇的推廣形式,能幫助我們克服模型選擇的不確定性,得到更加穩(wěn)定和精確的估計或預測。隨著科技的進步,人們收集到的數(shù)據(jù)更加海量和多元,建立的模型也更加復雜。本書基于復雜的數(shù)據(jù)和模型,進一步拓展了模型平均理論,研究成果主要包括以下幾個方面:(1)研究高維縱向數(shù)據(jù)的半?yún)?shù)模型,以預測誤差最小化為目標,首次提出了雙權(quán)重的刪組交叉驗證準則,并基于這一準則證明了所提出刪組模型平均估計量的漸近**性。數(shù)值結(jié)果也表明本書所提出方法比其他常用的模型選擇或模型組合方法表現(xiàn)更優(yōu);(2)基于經(jīng)濟和醫(yī)療上常用的處理效應模型,針對條件平均處理效應的估計,提出了相應的OPT模型平均準則。建立了這一準則下**的模型平均估計量,證明了其漸近**性,數(shù)值模擬上包含與**模型平均方法的比較,結(jié)果顯示,研究提出的估計量大多數(shù)情況下表現(xiàn)**;(3)對比了常用的模型平均方法和機器學習方法,一方面,進行了廣泛的數(shù)值論證,對兩種方法在不同設(shè)置下的表現(xiàn)進行了比較;另一方面,提出了綜合兩類平均方法優(yōu)勢的交叉驗證(MTCV)組合方法,新方法能夠自適應地給出較優(yōu)結(jié)果。
趙志豪,統(tǒng)計學博士,現(xiàn)任首都經(jīng)濟貿(mào)易大學統(tǒng)計學院數(shù)理統(tǒng)計系講師,研究生導師,主要研究領(lǐng)域:模型選擇與平均。2018年曾赴香港城市大學管理科學學院訪問。2020年參與了“一帶一路”沿線國家疫情預測,由ANSO《“一帶一路”創(chuàng)新發(fā)展報告》2020年第3期采用并上報,該報告獲得了國家領(lǐng)導人重要批示。
第1章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 本書主要內(nèi)容及創(chuàng)新點
第2章 高維縱向數(shù)據(jù)的半?yún)?shù)模型平均方法
2.1 引言
2.2 模型框架與估計方法
2.3 模型平均與權(quán)重選擇準則
2.3.1 候選模型及其估計
2.3.2 交叉驗證準則
2.3.3 漸近最優(yōu)性
2.4 模擬研究
2.5 小結(jié)
2.6 定理的證明
第3章 處理效應的模型平均估計
3.1 引言
3.2 模型框架
3.3 權(quán)重選擇及其最優(yōu)性
3.3.1 分塊與配對
3.3.2 權(quán)重選擇準則
3.3.3 漸近最優(yōu)性
3.4 數(shù)值模擬
3.5 實際數(shù)據(jù)
3.6 小結(jié)
3.7 定理的證明
3.7.1定理3.3.1的證明
3.7.2定理3.3.2的證明
3.7.3定理3.3.3的證明
第4章 模型平均方法及機器學習算法的比較
4.1 引言
4.2 模型方法介紹
4.2.1 第一類模型平均方法
4.2.2 第二類模型平均方法
4.3 數(shù)值研究
4.3.1 設(shè)置1:系數(shù)遞減
4.3.2 設(shè)置2:系數(shù)有大有小
4.3.3 設(shè)置3:系數(shù)均為
4.3.4 設(shè)置4:系數(shù)均為
4.3.5 設(shè)置5:部分線性模型
4.3.6 設(shè)置6:真實數(shù)據(jù)分析
4.3.7 重尾噪聲設(shè)置
4.3.8 部分線性的進一步研究
4.4 交叉驗證組合預測
4.4.1 新的估計方法
4.4.2 新方法下的數(shù)值模擬
4.5 小結(jié)
第5章 總結(jié)與展望
5.1 本書內(nèi)容總結(jié)
5.2 展望
參考文獻