回歸診斷是用于探索存在于回歸分析中問題及判斷某些假設(shè)是否合理的一種技術(shù)!痘貧w診斷簡介》主要回顧蕞小二乘線性回歸,討論多元回歸中共線性的問題,處理奇異與強影響數(shù)據(jù),探討誤差非線性、不一致的誤差方差和非線性問題,簡要闡釋離散數(shù)據(jù)產(chǎn)生的問題,介紹基于蕞大似然法、計分檢驗和構(gòu)造變量的較復(fù)雜的診斷方法。*后,探討了如何將介紹的具體診斷方法和技術(shù)應(yīng)用到研究中去。
《回歸診斷簡介》針對回歸中經(jīng)常出現(xiàn)的影響估計精度的因素,對研究者的假設(shè)提出質(zhì)疑,運用回歸診斷判斷假設(shè)的合理性并處理回歸分析中存在的問題。本書從回歸分析中析出幾大重要方法,如蕞小二乘回歸、蕞大似然法、共線性、非線性、離散數(shù)據(jù)等,對該問題進(jìn)行解釋,結(jié)構(gòu)分明,敘述清楚。
在社會科學(xué)的數(shù)據(jù)分析中,回歸可謂是最常用的方法。通過計算機,獲得一個估計的回歸方程就和數(shù)1-2-3一樣簡單,事實的確如此,因為利用任何一個軟件程序,研究者都可以按如下操作:1-加載樣本數(shù)據(jù);2-確定回歸方程;3-利用普通最小二乘法進(jìn)行估計,而這將獲得一個類似下面的結(jié)果:
但是,這個估計的結(jié)果如實的反應(yīng)了真實世界的狀況嗎?例如,在X2保持不變的情況下,X1一個單位的變化是否將導(dǎo)致Y產(chǎn)生71.5的預(yù)期變化?我們往往可以非常自信的談?wù)摽傮w估計的精確度。但是,我們對回歸結(jié)果的信任程度取決于是否能夠成功處理以下常見問題:多元共線性, 奇異值,非正態(tài),異方差性,以及非線性。
?怂梗‵ox)教授將診斷(diagnostics)引申為發(fā)現(xiàn)上述這些問題。例如奇異觀測值,或更概括地講,即強影響(influential)觀測值產(chǎn)生的問題。除了那些可以展示某一極端值如何影響回歸直線的常用圖形外,?怂箤ζ渌麥y量方法也進(jìn)行了闡釋:預(yù)測值(hat-values),學(xué)生殘差(studentized residuals),Cook距離,以及偏回歸散點圖(partial-regression plots)。這些測量方法大多可以通過常用的軟件程序獲得,例如SAS或SPSS。
在對回歸進(jìn)行了診斷之后,福克斯專注尋找可能的解決辦法。關(guān)于此類的問題非常多,例如:如果具有高度的共線性,則這個變量需要被剔除出回歸方程嗎?如果有奇異值出現(xiàn),這個觀測是否應(yīng)該被舍棄?當(dāng)誤差的分布是偏斜的,是否應(yīng)該對其進(jìn)行一些變換?在異方差性存在的情況下,是否應(yīng)該使用加權(quán)最小二乘法(weighted-least-square)以解決這一問題?當(dāng)非線性問題存在時,是否應(yīng)該使用次方轉(zhuǎn)換(power transformation)?在面對這些重要的問題時,應(yīng)盡量避免使用機械的權(quán)宜方法。正如作者在本書中不斷強調(diào)的,這些方法永遠(yuǎn)不能取代判別和思想。
為了使得解釋更加豐富,福克斯利用了許多數(shù)據(jù)作為例子:美國的人口普查,職業(yè)聲望,人們報告的體重,加拿大公司中連鎖的董事會。 這些例子使得本書中的診斷適用于廣大的回歸方法使用者。此外,對那些有意受到更高級訓(xùn)練的讀者,可以在附錄中尋找答案(例如:對用于解決高度共線性的嶺回歸(ridge regression)的評估)。每一個使用回歸分析的都理所應(yīng)當(dāng)?shù)男枰M(jìn)行一系列回歸診斷。而這本專著也可謂是對回歸診斷介紹中的巔峰之作。
約翰·福克斯(John Fox)
加拿大多倫多市約克大學(xué)的社會學(xué)、數(shù)學(xué)和統(tǒng)計學(xué)教授,并擔(dān)任社會調(diào)查研究所統(tǒng)計咨詢服務(wù)協(xié)調(diào)人。目前的研究工作主要包括統(tǒng)計學(xué)方法與加拿大的政治經(jīng)濟學(xué)研究。
序
第1章 概論
第2章 最小二乘回歸
第1節(jié) 回歸模型
第2節(jié) 最小二乘估計
第3節(jié) 回歸系數(shù)的統(tǒng)計推論
第4節(jié) 一般線性模型
第3章 共線性
第1節(jié) 共線性與方差膨脹
第2節(jié) 對共線性的處理:沒有速效方法
第4章 奇異值與強影響數(shù)據(jù)
第1節(jié) 測量影響力:預(yù)測值
第2節(jié) 查找奇異值:學(xué)生殘差
第3節(jié) 測量影響程度:Cook距離與其他診斷方法
第4節(jié) 診斷統(tǒng)計量中的數(shù)值截斷點
第5節(jié) 聯(lián)合的強影響觀測子集:偏回歸圖
第6節(jié) 非同尋常的數(shù)據(jù)應(yīng)該被拋棄嗎?
第5章 非正態(tài)分布誤差
第1節(jié) 殘差的正態(tài)分位數(shù)比較散點圖
第2節(jié) 殘差的直方圖
第3節(jié) 通過轉(zhuǎn)換矯正不對稱
第6章 不一致的誤差方差
第1節(jié) 尋找不一致的誤差方差
第2節(jié) 矯正不一致的誤差方差
第7章 非線性
第1節(jié) 殘差與偏殘差散點圖
第2節(jié) 進(jìn)行線性轉(zhuǎn)換
第8章 離散數(shù)據(jù)
第1節(jié) 檢驗非線性
第2節(jié) 檢驗不一致誤差方差
第9章 最大似然法、計分檢驗和構(gòu)造變量
第1節(jié) y的Box-Cox轉(zhuǎn)換
第2節(jié) 對x的Box-Tidwell轉(zhuǎn)換
第3節(jié) 對不一致誤差方差的矯正
第10章 建議
第1節(jié) 計算診斷量
第2節(jié) 延伸閱讀
附錄
參考文獻(xiàn)
譯名對照表