《統(tǒng)計模型:理論和實踐(原書第2版)》是一本優(yōu)秀的統(tǒng)計模型教材,著重講解線性模型的應用問題,包括廣義最小二乘和兩步最小二乘模型,以及二分變量的probit及l(fā)ogit模型的應用。《統(tǒng)計模型:理論和實踐(原書第2版)》還包括關(guān)于研究設計、二分變量回歸及矩陣代數(shù)的背景知識。此外,《統(tǒng)計模型:理論和實踐(原書第2版)》附有大量的練習,并且其中多數(shù)練習題在書后都有答案,便于讀者學習、鞏固和提高。
《統(tǒng)計模型:理論和實踐(原書第2版)》適合作為統(tǒng)計專業(yè)高年級本科生和低年級研究生線性模型課程的教材,同時也適合作為相關(guān)領(lǐng)域研究人員的參考書。
讀這本書是一種完完全全的享受。自從伯克利加利福尼亞大學統(tǒng)計系郁彬教授在2008年向我推薦這本書之后,我一開始期望的是一本數(shù)學味很強的標準回歸分析教材。后來,完全出乎意外,這本書竟然是我多年來企圖尋找卻又不可得的涉及回歸分析甚至統(tǒng)計領(lǐng)域核心問題的一本以不尋常的清楚明白方式寫的傳奇式的讀物。 一眼就可以看出該書是出自大家的手筆。在應用統(tǒng)計于科學、醫(yī)學和社會科學等領(lǐng)域方面,幾十年來,本書作者David Freedman都一直被譽為統(tǒng)計的良心。該書是他在研究生命最旺盛的時期寫的,代表了當代應用回歸教科書的最高水平。作者不僅在伯克利,而且在世界許多高校都使用該教材講過回歸。多年的應用經(jīng)驗和教學實踐使得該書內(nèi)容豐富,語言平易近人,易教易學。該書的實際例子和練習題是精心挑選的,對掌握該書的內(nèi)容不可或缺。
通常的回歸或統(tǒng)計模型教材,無論標以理論或是應用的標簽,往往對模型附加了很多假定,但又從來不解釋如果這些假定不滿足,則會發(fā)生什么問題或災難。這本書不但不回避這些一般教師避之唯恐不及的關(guān)于模型的設置和假定等敏感問題,而且專門對各個領(lǐng)域最著名的、最有影響的文章的模型設置及各種假定進行認真的剖析。讀這本書對于教師、學生,特別是實際工作者皆是一種心靈的震撼。我相信,任何有心人讀了這本書之后,都會在未來涉及回歸的課題上倍加小心,避免發(fā)生各種根本意想不到的錯誤。這本書會使許多人受益不淺,功德無量。
我對這本書的翻譯是在2009年David Freedman去世之后,當時還不知道他在去世前已經(jīng)定稿了修訂版。因此,我先翻譯了初版,后來又翻譯了這一版。我恐怕是本書最忠實的中國讀者之一。我希望那些在中國大學教本科生或者研究生回歸模型課程的教師,能夠以本書作為教材或者主要參考書,使得學生能夠直接受益于國際一流統(tǒng)計大師的經(jīng)驗與智慧。
弗里曼(David A.Freedman),(1 938-2008)是加州大學伯克利分校的統(tǒng)計學教授。他是杰出的數(shù)理統(tǒng)計學家,其研究范圍包括鞅不等式分析、Markov過程、抽樣、自助法等。他是美國科學院院士。在2003年,他獲得了美國科學院授予的John J.Carty科學進步獎,以表彰他對統(tǒng)計理論和實踐做出的貢獻。
譯者序
引言
第2版序
前言
第1章 觀測研究和實驗1
1.1 引言1
1.2 HIP試驗2
1.3 關(guān)于霍亂的研究4
1.4 Yule關(guān)于貧困原因的研究6
1.5 札記9
第2章 回歸線12
2.1 引言12
2.2 回歸線12
2.3 胡克定律14
2.4 復雜性15
2.5 比較簡單回歸和多元回歸17
2.6 札記19
第3章 矩陣代數(shù)20
3.1 引言20
3.2 行列式及逆21
3.3 隨機向量24
3.4 正定矩陣25
3.5 正態(tài)分布27
3.6 關(guān)于矩陣代數(shù)的書28
第4章 多元回歸29
4.1 引言29
4.2 標準誤差32
4.3 多元回歸中被解釋的方差35
4.4 如果假定不滿足,OLS將會如何37
4.5 供討論的問題37
4.6 札記41
第5章 多元回歸:特別主題42
5.1 引言42
5.2 OLS是BLUE42
5.3 廣義最小二乘43
5.4 GLS的例子44
5.5 如果假定不滿足,GLS將會如何46
5.6 正態(tài)理論46
5.7 F檢驗49
5.8 數(shù)據(jù)窺視51
5.9 供討論的問題52
5.10 札記54
第6章 路徑模型56
6.1 分層56
6.2 再看胡克定律59
6.3 麥卡錫時代的政治回歸60
6.4 用回歸對因果關(guān)系做推斷62
6.5 路徑圖的響應方案64
6.6 啞變量70
6.7 供討論的問題71
6.8 札記75
第7章 最大似然78
7.1 引言78
7.2 probit模型82
7.3 logit模型86
7.4 天主教學校的效應88
7.5 供討論的問題96
7.6 札記101
第8章 自助法105
8.1 引言105
8.2 為能源需求模型做自助法112
8.3 札記117
第9章 聯(lián)立方程119
9.1 引言119
9.2 工具變量122
9.3 估計黃油模型124
9.4 什么是兩步125
9.5 社會科學例子:教育和生育126
9.6 協(xié)變量129
9.7 線性概率模型130
9.8 關(guān)于IVLS更多的討論132
9.9 供討論的問題134
9.10 札記139
第10章 統(tǒng)計建模中的問題141
10.1 引言141
10.2 批評的文獻143
10.3 響應方案146
10.4 評估第7~9章的模型147
10.5 總結(jié)147
參考文獻148
部分練習答案163
計算機實驗204
附錄 MATLAB代碼樣本216
參考論文220
在觀測研究中,對象把自己安排到不同的組中。研究人員僅僅觀測發(fā)生了什么。例如,吸煙效應的研究必須是觀測性的。然而,這里仍然使用處理一控制這一術(shù)語。研究人員通過比較屬于處理組(也稱為暴露組(exposed group))的吸煙者及屬于控制組的非吸煙者來確定吸煙的效應。這些行話有些令人迷惑,因為“控制”這個詞有兩個意思:
。1)控制是沒有得到處理的對象。
。2)控制試驗是研究人員決定誰將在處理組的研究。
和非吸煙者比較,吸煙者結(jié)果很糟糕。心臟病、肺癌等疾病在吸煙者中要更加常見。在吸煙和疾病之間有很強的關(guān)聯(lián)(association)。如果香煙造成疾病,這就解釋了這個關(guān)聯(lián),即吸煙者死亡率高是因為香煙有害。一般來說,關(guān)聯(lián)是因果關(guān)系的情況證據(jù)(circumstance evi-dence)。然而,證明是不完全的。可能會有某種隱藏的混雜因素,使得人們又吸煙又得病。如果是這樣,沒有必要停止研究:這不會改變隱藏的因素。關(guān)聯(lián)和因果關(guān)系不同。