本書通過大量統(tǒng)計(jì)圖表和手繪插圖,系統(tǒng)地介紹了統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí)和相應(yīng)公式,講解了各種統(tǒng)計(jì)方法及其應(yīng)用場景,并使用R 語言進(jìn)行了簡單實(shí)現(xiàn)。內(nèi)容涉及概率分布、假設(shè)檢驗(yàn)、置信區(qū)間估計(jì)、非參數(shù)方法和回歸分析等。全書圖文清晰直觀,基礎(chǔ)概念、統(tǒng)計(jì)方法和分析結(jié)果皆一目了然,是一本統(tǒng)計(jì)學(xué)入門佳作,旨在幫助讀者學(xué)習(xí)并應(yīng)用統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),為今后的深入學(xué)習(xí)打下基礎(chǔ)。同時(shí),本書 還設(shè)有統(tǒng)計(jì)學(xué)的歷史偉人傳等專欄,趣味性十足。
本書適合所有對(duì)統(tǒng)計(jì)學(xué)感興趣的讀者閱讀。初學(xué)者可以通過本書掌握基礎(chǔ)知識(shí),建立對(duì)統(tǒng)計(jì)學(xué)的整體印象;中級(jí)水平者可將本書用作參考手冊(cè),隨時(shí)翻閱以便查漏補(bǔ)缺。本書還可作為統(tǒng)計(jì)學(xué)相關(guān)專業(yè)師生的輔助讀物使用。
趣味圖解統(tǒng)計(jì)分析方法!
1.系統(tǒng)梳理362個(gè)基礎(chǔ)概念,網(wǎng)羅統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),內(nèi)容豐富
2.配有507張插圖幫助理解,直觀易懂,趣味性強(qiáng)
3.使用R語言實(shí)現(xiàn)電子表格軟件中無法實(shí)現(xiàn)的分析方法,幫助讀者輕松上手
如果把科學(xué)比作語言,那么統(tǒng)計(jì)學(xué)就是對(duì)語言來說不可或缺的語法。--現(xiàn)代統(tǒng)計(jì)學(xué)奠基人 卡爾·皮爾遜
栗原伸一(作者) 1966年出生于日本茨城縣水戶市,1996年獲得日本東京農(nóng)工大學(xué)研究生院農(nóng)學(xué)博士學(xué)位。2015年至今擔(dān)任日本千葉大學(xué)研究生院園藝學(xué)研究科教授。除統(tǒng)計(jì)學(xué)之外,還教授計(jì)量經(jīng)濟(jì)學(xué)、消費(fèi)者行為理論等課程。 丸山敦史(作者) 1972年出生于日本長野縣長野市,1996年日本千葉大學(xué)研究生院園藝學(xué)研究科碩士畢業(yè),2001年獲得日本千葉大學(xué)博士學(xué)位。2007年至今擔(dān)任日本千葉大學(xué)研究生院園藝學(xué)研究科副教授。除統(tǒng)計(jì)學(xué)之外,還教授經(jīng)濟(jì)數(shù)學(xué)、消費(fèi)者行為理論等課程。 侯振龍(譯者) 碩士畢業(yè),具有十年以上軟件行業(yè)從業(yè)經(jīng)驗(yàn),熱衷于研究軟件相關(guān)領(lǐng)域的數(shù)理內(nèi)容。
序章 何謂統(tǒng)計(jì)學(xué) 1
0.1 何謂統(tǒng)計(jì)學(xué) 2
0.2 統(tǒng)計(jì)學(xué)可以做什么 4
第 1章 描述統(tǒng)計(jì)學(xué) 7
1.1 各種平均數(shù) 8
1.2 數(shù)據(jù)的離散程度① 分位數(shù)和方差 10
1.3 數(shù)據(jù)的離散程度 ② 變異系數(shù) 12
1.4 變量的關(guān)聯(lián)性① 相關(guān)系數(shù) 14
1.5 變量的關(guān)聯(lián)性② 等級(jí)相關(guān) 16
第 2章 概率分布 19
2.1 概率和概率分布 20
2.2 概率相等的分布 均勻分布 22
2.3 投硬幣的分布 二項(xiàng)分布 23
2.4 鐘形分布 正態(tài)分布 24
2.5 無單位的分布 標(biāo)準(zhǔn)正態(tài)分布 26
2.6 掌握數(shù)據(jù)的位置 區(qū)間 29
2.7 分布的形態(tài) 偏度和峰度 30
2.8 隨機(jī)事件的分布 泊松分布 32
2.9 同時(shí)處理多個(gè)數(shù)據(jù) 卡方分布 34
2.10 卡方值的比 F 分布 36
2.11 代替正態(tài)分布 t 分布 37
第3章 推斷統(tǒng)計(jì)學(xué) 41
3.1 通過樣本獲取總體的特征 推斷統(tǒng)計(jì)學(xué) 42
3.2 巧妙估計(jì)總體參數(shù) 無偏估計(jì) 44
3.3 不受限制的數(shù)據(jù)個(gè)數(shù) 自由度 46
3.4 樣本統(tǒng)計(jì)量的分布① 平均數(shù)的分布 48
3.5 樣本統(tǒng)計(jì)量的分布② 比例的分布 50
3.6 樣本統(tǒng)計(jì)量的分布③ 方差的分布 51
3.7 樣本統(tǒng)計(jì)量的分布④ 相關(guān)系數(shù)的分布 52
3.8 與真值的差異 系統(tǒng)誤差和隨機(jī)誤差 54
3.9 關(guān)于樣本均值的兩大定理 大數(shù)定律和中心極限定理 56
第4章 置信區(qū)間估計(jì) 59
4.1 有范圍的估計(jì)① 總體均值的置信區(qū)間 60
4.2 有范圍的估計(jì)② 總體比例的置信區(qū)間 64
4.3 有范圍的估計(jì)③ 總體方差的置信區(qū)間 65
4.4 有范圍的估計(jì)④ 總體相關(guān)系數(shù)的置信區(qū)間 66
4.5 通過模擬來估計(jì)總體參數(shù) 自助法 68
第5章 假設(shè)檢驗(yàn) 71
5.1 判斷是否存在差異 假設(shè)檢驗(yàn) 72
5.2 兩種假設(shè) 零假設(shè)和備擇假設(shè) 74
5.3 假設(shè)檢驗(yàn)的步驟 76
5.4 指定的值(總體均值)和樣本均值的檢驗(yàn) 78
5.5 假設(shè)檢驗(yàn)中的兩類錯(cuò)誤 第 一類錯(cuò)誤和第二類錯(cuò)誤 84
5.6 指定的值(總體比例)和樣本比例的檢驗(yàn) 86
5.7 指定的值(總體方差)和樣本方差的檢驗(yàn) 87
5.8 真的有相關(guān)關(guān)系嗎? 不相關(guān)檢驗(yàn) 88
5.9 平均數(shù)差異的檢驗(yàn)① 兩獨(dú)立樣本的情形 90
5.10 平均數(shù)差異的檢驗(yàn)② 兩配對(duì)樣本的情形 96
5.11 比例之差的檢驗(yàn) 兩獨(dú)立樣本的情形 98
5.12 檢驗(yàn)非劣效 非劣效性試驗(yàn) 100
第6章 方差分析和多重比較 103
6.1 用實(shí)驗(yàn)確認(rèn)效應(yīng) 單因素方差分析 104
6.2 多個(gè)樣本的等方差檢驗(yàn) Bartlett 檢驗(yàn) 110
6.3 考慮個(gè)體差異 配對(duì)的單因素方差分析 112
6.4 找出交互作用 雙因素方差分析 114
6.5 不可以重復(fù)檢驗(yàn) 多重性 120
6.6 可重復(fù)的檢驗(yàn)(多重比較法)①
Bonferroni 校正法和Scheffe 法 122
6.7 可重復(fù)的檢驗(yàn)(多重比較法)②
Tukey 法和Tukey-Kramer 法 124
6.8 可重復(fù)的檢驗(yàn)(多重比較法)③ Dunnett 法 128
第7章 非參數(shù)方法 .131
7.1 不依賴于分布的檢驗(yàn) 非參數(shù)方法 132
7.2 品質(zhì)數(shù)據(jù)的檢驗(yàn) 獨(dú)立性檢驗(yàn)(皮爾遜卡方檢驗(yàn)) 136
7.3 22 交叉表的檢驗(yàn) Fisher 確切概率法 142
7.4 獨(dú)立的兩組定序數(shù)據(jù)的檢驗(yàn) 曼- 惠特尼U 檢驗(yàn) 144
7.5 配對(duì)的兩組定序數(shù)據(jù)的檢驗(yàn) 符號(hào)檢驗(yàn) 148
7.6 配對(duì)的兩組數(shù)值型數(shù)據(jù)的非參數(shù)檢驗(yàn) 威爾科克森符號(hào)秩檢驗(yàn) 150
7.7 獨(dú)立的多組定序數(shù)據(jù)的檢驗(yàn) Kruskal-Wallis 檢驗(yàn) 152
7.8 配對(duì)的多組定序數(shù)據(jù)的檢驗(yàn) Friedman 檢驗(yàn) 154
第8章 實(shí)驗(yàn)設(shè)計(jì)法 .157
8.1 費(fèi)歇爾三原則① 重復(fù) 158
8.2 費(fèi)歇爾三原則② 隨機(jī)化 160
8.3 費(fèi)歇爾三原則③ 局部控制 162
8.4 各種實(shí)驗(yàn)配置 164
8.5 減少實(shí)驗(yàn)次數(shù) 正交實(shí)驗(yàn)法 166
8.6 正交實(shí)驗(yàn)法的應(yīng)用① 質(zhì)量工程學(xué)(參數(shù)設(shè)計(jì)) 172
8.7 正交實(shí)驗(yàn)法的應(yīng)用② 聯(lián)合分析 174
8.8 樣本容量的確定方法 功效分析 176
第9章 回歸分析 185
9.1 探究因果關(guān)系 回歸分析 186
9.2 將數(shù)據(jù)套用到公式中 小二乘法 188
9.3 評(píng)估回歸線的精確度 決定系數(shù) 191
9.4 檢驗(yàn)回歸線的斜率 t 檢驗(yàn) 192
9.5 判斷分析的準(zhǔn)確度 殘差分析 195
9.6 原因有多個(gè)時(shí)的回歸分析 多元回歸分析 196
9.7 自變量之間的問題 多重共線性 198
9.8 選擇有效的自變量 變量選擇方法 200
9.9 解釋實(shí)質(zhì)區(qū)別的變量① 截距虛擬變量 201
9.10 解釋實(shí)質(zhì)區(qū)別的變量② 斜率虛擬變量 202
9.11 二值變量的回歸分析 Probit 分析 204
9.12 分析事件發(fā)生之前的時(shí)間① 存活曲線 208
9.13 分析事件發(fā)生之前的時(shí)間② 比較存活曲線 210
9.14 分析事件發(fā)生之前的時(shí)間③ Cox 回歸模型 211
第 10章 多變量分析 215
10.1 收集信息 主成分分析 216
10.2 發(fā)現(xiàn)潛在因素 因素分析 220
10.3 記述因果結(jié)構(gòu) 結(jié)構(gòu)方程模型 226
10.4 對(duì)個(gè)體進(jìn)行分類 聚類分析 234
10.5 分析品質(zhì)數(shù)據(jù)的關(guān)聯(lián)性 對(duì)應(yīng)分析 242
第 11章 貝葉斯統(tǒng)計(jì)學(xué)和大數(shù)據(jù) .247
11.1 活用知識(shí)和經(jīng)驗(yàn)的統(tǒng)計(jì)學(xué) 貝葉斯統(tǒng)計(jì)學(xué) 248
11.2 公式 貝葉斯定理 250
11.3 根據(jù)結(jié)果找原因 事后概率 252
11.4 使用新數(shù)據(jù)提高準(zhǔn)確性 貝葉斯更新 256
11.5 大數(shù)據(jù)分析① 大數(shù)據(jù) 258
11.6 大數(shù)據(jù)分析② 關(guān)聯(lián)分析 260
11.7 大數(shù)據(jù)分析③ 趨勢預(yù)測和SNS 分析 262
附錄A R 的安裝和使用方法 265
附錄B 統(tǒng)計(jì)數(shù)值表(分布表)、正交表、希臘字母 271
索引 287