《數據分析概論》研究對象是社會科學的研究數據。數據分析可以賦予事實意義,好的數據分析能為所研究的社會現象提供合理的描述和解釋。
本書旨在為定量研究數據分析的每一步提供統(tǒng)計學基礎。作者討論了數據搜集的意義、一元統(tǒng)計、對相關性的測量、顯著性檢驗、簡單和多元回歸,并給出了大量的數學公式,使得讀者能更好地理解這些內容。
《韋伯斯特大學辭典》(Websters New Collegiate Dictionary)把數據定義為一組事實。因此社會科學數據(經驗觀察)是關于人類行為世界的事實。與流行的看法相反,事實并不會自己說話。數據分析的任務是試圖給這些事實賦予意義。我之所以說試圖賦予意義是因為如果數據不好,它們就不能產生闡釋,或者是一個虛假的闡釋。假設數據很好,那么分析就能為所研究的社會現象提供一個合理的描述和解釋。
數據分析涉及對統(tǒng)計工具的系統(tǒng)運用。我們如何能夠獲得這些工具并恰當的使用它們?為了有效學習分析技巧,我們需要從最簡單的部分開始,以之作為構建更復雜技巧的基石。譬如,初學者經常犯的一個錯誤就是跳過基礎知識,直接進入多元回歸分析。為了學好多元回歸,你必須首先扎實的掌握一元和二元統(tǒng)計知識。通過學習例如兩個變量間的相關系數(皮爾森r系數),你就能熟悉相關、強度、線性、測量層次、推論和標準化等概念。這給理解二元回歸提供了基礎,二元回歸有點難,但不是很難。一旦熟悉掌握了二元回歸,擴展到多元回歸就比較容易,讀者對后者也會有更深的理解。
本書旨在為定量研究數據分析的每一步提供統(tǒng)計學基礎。在簡述數據搜集之后,作者討論一元統(tǒng)計(測量集中趨勢和離散)。之后又講解了對相關的測量(皮爾森r、tau和lambda系數)和顯著性檢驗,最后討論了簡單和多元回歸。本書給出了必要的數學公式,但更注重平實的解釋。同時,作者也利用圖表來幫助闡釋。貫穿全書的一個實用例子是基于一個大學生樣本數據來探討如何解釋學業(yè)能力。
回到本叢書的標題社會科學定量方法應用,本書可以看作是其他著作的一本入門書。本叢書的其他著作都對本書討論的主題進行了深入探討。譬如,關于數據搜集可參閱Kalton的Introduction to Survey Sampling (No. 35), Jacob的Using Published Data (No. 42), Kiecolt & Nathan的Secondary Analysis of Survey Data (No. 53), Converse & Presser的Survey Questions (No. 63),以及Bourque & Clark的Processing Data (No. 85);關于一元統(tǒng)計可參閱Weisberg的Central Tendency and Variability (No. 83)和Gibbons的Nonparametric Statistics (No. 90);有關二元統(tǒng)計可參閱Reynolds的Analysis of Nominal Data (No. 7),Hildebrand, Laing, & Rosenthal的Analysis of Ordinal Data (No. 8),Liebetrau的Measures of Association (No. 32)和Gibbons的Nonparametic Measures of Association (No. 91);關于顯著性檢驗可參閱Henkel的Tests of Significance (No. 4)和Mohr的Understanding Significance Testing (No. 73);關于回歸可參閱Lewis-Beck的Applied Regression (No. 22),Berry & Feldman的Multiple Regression in Practice (No. 50),Jaccard, Turrisi, & Wan的Interaction Effects in Multiple Regression (No. 72),Fox的Regression Diagnostics (No. 79),Berry的Understanding Regression Assumptions (No. 92)和Hardy的Regression With Dummy Variables (No. 93)。