定 價(jià):29 元
叢書(shū)名:西部數(shù)學(xué)規(guī)劃教材系列叢書(shū)
- 作者:唐年勝,李會(huì)瓊編著
- 出版時(shí)間:2014/1/1
- ISBN:9787030393753
- 出 版 社:科學(xué)出版社
- 中圖法分類:O212.1
- 頁(yè)碼:225
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:大32開(kāi)
回歸分析是研究變量之間相互關(guān)系的一種統(tǒng)計(jì)推斷方法,它在社會(huì)、經(jīng)濟(jì)、工程、醫(yī)藥衛(wèi)生、工農(nóng)業(yè)、氣象水文等領(lǐng)域有著廣泛的應(yīng)用!稇(yīng)用回歸分析》是高等院校"應(yīng)用回歸分析"課程的教材,結(jié)合實(shí)際案例和統(tǒng)計(jì)軟件較全面系統(tǒng)地介紹應(yīng)用回歸分析的基本理論、方法及其應(yīng)用!稇(yīng)用回歸分析》以最小二乘估計(jì)、極大似然估計(jì)、一元線性模型、多元線性模型、變量選擇以及缺失數(shù)據(jù)分析為主線,介紹數(shù)據(jù)建模過(guò)程及其預(yù)測(cè)!稇(yīng)用回歸分析》力求通俗易懂和實(shí)用性原則,注重理論與實(shí)際應(yīng)用相結(jié)合、盡可能多地引入應(yīng)用回歸分析的最新進(jìn)展和發(fā)展動(dòng)態(tài)。每章均配有適量的習(xí)題和計(jì)算機(jī)作業(yè),可供教師和學(xué)生選用。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
隨著計(jì)算機(jī)技術(shù)的快速發(fā)展與統(tǒng)計(jì)軟件的開(kāi)發(fā)使用,統(tǒng)計(jì)學(xué)在各行各業(yè)的應(yīng)用越來(lái)越廣泛。在這些應(yīng)用中,如何用統(tǒng)計(jì)的理論和方法對(duì)給定的數(shù)據(jù)建立一個(gè)與之相符的回歸模型呢?這是數(shù)據(jù)分析人員極為關(guān)心的一個(gè)重要問(wèn)題。為了回答這個(gè)問(wèn)題,本書(shū)首先從數(shù)據(jù)和變量的概念人手,深入淺出地介紹建立回歸模型的一般步驟,一元線性回歸模型與多元線性回歸模型的參數(shù)估計(jì)理論和方法以及自變量選擇,影響點(diǎn)和異常點(diǎn)的識(shí)別及處理,異方差性診斷和自相關(guān)性問(wèn)題及處理、多重共線性問(wèn)題及處理,多元線性回歸模型的有偏估計(jì),非線性回歸模型和含定性變量的回歸模型的參數(shù)估計(jì)理論、方法及算法,以及廣義線性回歸模型和缺失數(shù)據(jù)模型的統(tǒng)計(jì)分析等。這些內(nèi)容為數(shù)據(jù)分析人員提供了一個(gè)完整的數(shù)據(jù)處理過(guò)程以及建立統(tǒng)計(jì)回歸模型的技巧和方法。
盡管國(guó)內(nèi)已有一些介紹回歸分析的專著和教材,但他們大都用常見(jiàn)的統(tǒng)計(jì)軟件,如SPSS、EXccl、Matlab等來(lái)介紹其回歸分析的理論和方法。由于R軟件不僅免費(fèi)使用,而且它還擁有世界各地統(tǒng)計(jì)學(xué)家貢獻(xiàn)的大量最新軟件包且這些軟件包的代碼都是公開(kāi)的,因此,R軟件備受各國(guó)統(tǒng)計(jì)學(xué)家的廣泛關(guān)注。目前國(guó)內(nèi)也有一些基于R軟件來(lái)介紹數(shù)據(jù)分析的教材,但沒(méi)有系統(tǒng)地介紹回歸分析的理論和方法。而本書(shū)所有的分析都是通過(guò)R軟件來(lái)實(shí)現(xiàn)的,這就大大地增加了本書(shū)的實(shí)用性,這也是本書(shū)的一大特色。
為使學(xué)生了解回歸分析的最新發(fā)展和適應(yīng)新時(shí)期下社會(huì)對(duì)統(tǒng)計(jì)學(xué)發(fā)展的新需要,本書(shū)增加了一些國(guó)內(nèi)其他回歸分析教材中沒(méi)有的,但是新近發(fā)展的且學(xué)生不難理解并富有實(shí)用價(jià)值的內(nèi)容,如缺失數(shù)據(jù)模型的自變量選擇、參數(shù)估計(jì)及其應(yīng)用、廣義線性回歸模型及其參數(shù)估計(jì)和應(yīng)用等。這些內(nèi)容在社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、教育學(xué)、心理學(xué)和抽樣調(diào)查等領(lǐng)域有著廣泛的應(yīng)用。
本書(shū)收集、編寫大量的實(shí)際例子,所用的數(shù)據(jù)例子都可以在《中國(guó)統(tǒng)計(jì)年鑒》網(wǎng)站上找到,并且包括最新的數(shù)據(jù),如20u年的數(shù)據(jù)等,每一數(shù)據(jù)例子都配有相應(yīng)的R程序。這些例子還反映了回歸分析方法應(yīng)用的很多方面的問(wèn)題。同時(shí),本書(shū)各章還附有習(xí)題。這對(duì)培養(yǎng)學(xué)生的動(dòng)手能力和應(yīng)用所學(xué)知識(shí)解決實(shí)際問(wèn)題的能力都是非常有益的。
本書(shū)力求理論結(jié)合實(shí)際例子講授回歸分析方法的直觀意義、來(lái)龍去脈、什么問(wèn)題用什么方法解決以及證明的思路。有的證明放在本書(shū)習(xí)題中,請(qǐng)學(xué)生參閱有關(guān)書(shū)目或自行完成。
本書(shū)除了作為統(tǒng)計(jì)學(xué)專業(yè)本科生的教學(xué)用書(shū),還可作為應(yīng)用統(tǒng)計(jì)碩士的教學(xué)用書(shū),也可作為從事統(tǒng)計(jì)理論研究和實(shí)際應(yīng)用的統(tǒng)計(jì)工作者、教師和學(xué)生的教學(xué)參考書(shū)。此外,本書(shū)還可作為從事社會(huì)學(xué)、教育學(xué)、心理學(xué)、經(jīng)濟(jì)學(xué)、金融學(xué)、人口學(xué)、生物醫(yī)學(xué)以及臨床研究等領(lǐng)域的理論研究者和實(shí)際應(yīng)用者的參考書(shū)。
感謝科學(xué)出版社成都有限責(zé)任公司郝玉龍編輯。
由于編寫時(shí)間緊且編者水平有限,書(shū)中難免有不足之處,敬請(qǐng)讀者和同行批評(píng)指正。
唐年勝 李會(huì)瓊
2013年9月17日于昆明
1.4 建立回歸模型的步驟
一般來(lái)說(shuō),對(duì)一個(gè)實(shí)際問(wèn)題建立回歸模型,需要考慮下面六個(gè)步驟。
第一步:根據(jù)研究目的,設(shè)置指標(biāo)變量
回歸模型主要是用來(lái)揭示事物間相關(guān)變量的數(shù)量關(guān)系。首先要根據(jù)所研究的問(wèn)題設(shè)置因變量y,然后再選取與y有統(tǒng)計(jì)關(guān)系的一些變量作為自變量。
通常情況下,我們希望因變量與自變量之間具有因果關(guān)系。尤其是在研究具體實(shí)際問(wèn)題時(shí),我們必須根據(jù)實(shí)際問(wèn)題的研究目的,確定實(shí)際問(wèn)題中各因素之間的因果關(guān)系。
對(duì)于一個(gè)具體的問(wèn)題,當(dāng)研究目的確定后,被解釋變量容易確定,被解釋變量一般直接表達(dá)、刻畫研究目的。另外,不要認(rèn)為一個(gè)回歸模型所涉及的解釋變量越多越好。一個(gè)經(jīng)濟(jì)模型,如果把一些主要變量漏掉肯定會(huì)影響模型的應(yīng)用效果,但如果引入的變量太多,可能會(huì)選擇一些與問(wèn)題無(wú)關(guān)的變量,還可能由于一些變量的相關(guān)性很強(qiáng),它們所反映的信息有嚴(yán)重的重疊,這就有可能出現(xiàn)共線性問(wèn)題。當(dāng)變量太多時(shí),計(jì)算工作量太大,計(jì)算誤差就大,估計(jì)的模型參數(shù)精度自然不高。
總之,回歸變量的確定是一個(gè)非常重要的問(wèn)題,是建立回歸模型最基本的工作。這個(gè)工作一般一次并不能完全確定,通常要反復(fù)比較,最終選出最適合的一些變量。
第二步:收集、整理統(tǒng)計(jì)數(shù)據(jù)
回歸模型的建立是基于回歸變量的樣本統(tǒng)計(jì)數(shù)據(jù)。當(dāng)確定好回歸模型的變量之后,就要對(duì)這些變量進(jìn)行收集、整理和統(tǒng)計(jì)數(shù)據(jù)。數(shù)據(jù)的收集是建立回歸模型的重要環(huán)節(jié),數(shù)據(jù)質(zhì)量如何,對(duì)回歸模型有至關(guān)重要的影響。
常用的樣本數(shù)據(jù)分為時(shí)間序列數(shù)據(jù)和橫截面數(shù)據(jù)。
時(shí)間序列數(shù)據(jù),就是按時(shí)間順序排列的統(tǒng)計(jì)數(shù)據(jù)。如最近10年的CPI、PPI統(tǒng)計(jì)數(shù)據(jù)。時(shí)間序列數(shù)據(jù)容易產(chǎn)生模型中隨機(jī)誤差項(xiàng)的序列相關(guān),這是因?yàn)樵S多經(jīng)濟(jì)變量的前后期之間總是有關(guān)系的。如在建立需求模型時(shí),人們的消費(fèi)習(xí)慣、商品短缺程度等具有一定的延續(xù)性,它們對(duì)相當(dāng)一段時(shí)間的需求量有影響,這樣就產(chǎn)生隨機(jī)誤差項(xiàng)的序列相關(guān)。對(duì)于具有隨機(jī)誤差項(xiàng)序列相關(guān)的情況,最常用的處理方法是差分法,我們將在后面章節(jié)中詳細(xì)介紹。
橫截面數(shù)據(jù),即為在同一時(shí)間截面上的統(tǒng)計(jì)數(shù)據(jù)。如同一年份全國(guó)35個(gè)大中城市的物價(jià)指數(shù)等都是橫截面數(shù)據(jù)。當(dāng)用截面數(shù)據(jù)作樣本時(shí)、容易產(chǎn)生異方差性。這是因?yàn)橐粋(gè)回歸模型往往涉及許多解釋變量,如果其中某一因素或一些因素隨著解釋變量觀測(cè)值的變化而對(duì)被解釋變量產(chǎn)生不同影響,就產(chǎn)生異方差性。對(duì)于具有異方差性的建模問(wèn)題,數(shù)據(jù)整理就要注意消除異方差性,這常與模型參數(shù)估計(jì)方法結(jié)合起來(lái)考慮,
不論是時(shí)間序列數(shù)據(jù)還是橫截面數(shù)據(jù)的收集,樣本容量的多少一般要與設(shè)置的解釋變量數(shù)目相配套。通常為了使模型的參數(shù)估計(jì)更有效,要求樣本容量n大于解釋變量的個(gè)數(shù)p。樣本容量的個(gè)數(shù)小于解釋變量數(shù)目時(shí):普通的最小二乘法失效。
……