一、直線回歸分析
直線回歸是用直線回歸方程表示兩個(gè)數(shù)量變量間依存關(guān)系的統(tǒng)計(jì)分析方法,屬雙變量分析的范疇。
1. 直線回歸方程的求法
?。?)回歸方程的概念:
直線回歸方程的一般形式是Ý(音y hat)=a+bx,其中x為自變量,一般為資料中能精確測(cè)定和控制的量,Y為應(yīng)變量,指在x規(guī)定范圍內(nèi)隨機(jī)變化的量。a為截距,是回歸直線與縱軸的交點(diǎn),b為斜率,意為x每改變一個(gè)單位時(shí),Ý的變化量。
(2)直線回歸方程的求法
確定直線回歸方程利用的是最小二乘法原理,基本步驟為:
1)先求 b,基本公式為b=lxy/lxx=SSxy/SSxx ,其中l(wèi)xy為X,Y的離均差積和,lxx為X的離均差平方和;
2)再求a,根據(jù)回歸方程 a等于Y的均值減去x均值與b乘積的差值。
(3)回歸方程的圖示:
根據(jù)回歸方程,在坐標(biāo)軸上任意取相距較遠(yuǎn)的兩點(diǎn),連接上述兩點(diǎn)就可得到回歸方程的圖示。應(yīng)注意的是,連出的回歸直線不應(yīng)超過(guò)x的實(shí)測(cè)值范圍.
2. 回歸關(guān)系的檢驗(yàn)
回歸關(guān)系的檢驗(yàn)又稱回歸方程的檢驗(yàn),其目的是檢驗(yàn)求得的回歸方程在總體中是否成立,即是否樣本代表的總體也有直線回歸關(guān)系。方法有以下兩種:
(1)方差分析
其基本思想是將總變異分解為SS回歸和SS剩余,然后利用F檢驗(yàn)來(lái)判斷回歸方程是否成立。
(2)t檢驗(yàn)
其基本思想是利用樣本回歸系數(shù)b與總體均數(shù)回歸系數(shù)ß進(jìn)行比較來(lái)判斷回歸方程是否成立,實(shí)際應(yīng)用中因?yàn)榛貧w系數(shù)b的檢驗(yàn)過(guò)程較為復(fù)雜,而相關(guān)系數(shù)r的檢驗(yàn)過(guò)程簡(jiǎn)單并與之等價(jià),故一般用相關(guān)系數(shù)r的檢驗(yàn)來(lái)代替回歸系數(shù)b的檢驗(yàn)。
3. 直線回歸方程的應(yīng)用
(1)描述兩變量之間的依存關(guān)系;
利用直線回歸方程即可定量描述兩個(gè)變量間依存的數(shù)量關(guān)系
(2)利用回歸方程進(jìn)行預(yù)測(cè);
把預(yù)報(bào)因子(即自變量x)代入回歸方程對(duì)預(yù)報(bào)量(即因變量Y)進(jìn)行估計(jì),即可得到個(gè)體Y值的容許區(qū)間。
(3)利用回歸方程進(jìn)行統(tǒng)計(jì)控制
規(guī)定Y值的變化,通過(guò)控制x的范圍來(lái)實(shí)現(xiàn)統(tǒng)計(jì)控制的目標(biāo)。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過(guò)控制汽車流量來(lái)控制空氣中NO2的濃度。
4. 應(yīng)用直線回歸的注意事項(xiàng)
(1)做回歸分析要有實(shí)際意義;
(2)回歸分析前,最好先作出散點(diǎn)圖;
(3)回歸直線不要外延。
二、直線相關(guān)分析
1. 直線相關(guān)的概念
直線相關(guān)分析是描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。用以描述兩變量間相關(guān)關(guān)系的指標(biāo)是相關(guān)系數(shù)(常用r表示),兩變量間相關(guān)關(guān)系的種類有正相關(guān)(0<r<1)、負(fù)相關(guān)(-1<r<0)、零相關(guān)(r=0)、完全相關(guān)(|r|=1)等。相關(guān)分析對(duì)資料的要求是兩變量(x,y)均是符合正態(tài)分布的隨機(jī)變量。
2. 相關(guān)系數(shù)的計(jì)算
相關(guān)系數(shù)是x,Y的離均差積和lxy除以X的離均差平方和lxx與Y的離均差平方和lyy之積的算術(shù)平方根的商。故此相關(guān)系數(shù)又被稱為積差相關(guān)系數(shù)。
3.相關(guān)系數(shù)的假設(shè)檢驗(yàn)
相關(guān)系數(shù)檢驗(yàn)的目的是判斷兩變量的總體是否有相關(guān)關(guān)系,方法有t檢驗(yàn)和查表法,t檢驗(yàn)法是樣本與總體的比較,查表法是直接查相關(guān)系數(shù)界值表得到相應(yīng)的概率p。
三、直線相關(guān)與回歸的區(qū)別與聯(lián)系
區(qū)別:1. 相關(guān)說(shuō)明相關(guān)關(guān)系,回歸說(shuō)明依存關(guān)系;
2. r與b有區(qū)別;
3. 資料要求不同。
聯(lián)系:1. r與b值可相互換算;
2. r與b正負(fù)號(hào)一致;
3. r與b的假設(shè)檢驗(yàn)等價(jià);
4. 回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r2(又稱決定系數(shù))是回歸平方和與總的離均差平方和之比,故回歸平方和是引入相關(guān)變量后總平方和減少的部分。
四、等級(jí)相關(guān)分析
等級(jí)相關(guān)分析適用于資料不是正態(tài)雙變量或總體分布未知,數(shù)據(jù)一端或兩端有不確定值的資料或等級(jí)資料。常用的Spearman等級(jí)相關(guān)系數(shù)rs是利用x,Y的秩次來(lái)進(jìn)行直線相關(guān)分析的。因此當(dāng)x,Y的相同秩次較多時(shí),計(jì)算出的rs需矯正。同樣的,等級(jí)相關(guān)系數(shù)rs也需要進(jìn)行假設(shè)檢驗(yàn)。
五、相關(guān)分析應(yīng)用中的注意事項(xiàng)
1. 相關(guān)分析要有實(shí)際意義;
2. 相關(guān)關(guān)系不一定都是“因果”關(guān)系;
3. 相關(guān)系數(shù)r假設(shè)檢驗(yàn)中p的大小不能說(shuō)明相關(guān)的密切程度;
4. 直線相關(guān)和等級(jí)相關(guān)有各自不同的適用條件。
(陳滔)