日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

利用EXCEL函數(shù)LINEST進(jìn)行統(tǒng)計(jì)學(xué)中的回歸分析 | 實(shí)戰(zhàn)統(tǒng)計(jì)學(xué)

 imelee 2015-09-19

介紹統(tǒng)計(jì)學(xué)中的一元和多元線性回歸,并通過(guò)EXCEL自帶的統(tǒng)計(jì)函數(shù)LINEST、INDEX進(jìn)行手工計(jì)算,再通過(guò)EXCEL數(shù)據(jù)分析工具包進(jìn)行自動(dòng)計(jì)算。

由于很多復(fù)雜的EXCEL自動(dòng)化程序,需要用到自動(dòng)化計(jì)算,EXCEL數(shù)據(jù)分析工具并不適用自動(dòng)計(jì)算,反而EXCEL統(tǒng)計(jì)函數(shù)是很容易實(shí)現(xiàn)批量自動(dòng)計(jì)算。

所以本文重點(diǎn)介紹EXCEL統(tǒng)計(jì)函數(shù)的使用。

統(tǒng)計(jì)學(xué)上的線性回歸原理簡(jiǎn)介

回歸是研究一個(gè)隨機(jī)變量y對(duì)另一個(gè)(x)或一組(x1,x2,…,xn)變量的相依關(guān)系的統(tǒng)計(jì)分析方法。其中y又叫因變量,x叫自變量。

簡(jiǎn)單的記憶方法:x是自身可以變動(dòng)的,y是因?yàn)閤的變化而變化的,就不會(huì)把自變量和因變量的意義搞亂。

線性回歸是自變量與因變量之間是線性關(guān)系的回歸。

一般來(lái)說(shuō),因變量只有一個(gè),自變量會(huì)有一個(gè)或多個(gè)。下面就按因變量的數(shù)量及類別為分:一元線性回歸、多元線性回歸。

一元線性回歸

一元線性回歸是指一個(gè)因變量y只與一個(gè)自變量x有相關(guān)關(guān)系,通過(guò)公式可以表示為如下圖:

一元線性回歸

其中a稱為斜率,b稱為截距。

它的意思是當(dāng)x增減一個(gè)單位時(shí),y會(huì)同樣增減a個(gè)單位的x,如a=2時(shí),x增加一個(gè)單位,y就增加2個(gè)單位x。

通過(guò)EXCEL統(tǒng)計(jì)函數(shù)LINEST來(lái)實(shí)現(xiàn)一元線性回歸分析,在EXCEL的A1到B10輸入如下數(shù)據(jù):

x y
1.1 200
1.9 245
2.5 367
4 400
4.5 550
5 540
5.9 667
7 770
1 210

使用LINEST線性回歸函數(shù)進(jìn)行手工計(jì)算。

LINEST函數(shù)可通過(guò)使用最小二乘法計(jì)算與現(xiàn)有數(shù)據(jù)最佳擬合的直線,來(lái)計(jì)算某直線的統(tǒng)計(jì)值,然后返回描述此直線的數(shù)組。

也可以將 LINEST 與其他函數(shù)結(jié)合使用來(lái)計(jì)算未知參數(shù)中其他類型的線性模型的統(tǒng)計(jì)值,包括多項(xiàng)式、對(duì)數(shù)、指數(shù)和冪級(jí)數(shù)。因?yàn)榇撕瘮?shù)返回?cái)?shù)值數(shù)組,所以必須以數(shù)組公式的形式輸入。

LINEST語(yǔ)法

LINEST(known_y’s, [known_x's], [const], [stats])

  • Known_y’s 必需。關(guān)系表達(dá)式 y = mx + b 中已知的 y 值集合。如果 known_y’s 對(duì)應(yīng)的單元格區(qū)域在單獨(dú)一列中,則 known_x’s 的每一列被視為一個(gè)獨(dú)立的變量。如果 known_y’s 對(duì)應(yīng)的單元格區(qū)域在單獨(dú)一行中,則 known_x’s 的每一行被視為一個(gè)獨(dú)立的變量。
  • Known_x’s 可選。關(guān)系表達(dá)式 y = mx + b 中已知的 x 值集合。known_x’s 對(duì)應(yīng)的單元格區(qū)域可以包含一組或多組變量。如果僅使用一個(gè)變量,那么只要 known_y’s 和 known_x’s 具有相同的維數(shù),則它們可以是任何形狀的區(qū)域。如果使用多個(gè)變量,則 known_y’s 必須為向量(即必須為一行或一列)。如果省略 known_x’s,則假設(shè)該數(shù)組為 {1,2,3,…}, 其大小與 known_y’s 相同。
  • const 可選。一個(gè)邏輯值,用于指定是否將常量 b 強(qiáng)制設(shè)為 0。如果 const 為 TRUE 或被省略,b 將按通常方式計(jì)算。如果 const 為 FALSE,b 將被設(shè)為 0,并同時(shí)調(diào)整 m 值使 y = mx。
  • stats 可選。一個(gè)邏輯值,用于指定是否返回附加回歸統(tǒng)計(jì)值。如果 stats 為 TRUE,則 LINEST 函數(shù)返回附加回歸統(tǒng)計(jì)值,這時(shí)返回的數(shù)組為 {mn,mn-1,…,m1,b;sen,sen-1,…,se1,seb;r2,sey;F,df;ssreg,ssresid}。如果 stats 為 FALSE 或被省略,LINEST 函數(shù)只返回系數(shù) m 和常量 b。

附加回歸統(tǒng)計(jì)值如下:

統(tǒng)計(jì)值 說(shuō)明
se1,se2,…,sen 系數(shù) m1,m2,…,mn 的標(biāo)準(zhǔn)誤差值。
seb 常量 b 的標(biāo)準(zhǔn)誤差值(當(dāng) const 為 FALSE 時(shí),seb = #N/A)。
r2 判定系數(shù)。y 的估計(jì)值與實(shí)際值之比,范圍在 0 到 1 之間。如果為 1,則樣本有很好的相關(guān)性,y 的估計(jì)值與實(shí)際值之間沒(méi)有差別。相反,如果判定系數(shù)為 0,則回歸公式不能用來(lái)預(yù)測(cè) y 值。
sey Y 估計(jì)值的標(biāo)準(zhǔn)誤差。
F F 統(tǒng)計(jì)或 F 觀察值。使用 F 統(tǒng)計(jì)可以判斷因變量和自變量之間是否偶爾發(fā)生過(guò)可觀察到的關(guān)系。
df 自由度。用于在統(tǒng)計(jì)表上查找 F 臨界值。將從表中查得的值與 LINEST 函數(shù)返回的 F 統(tǒng)計(jì)值進(jìn)行比較可確定模型的置信區(qū)間。有關(guān)如何計(jì)算 df 的信息,請(qǐng)參閱本主題下文中的“說(shuō)明”。
ssreg 回歸平方和。
ssresid 殘差平方和。

下面的圖示顯示了附加回歸統(tǒng)計(jì)值返回的順序。

附加回歸統(tǒng)計(jì)值

在任意單元格中輸入=LINEST(B2:B10,A2:A10,TRUE,TRUE),計(jì)算得出來(lái)的結(jié)果為94.33。Linest函數(shù)直接計(jì)算,返回的是第一個(gè)自變量的系數(shù),LINEST返回的是一個(gè)數(shù)組,即上述的圖表。

如果要通過(guò)EXCEL數(shù)組來(lái)實(shí)現(xiàn)這種功能。選定A14:B18,在EXCEL地址欄輸入=LINEST(B2:B10,A2:A10,TRUE,TRUE),然后同時(shí)按CTRL+SHIFT+ENTER,返回一個(gè)表格,表格中的每個(gè)單元格的公式顯示為:{=LINEST(B2:B10,A2:A10,TRUE,TRUE)}

94.34 93.92
6.20 25.89
0.97 37.62
231.78 7
328,061.71 9,907.85

對(duì)應(yīng)上表及上述的圖,解釋上表的各個(gè)參數(shù)的意義。

  • 94.34就是x的系數(shù)a,
  • 93.92為截距b,
  • 6.2為x的系數(shù)a的標(biāo)準(zhǔn)誤差值,
  • 25.89為截距(常量)b的標(biāo)準(zhǔn)誤差值,
  • 0.97為相關(guān)系數(shù),
  • 37.62為y估計(jì)值的標(biāo)準(zhǔn)誤差,
  • 231.78為F統(tǒng)計(jì)值
  • 7為自由度,
  • 328061.71為回歸平方和,
  • 9907.85為殘差平方和。

上述返回的統(tǒng)計(jì)值,最常用的是自變量的系數(shù)a和常量b,如果在EXCEL自動(dòng)化程序中,很少會(huì)用上述的返回一個(gè)表格的方式,因?yàn)長(zhǎng)INEST返回的是一個(gè)數(shù)組,可以通過(guò)index函數(shù)取得數(shù)組中的每一個(gè)值。

x的系數(shù)a可以在任意單元格式輸入=INDEX(LINEST(B2:B10,A2:A10,TRUE,TRUE),1,1),截距b可以在任意單元格式輸入=INDEX(LINEST(B2:B10,A2:A10,TRUE,TRUE),1,2),index函數(shù)第一個(gè)參數(shù)是指定一個(gè)數(shù)組,第二和第三個(gè)參數(shù)是指定返回的行列位置。

所以上述的一元線性回歸的擬合直線函數(shù)為y=94.34x+93.92,相關(guān)系數(shù)為0.97。

多元線性回歸

多元線性回歸是指一個(gè)因變量y只與多個(gè)自變量x有線性相關(guān)關(guān)系,通過(guò)公式可以表示為如下圖:

多元線性回歸

a為每個(gè)自變量對(duì)因變量y的影響因素,我們以二元線性回歸為例,用EXCEL函數(shù)LINEST進(jìn)行分析。數(shù)據(jù)如下,填充在EXCEL的A1:C10中。

x1 x2 y
4 1.1 200
7 1.9 245
11 2.5 367
14 4 400
19 4.5 550
22 5 540
22 5.9 667
25 7 770
5 1 210

選定A14:C18,在地址欄中輸入=LINEST(C2:C10,A2:B10,TRUE,TRUE),按CTRL+SHIFT+ENTER,返回一個(gè)表格,表格中的每個(gè)單元格的公式顯示為:{=LINEST(C2:C10,A2:B10,TRUE,TRUE)},如下表:

69.17 6.88 87.37
34.05 9.14 28.11
0.9732 38.84 #N/A
109.00 6.00 #N/A
328,916.50 9,053.05 #N/A

此表格和一元線性回歸的表格一樣,只是多了一列,因?yàn)槎嗔艘粋€(gè)自變量。多出一列的內(nèi)容是另一個(gè)自變量的系數(shù)和它的標(biāo)準(zhǔn)誤差值。同樣可以通過(guò)用INDEX函數(shù)取得數(shù)據(jù)的每一個(gè)值。根據(jù)上表可以得到擬合的線性回歸函數(shù)y=69.17×1+6.88×2+87.37

用EXCEL數(shù)據(jù)分析工具進(jìn)行回歸分析

接下來(lái)通過(guò)EXCEL數(shù)據(jù)分析工具實(shí)現(xiàn)上述一元線性回歸分析的計(jì)算,并可以驗(yàn)證上述的計(jì)算過(guò)程。如果你的EXCEL中找不到數(shù)據(jù)分析,請(qǐng)先為EXCEL添加數(shù)據(jù)分析工具的加載宏。

 

  • 選中A1:B10,打開(kāi)數(shù)據(jù)分析,選中“回歸”后,點(diǎn)擊“確定”按鈕。EXCEL數(shù)據(jù)分析工具-回歸
  • 按下圖填寫(xiě)好自變量X、因變量Y的區(qū)域A1:A10,B1:B10,選擇“標(biāo)志”,意思是說(shuō)表格中包括有表頭字段,填寫(xiě)輸出區(qū)域A26,點(diǎn)擊“確定”后即可。EXCEL數(shù)據(jù)分析工具-回歸
  • 結(jié)果如下,可以清晰的看到用LINEST計(jì)算出來(lái)的結(jié)果與數(shù)據(jù)分析工具分析得到的結(jié)果是一樣的。
    EXCEL數(shù)據(jù)分析工具-回歸

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多