日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

影響成品鋼材需求量的回歸分析

 昵稱14979747 2014-08-06

摘要:隨著社會經濟的不斷發(fā)展,科學技術的不斷進步,統(tǒng)計方法越來越成為人們必不可收的工具盒手段。應用回歸分析是其中的一個重要分支,本著國家經濟水平的不斷提高,我們采用回歸分析的方法對我國成品鋼材的需求量進行分析應用。為了使分析的模型具有社會實際意義,我們引用了1980——1998年的成品鋼材、原油、生鐵、原煤、發(fā)電量、鐵路貨運量、固定資產投資額、居民消費、政府消費9個不同的量來進行回歸分析。通過建立回歸模型充分說明成品鋼材需求量與其他8個變量的關系,以及我國社會經濟的實際發(fā)展情況和意義。
關鍵字:線性回歸   回歸分析   社會經濟   回歸模型  成品鋼材   多元回歸       國家經濟  社會發(fā)展





















目        錄
第1章 題目敘述 1
第2章 問題假設 1
第3章 問題分析 2
第4章 數(shù)據的預處理 3
4.1 曲線統(tǒng)計圖 3
4.2 散點統(tǒng)計圖 4
4.3 樣本的相關系數(shù) 4
第5章 回歸模型的建立 5
第6章 回歸模型的檢驗 6
6.1 F檢驗 6
6.2 T檢驗 6
6.3 T檢驗分析 6
6.4 Chow斷點檢驗 8
6.5 Chow預測檢驗 8
 第7章 違背模型基本假設的情況 9
7.1 異方差性的檢驗 9
7.1.1殘差圖示檢驗 9
7.1.2 懷特(White)檢驗 9
7.2 自相關性的檢驗 10
7.2.1 LM檢驗 10
7.2.2 DW檢驗 10
第8章 自變量選擇與逐步回歸 10
8.1 前進逐步回歸法 10
8.1.1 前進逐步回歸 10
8.1.2 前進逐步回歸模型預測 11
8.2 后退逐步回歸法 12
8.2.1 后退逐步回歸 12
8.2.2 后退逐步回歸模型預測 13
第9章 多重共線性的診斷及消除 14
9.1 多重共線性的診斷 14
9.2 消除多重共線性 15
第10章 回歸模型總結 17
參考文獻 18
附錄: 19



 
影響成品鋼材需求量的回歸分析
第1章 題目敘述
 理論上認為影響成品鋼材的需求量的因素主要有經濟發(fā)展水平、收入水平、產業(yè)發(fā)展、人民生活水平提高、能源轉換技術等因素。為此,收集了我國成品鋼材的需求量,選擇與其相關的八個因素:原油產量、生鐵產量、原煤產量、發(fā)電量、鐵路貨運量、固定資產投資額、居民消費、政府消費作為影響變量,1980——1998年的有關數(shù)據如下表。本題旨在通過建立這些經濟變量的線性模型來說明影響成品鋼材需求量的原因。
    數(shù)據來源:易丹輝.數(shù)據分析與EViews應用.中國人民大學出版社.2008(教材第85頁)。
    原始數(shù)據(中國統(tǒng)計年鑒):
年份 成品鋼材(萬噸) 原油(萬噸) 生鐵(萬噸) 原煤(億噸) 發(fā)電量(億千瓦時) 鐵路貨運量(萬噸) 固定資產投資額(億元) 居民消費(億元)
1980 2716.2 10595 3802.4 6.2 3006.2 111279 910.9 2317.1
1981 2670.1 10122 3416.6 6.2 3092.7 107673 961 2604.1
1982 2902 10212 3551 6.66 3277 113495 1230.4 2867.9
1983 3072 10607 3738 7.15 3514 118784 1430.1 3182.5
1984 3372 11461.3 4001 7.89 3770 124074 1832.9 3674.5
1985 3693 12489.5 4384 8.72 4107 130709 2543.2 4589
1986 4058 13068.8 5064 8.94 4495 135635 3120.6 5175
1987 4356 13414 5503 9.28 4973 140653 3791.7 5961.2
1988 4689 13704.6 5704 9.8 5452 144948 4753.8 7633.1
1989 4859 13764.1 5820 10.54 5848 151489 4410.4 8523.5
1990 5153 13830.6 6238 10.8 6212 150681 4517 9113.2
1991 5638 14009.2 6765 10.87 6775 152893 5594.5 10315.9
1992 6697 14209.7 7589 11.16 7539 157627 8080.1 12459.8
1993 7716 14523.7 8739 11.51 8395 162663 13072.3 15682.4
1994 8482 14608.2 9741 12.4 9281 163093 17042.1 20809.8
1995 8979.8 15004.94 10529.27 13.61 10070.3 165885 20019.3 26944.5
1996 9338.02 15733.39 10722.5 13.97 10813.1 168803 22974 32152.3
1997 9978.93 16074.14 11511.41 13.73 11355.53 169734 22913.5 34854.6
說明:由于數(shù)據是經過人工錄入的,經反復對照沒有發(fā)現(xiàn)錯誤,因此就采用了此數(shù)據做回歸模型。但是也不能排除在錄入過程中會出現(xiàn)一些小的錯誤,所以回歸模型僅滿足上表數(shù)據。

第2章 問題假設
      為了問題的簡潔明了,現(xiàn)對題目中的變量給出以下假設:中國成品鋼材的需求量為 (萬噸)、原油產量 (萬噸)、生鐵產量 (萬噸)、原煤產量 (億噸)、發(fā)電量 (億千瓦時)、鐵路貨運量 (萬噸)、固定資產投資額 (億元)、居民消費 (億元)、政府消費 (億元)作為影響變量,而且本題收集的數(shù)據均為定量變量,其符號和經濟意義如下表:
變量 符號 代表意義
中國成品鋼材的需求量為(萬噸)  
成品鋼材需求總量
原油產量(萬噸)  
原油工業(yè)發(fā)展水平
生鐵產量(萬噸)  
生鐵工業(yè)發(fā)展水平
原煤產量(億噸)  
原煤工業(yè)發(fā)展水平
發(fā)電量(億千瓦時)  
發(fā)電技術水平
鐵路貨運量(萬噸)  
運輸產業(yè)水平
固定資產投資額(億元)  
固定資產支出水平
居民消費(億元)  
居民支出水平
政府消費(億元)  
政府支出水平

第3章 問題分析
     在上述問題中,中國成品鋼材的需求量 (萬噸)的影響因素不只是原油產量 (萬噸),還有生鐵產量 (萬噸)、原煤產量 (億噸)、發(fā)電量 (億千瓦時)、鐵路貨運量 (萬噸)、固定資產投資額 (億元)、居民消費 (億元)、政府消費 (億元)等,這樣因變量 就與多個自變量 有關。因此,我們就可以采用多元線性回歸進行問題的分析。
    多元線性回歸模型的基本形式:設隨機變量 與一般變量 的理論線性回歸模型為:
                     
其中, 是 個未知參數(shù), 稱為回歸常數(shù), 稱為回歸系數(shù)。 稱為被解釋變量(因變量),而 是 個可以精確測量并可控制的一般變量,稱為解釋變量(自變量)。 是隨機誤差,與一元線性回歸一樣,對隨機誤差項我們常假定
                              

                   
為理論回歸方程。

第4章 數(shù)據的預處理
4.1 曲線統(tǒng)計圖
 
  分析:從曲線統(tǒng)計圖上我們可以大致的來看,變量 和因變量 在1980年到1986年的增長速度都相對平穩(wěn)沒有明顯的增勢;從1986年到1993年,個變量開始緩慢增長;從1993年到1998年,增長的幅度開始加大了。 的曲線近似為一條水平的直線,這兩個變量分別表示原油和原煤的量,可能受到資源和政策的限制,因而增長的速度非常緩慢。從圖中可以明顯看到隨著年限的增加,我國的各種產業(yè)和支出水平都隨之逐漸增長。
4.2 散點統(tǒng)計圖
     分析:從散點統(tǒng)計圖上我們可以細致的來看,變量 (鐵路運貨量)的變化最為明顯,還可以清楚的看到1981年,1991年,1998年,因為一些特殊事件而導致的鐵路運輸量降低。 與 在1980年到1986年的增長速度都相對平穩(wěn)沒有明顯的增勢,從1986年到1993年,個變量開始緩慢增長;從1993年到1998年,增長的幅度開始加大了。但是 (原油)與 (原煤)的產量卻始終保持相對平穩(wěn)的增長趨勢,而卻增長速度非常的緩慢,這可能是受到了資源的限制和國家政策的影響。從散點圖中可以很明顯的看到各年的真是數(shù)據,還可以看出隨著年限的增加,我國的各種產業(yè)和支出水平都隨之逐漸增長。
4.3 樣本的相關系數(shù)
 
    分析:從樣本的相關系數(shù)表來看,各變量的相關系數(shù)都在0.9以上,說明自變量與因變量 有高度的線性相關性,適合做 與8個自變量的多元線性回歸。(說明:本表格是由EViews軟件計算得出,但由于不能導出,所以通過保存成圖片后經WPS截圖工具截得。)

第5章 回歸模型的建立
    將原始數(shù)據導入到Eviews6.0(破解版)的數(shù)據框中,然后用Eviews軟件做線性回歸分析如下:
在Eviews主窗口菜單單擊Quick/Estimate Equation,彈出方程估計窗口,再在彈出的窗口清單內填入以下回歸方程的書寫形式。
整形式 : 
    y=c(1)+c(2)*x1+c(3)*x2+c(4)*x3+c(5)*x4+c(6)*x5+c(7)*x6+c(8)*x7+c(9)*x8
簡化形式 : 
                     y c x1 x2 x3 x4 x5 x6 x7 x8
這里我們采用簡化形式執(zhí)行后得到輸出結果為:


Variable Coefficient    Std. Error   t-Statistic      Prob.


C -381.4846 912.1465 -0.418227 0.6846
X1 0.121818 0.107424 1.133993 0.2833
X2 0.124884 0.187062 0.667607 0.5195
X3 -149.1537 121.3537 -1.229083 0.2472
X4 0.653366 0.276937 2.359260 0.0400
X5 0.003058 0.023349 0.130959 0.8984
X6 0.081378 0.042124 1.931870 0.0822
X7 -0.120128 0.046747 -2.569723 0.0279
X8 0.393966 0.239413 1.645552 0.1309


R-squared 0.999009     Mean dependent var 5742.518
Adjusted R-squared 0.998215       S.D. dependent var 2679.609
S.E. of regression 113.1993      Akaike info criterion 12.60169
Sum squared resid 128140.8     Schwarz criterion 13.04906
Log likelihood -110.7161      Hannan-Quinn criter. 12.67740
F-statistic 1259.526     Durbin-Watson stat 2.245475
Prob(F-statistic) 0.000000


    分析:從模型匯總表中可以看出,決定系數(shù) ,由決定系數(shù)看回歸模型高度顯著。又由 ,P值=0.000000,回歸模型通過了F檢驗,表明8個自變量整體對因變量y產生顯著線性影響的判斷所犯錯誤的概率僅為0.000000。說明 整體上對 有高度顯著的線性影響。
    表中第二列是我們的回歸方程參數(shù)估計值,由此可以得到 對8個自變量的線性回歸方程為:
           
              
 從回歸方程中可以看到, 對成品鋼材需求量起正影響, 對成品鋼材需求量起負影響。從實際社會生活來看,原煤生產水平和居民的消費水平提高,都會促進成品鋼材的需求量,應該和成品鋼材的需求量成正相關,這與定性分析的結果不一致。為此,我們對它進行更深層次的分析。

第6章 回歸模型的檢驗
6.1 F檢驗



F-statistic  1259.526
Prob(F-statistic) 0.000000


   分析:從表中結果可以看出,Prob(F-statistic)即相伴概率P值,由 ,P值=0.000000<0.05,可知此回歸方程拒絕零假設,即做出8個自變量整體對因變量y產生顯著線性影響的判斷所犯錯誤的概率僅為0.000000,回歸方程通過了F檢驗。

6.2 T檢驗



Variable t-Statistic   Prob.


C -0.418227 0.6846
X1 1.133993 0.2833
X2 0.667607 0.5195
X3 -1.229083 0.2472
X4 2.359260 0.0400
X5 0.130959 0.8984
X6 1.931870 0.0822
X7 -2.569723 0.0279
X8 1.645552 0.1309


分析:通過看上面的T檢驗表可以發(fā)現(xiàn),在顯著性水平 時,只有 的Prob(收尾概率)小于0.05,通過了顯著性檢驗。

6.3 T檢驗分析
為了盡可能的保留合理變量,我們就針對逐個變量給以T檢驗分析,逐步剔除不合理的變量,使回歸模型更完善。因此我們首先剔除Prob最大的變量 ,再做回歸分析的T檢驗如下:




Variable Coefficient Std. Error t-Statistic Prob.


C -274.5262 387.5811 -0.708307 0.4935
X1 0.132601 0.065838 2.014055 0.0691
X2 0.120529 0.175666 0.686125 0.5068
X3 -137.5335 79.00025 -1.740925 0.1096
X4 0.677570 0.196814 3.442693 0.0055
X6 0.082361 0.039555 2.082205 0.0615
X7 -0.123567 0.036909 -3.347908 0.0065
X8 0.387785 0.223983 1.731314 0.1113


     分析:剔除 后,在顯著性水平 時,有 的Prob(收尾概率)小于0.05,通過了顯著性檢驗。此時我們發(fā)現(xiàn),剔除了 后,通過T檢驗的變量增多了,這是一個很好的結果。因此我們再剔除Prob最大的變量 ,再做回歸分析的T檢驗如下:



Variable Coefficient Std. Error t-Statistic Prob.


C -279.1420 378.8809 -0.736754 0.4754
X1 0.153961 0.056719 2.714474 0.0188
X3 -151.0344 74.80430 -2.019061 0.0664
X4 0.772202 0.137273 5.625307 0.0001
X6 0.099512 0.029972 3.320207 0.0061
X7 -0.134592 0.032486 -4.143096 0.0014
X8 0.402994 0.217913 1.849332 0.0892


    分析:剔除 后,在顯著性水平 時,有 的Prob(收尾概率)小于0.05,通過了顯著性檢驗。此時我們發(fā)現(xiàn),剔除了 后,通過T檢驗的變量又增多了一個。因此我們再剔除Prob最大的變量 ,再做回歸分析的T檢驗如下:


Variable Coefficient Std. Error t-Statistic Prob.


C -108.8183 400.2650 -0.271866 0.7900
X1 0.149526 0.061718 2.422751 0.0307
X3 -248.8000 57.63980 -4.316463 0.0008
X4 0.977544 0.087907 11.12020 0.0000
X6 0.126790 0.028416 4.462005 0.0006
X7 -0.084069 0.019143 -4.391499 0.0007


R-squared 0.998669           Mean dependent var 5742.518
Adjusted R-squared 0.998157             S.D. dependent var 2679.609
S.E. of regression 115.0260          Akaike info criterion 12.58028
Log likelihood -113.5127          Hannan-Quinn criter. 12.63076
F-statistic 1951.080             Durbin-Watson stat 1.886506
Prob(F-statistic) 0.000000


    分析:剔除 后,在顯著性水平 時,剩余變量 的Prob(收尾概率)都小于0.05,全部通過了顯著性T檢驗。以 做回歸分析的輸出表來看,決定系數(shù) ,由決定系數(shù)看回歸模型仍然具有高度的顯著性。又由 ,P值=0.000000,回歸模型通過了F檢驗,表明8個自變量整體對因變量y產生顯著線性影響的判斷所犯錯誤的概率僅為0.000000。說明 整體上對 有高度顯著的線性影響。
    表中第二列是我們的回歸方程參數(shù)估計值,由此可以得到 對5個自變量的線性回歸方程為:
         
從回歸方程中可以看到, 對成品鋼材需求量起正影響, 對成品鋼材需求量起負影響。此時回歸方程雖然通過了F,T檢驗,但是增加了不合理變量 所占回歸方程的比重,這也是不合社會實際的。

6.4 Chow斷點檢驗
    該檢驗的思想是對每個子樣本單獨擬合方程來觀察估計方程是否有顯著差異。零假設是兩個子樣本擬合的方程無顯著差異。

Chow Breakpoint Test: 1990
Equation Sample: 1980 1998


F-statistic 7992.972                             Prob. F(9,1) 0.0087
Log likelihood ratio 212.4876 Prob. Chi-Square(9) 0.0000
Wald Statistic 71936.75 Prob. Chi-Square(9) 0.0000


    分析:從檢驗表中可以看出,由于,檢驗量的收尾概率分別是0.0087,0.0000,0.0000
,所以回歸模型接受原假設,說明模型參數(shù)有超樣本特性,回歸方程沒有顯著差異,回歸模型具有穩(wěn)定性。

6.5 Chow預測檢驗
該檢驗的思想,Chow預測檢驗先對包含前 個觀測值的子樣本建立模型,然后用這個模型對后 個觀測值的自變量進行預測,若實際值與預測值有很大變動,就可以懷疑這兩個子樣本估計關系的穩(wěn)定性。 

Chow Forecast Test: Forecast from 1990 to 1998


F-statistic 7992.972 Prob. F(9,1) 0.0087
Log likelihood ratio 212.4876 Prob. Chi-Square(9) 0.0000


分析:從Chow預測檢驗表中可以看出,檢驗量的收尾概率分別為0.0087,0.0000,說明回歸模型的預測值和實際值沒有很大的波動,所以就可以認為回歸模型是穩(wěn)定的。

第7章 違背模型基本假設的情況
7.1 異方差性的檢驗
7.1.1殘差圖示檢驗
    我們分別以回歸標準化殘差和因變量y來繪制殘差圖分析模型是否存在異方差。
 
分析:從殘差的散點圖上我們可以看出,回歸的標準化殘差隨因變量y的表變化并沒有明顯的規(guī)律性分布,殘差圖上的點都是隨機散布的,無任何規(guī)律,因此我們可以初步判定回歸模型不存在異方差。

7.1.2 懷特(White)檢驗
    懷特檢驗,是把 作為因變量,原先的自變量和自變量的平方項作為新自變量建立線性回歸模型,通過這個模型的擬合情況來檢驗是否有異方差性,檢驗的零假設是殘差不存在異方差性。懷特檢驗的統(tǒng)計量是 , 是樣本觀測量, 是輔助回歸的擬合優(yōu)度。本題的懷特檢驗如下:

Heteroskedasticity Test: White


F-statistic 1.958884              Prob. F(8,10) 0.1579
Obs*R-squared 11.59867               
                Prob.Chi-Square(8) 0.1700
Scaled explained SS 1.445422                
                 Prob.Chi-Square(8) 0.9936


分析:上表中Obs*R-squared即為 ,檢驗結果中由于收尾概率遠大于顯著性水平0.1,0.05或0.01,接收原假設,殘差不存在異方差。

7.2 自相關性的檢驗
7.2.1 LM檢驗
    LM檢驗是根據決定系數(shù) 和F檢驗值的收尾概率大小來判斷是否存在自相關性。原假設:殘差不存在從一階到p階的自相關。檢驗統(tǒng)計量為 。

Breusch-Godfrey Serial Correlation LM Test:


F-statistic 3.174716              Prob. F(2,8) 0.0966
Obs*R-squared 8.407246              
                  Prob.Chi-Square(2) 0.0149


    分析:從LM檢驗表的收尾概率來看,prob(收尾概率)都大于0.01,F(xiàn)檢驗的收尾概率大于0.05,但是都小于0.1,。由此來看檢驗模型存在自相關。
7.2.2 DW檢驗
    對于自相關性我們用DW檢驗來判斷,已知回歸估計式的殘差 來定義DW統(tǒng)計量,假設有 ,通過化簡后DW值與 的關系式為 ,在Eviews中運行結果如下表(只選取了DW的統(tǒng)計值):



 Durbin-Watson stat 2.245475


分析:從表中的數(shù)據我們可以看到, =2.245475,因而可以近似的計算出 ,通過查表可以判斷出誤差項的自相關性成輕微的負自相關(由于自相關性不是很明顯,所以在這里就不做自相關性的消除)。

第8章 自變量選擇與逐步回歸
8.1 前進逐步回歸法
8.1.1 前進逐步回歸
    取顯著性水平 進行逐步回歸檢驗選變量。


Variable Coefficient Std. Error t-Statistic Prob.*


C 196.0980 259.5932 0.755405 0.4617
X2 0.499933 0.159589 3.132632 0.0068
X4 0.503581 0.170954 2.945705 0.0100
X3 -110.5429 45.39905 -2.434917 0.0279


R-squared 0.997746         Mean dependent var 5742.518
Adjusted R-squared 0.997296         S.D. dependent var 2679.609
S.E. of regression 139.3449         Akaike info criterion 12.89644
Sum squared resid 291254.9         Schwarz criterion 13.09527
Log likelihood -118.5162         Hannan-Quinn criter. 12.93009
F-statistic 2213.770         Durbin-Watson stat 1.041553
Prob(F-statistic) 0.000000


        Selection Summary


Added X2
Added X4
Added X3


    分析:從逐步回歸模型的匯總表中我們可以看出,逐步回歸最終選取的變量為x2,x4,x3,逐步回歸后模型決定系數(shù) 。逐步回歸后的模型保持著回歸方程高度的顯著性。從表中我們可以看到,F(xiàn)的檢驗值為2213.770,P值始終是0.000000不變,由此可見模型犯錯的概率始終為0.000000不變,故逐步回歸后的回歸方程同樣具有高度的顯著性。從上述表中結果可以看到逐步回歸后的 回歸方程為
                
由回歸方程可以看出, 生鐵的產量和 發(fā)電量的系數(shù)都是正數(shù),對因變量y起正相關作用, 原煤量的系數(shù)為負值,對因變量y起負相關作用,而卻從數(shù)值上看是-11.0543,對y的影響很大,這與實際情況不符,這可能是因變量 與 之間有較強的相關性。同時從表中還可以看出,用逐步回歸法的選元過程為第一步引入 ,第二步引入 ,第三步引入 再形成一個符合要求的線性回歸方程。

8.1.2 前進逐步回歸模型預測
 
分析:如圖所示是前進逐步回歸的模型預測,左邊是預測圖,兩條細線表示預測值的兩倍標準誤差帶,右邊是有關預測的一些評價指標。從他的誤差帶我們可以看出回歸模型較為精確,誤差帶緊隨實際曲線變動,再從右邊的MAPE值為2.218047可以判定模型的預測精度較高。
8.2 后退逐步回歸法
8.2.1 后退逐步回歸
     取顯著性水平 進行逐步回歸檢驗選變量。


Variable Coefficient Std. Error t-Statistic Prob.*


C -279.1420 378.8809 -0.736754 0.4754
X1 0.153961 0.056719 2.714474 0.0188
X4 0.772202 0.137273 5.625307 0.0001
X3 -151.0344 74.80430 -2.019061 0.0664
X7 -0.134592 0.032486 -4.143096 0.0014
X8 0.402994 0.217913 1.849332 0.0892
X6 0.099512 0.029972 3.320207 0.0061


R-squared 0.998964            Mean dependent var 5742.518
Adjusted R-squared 0.998447           S.D. dependent var 2679.609
S.E. of regression 105.6149           Akaike info criterion 12.43479
Sum squared resid 133854.0           Schwarz criterion 12.78274
Log likelihood -111.1305            Hannan-Quinn criter. 12.49367
F-statistic 1929.141           Durbin-Watson stat 2.584581
Prob(F-statistic) 0.000000


     Selection Summary


Removed X5
Removed X2


    分析:采用后退逐步回歸法最后選擇的變量有 ,從后退逐步回歸后模型決定系數(shù) ,調整決定系數(shù) ,可知模型仍然具有高度的顯著性。表中F的檢驗值為1929.141,P值始終為0.000000不變,由此可見模型犯錯的概率始終為0.000000不變。綜合考慮后退逐步回歸得到的模型比前進逐步回歸得到的模型要好一些。對變量 與因變量 做線性回歸得:



Variable Coefficient Std. Error t-Statistic Prob.


C -278.8229 476.6925 -0.584912 0.5668
X2 0.936983 0.033352 28.09335 0.0000
X5 -0.002258 0.004663 -0.484295 0.6347


由此我們可以寫出關于 的線性回歸方程為:
                    
    從回歸的最終模型來看,此回歸方程剔除了一些變量后反而變得更加顯著,并且更有實際的社會意義,它消除了不合理的變量 和 。在回歸方程中又新出現(xiàn)了負變量 (鐵路運貨量),雖然也是不合實際的,但是它占回歸方程的比重很小因此可以不做處理。

8.2.2 后退逐步回歸模型預測
 
     分析:如圖所示是后退逐步回歸的模型預測,左邊是預測圖,兩條細線表示預測值的兩倍標準誤差帶,右邊是有關預測的一些評價指標。從他的誤差帶我們可以看出回歸模型同樣較為精確,誤差帶緊隨實際曲線變動,而卻緊隨的效果要比前進回歸模型的要好,貼近實際曲線的效果也前進逐步回歸模型的好,再從右邊的評價指標RMSE值為83.93419,MAE值為67.52228,MAPE值為1.320141,都比前進逐步回歸模型的數(shù)值小,從而可以判定模型的預測能力比前進逐步回歸模型的預測好,精度高。

第9章 多重共線性的診斷及消除
9.1 多重共線性的診斷
    由于Eviews軟件無法對模型多重共線作出診斷,因此這里我們就用spss19.0軟件對模型做共線性診斷,關鍵的輸出結果見下表(限于篇幅就對表格做出調整,只輸出關鍵的結果)。
模型 常量 X1 X2 X3 X4 X5 X6 X7 X8
VIF 61.091 413.326 133.044 947.996 329.438 182.413 416.185 701.380
    分析:從表中的輸出結果可以看出, 的方差擴大因子VIF都很大,遠遠的超過了10,說明成品鋼材需求量的回歸方程存在著嚴重的多重共線性。又因為 的方差擴大因子都是大于10的,說明回歸方程的多重共線性就是由自變量間的多重共線性引起的。
共線性診斷a
模型 維數(shù) 特征值 條件索引 方差比例
(常量) x1 x2 x3 x4 x5 x6 x7 x8
1 1 8.321 1.000 .00 .00 .00 .00 .00 .00 .00 .00 .00
2 .659 3.553 .00 .00 .00 .00 .00 .00 .00 .00 .00
3 .011 27.458 .04 .00 .00 .01 .00 .00 .00 .01 .00
4 .004 43.444 .01 .00 .00 .00 .00 .00 .31 .08 .00
5 .003 57.552 .00 .00 .02 .04 .01 .00 .11 .06 .05
6 .001 106.541 .12 .26 .02 .08 .02 .00 .05 .00 .02
7 .000 157.928 .05 .07 .30 .05 .02 .00 .03 .50 .69
8 .000 213.430 .01 .02 .53 .39 .36 .03 .41 .01 .18
9 4.043E-5 453.668 .78 .65 .11 .43 .60 .97 .09 .35 .05
a. 因變量: y

分析:從條件數(shù)可以看到,最大的條件數(shù) ,說明自變量間存在嚴重的多重共線性,這一判斷與上面的方差擴大因子法判斷結果一致。表中的方差比例是按從小到大的順序排列的,不是按自變量順序排列的,這與方差擴大因子不同。在維數(shù)為9的時候,我們可以看到 的系數(shù)都很快的增大要接近1,這也可以說明 之間存在較強的多重共線性。

9.2 消除多重共線性
    在前面多重共線性的診斷中我們看到 的方差擴大因子 為最大,因此剔除 ,建立 與 的回歸方程。關鍵的輸出結果見下表(限于篇幅就對表格做出調整,只輸出關鍵的結果)。
模型 常量 X1 X2 X3 X5 X6 X7 X8
VIF 38.881 248.129 130.880 174.510 133.668 372.202 525.920
    分析:從剔除了自變量 的回歸模型中我們可以看到 的方差擴大因子 為最大,卻遠大于10,因此再剔除 ,建立 與 的回歸方程。關鍵的輸出結果見下表(限于篇幅就對表格做出調整,只輸出關鍵的VIF結果)。
模型 常量 X1 X2 X3 X5 X6 X7
VIF 35.514 169.934 108.057 174.510 132.017 101.870
    分析:從剔除了自變量 的回歸系數(shù)表中我們可以看到 的方差擴大因子 為最大,卻遠大于10,因此再剔除 ,建立 與 的回歸方程。相關輸出結果如下:
模型 常量 X1 X2 X3 X6 X7
VIF 23.178 93.590 23.358 124.084 64.691
    分析:從剔除了自變量 的回歸系數(shù)表中我們可以看到 的方差擴大因子 為最大,還是遠大于10,因此再剔除 ,建立 與 的回歸方程。相關輸出結果如下:
模型 常量 X1 X2 X3 X7
VIF 16.425 49.766 23.101 24.008
    分析:從剔除了自變量 的回歸系數(shù)表中我們可以看到 的方差擴大因子 為最大,還是大于10,因此再剔除 ,建立 與 的回歸方程。相關輸出結果如下:
模型 常量 X1 X3 X7
VIF 15.743 19.226 4.511
    分析:從剔除了自變量 的回歸系數(shù)表中我們可以看到 的方差擴大因子 為最大,還是大于10,因此再剔除 ,建立 與 的回歸方程。相關輸出結果如下:
模型 常量 X1 X7
VIF 3.694 3.694
    分析:從剔除了自變量 的回歸系數(shù)表中我們可以看到,剩下的自變量 的方差擴大因子分別為 ,都是小于10的,而卻回歸系數(shù)也都有合理的社會經濟解釋,說明此回歸模型不存在較強的多重共線性了,可以作為最終的回歸模型。現(xiàn)在我們用Eviews軟件建立 與 的回歸模型:


Variable Coefficient Std. Error t-Statistic Prob.


C -2210.934 1272.616 -1.737314 0.1015
X1 0.439863 0.109724 4.008811 0.0010
X7 0.161103 0.018294 8.806406 0.0000


R-squared 0.972630          Mean dependent var 5742.518
Adjusted R-squared 0.969209          S.D. dependent var 2679.609
S.E. of regression 470.2027          Akaike info criterion 15.28814
Sum squared resid 3537450.          Schwarz criterion 15.43727
Log likelihood -142.2374         Hannan-Quinn criter. 15.31338
F-statistic 284.2909         Durbin-Watson stat 0.568156
Prob(F-statistic) 0.000000


 與 的回歸方程為
                     
由標準化的回歸方程我們可以看到,對成品鋼材需求量影響較大的事原油產量和居民消費,從社會經濟角度來考慮,這是貼近人民生活的兩個量,其中居民消費的系數(shù)較大,影響也就較大。從整體上來看,消除多重共線性影響后得回歸方程更較為符合社會實際。



R-squared 0.972630
Adjusted R-squared 0.969209
F-statistic 284.2909
Prob(F-statistic) 0.000000


分析:從表中輸出結果可以看出,Prob即顯著性P值,由 ,P值=0.000,可知此回歸方程仍然具有高度的顯著,即做出2個自變量整體對因變量y產生顯著線性影響的判斷所犯錯誤的概率僅為0.000。再從剔除了自變量 的新回歸方程的樣本決定系數(shù) ,調整樣本決定系數(shù) 。而 對8個自變量的全模型的樣本決定系數(shù) ,調整樣本決定系數(shù) 。與全模型相比 的擬合優(yōu)度仍然很高,并且回歸系數(shù)有合理的經濟解釋。
第10章 回歸模型總結
隨著社會經濟的不斷發(fā)展,科學技術的不斷進步,統(tǒng)計方法越來越成為人們必不可收的工具盒手段。應用回歸分析是其中的一個重要分支,本著國家經濟水平的不斷提高,我們采用回歸分析的方法對我國成品鋼材的需求量進行分析應用。為了使分析的模型具有社會實際意義,我們引用了1980——1998年的成品鋼材、原油、生鐵、原煤、發(fā)電量、鐵路貨運量、固定資產投資額、居民消費、政府消費9個不同的量來進行回歸分析。
通過問題分析及假設建立了初步多元線性回歸,再借用Eviews軟件對數(shù)據進行了初步的預處理分析,得出數(shù)據符合做多元線性回歸的要求。最后我們用Eviews軟件給各變量做了初等多元線性回歸并得到了回歸方程。我了更多的了解多元線性回歸方程的特征,我們對回歸方程進行了F檢驗,T檢驗,將通過T檢驗的變量在建立回歸方程分析。對于初等回歸模型的穩(wěn)定性,我們采用了Chow斷點檢驗和Chow預測檢驗,最終檢驗出了模型是穩(wěn)定的。然后又對初等模型否違背原假設做了異方差性檢驗,自相關性檢驗。異方差性的檢驗我們采用了作殘差圖和懷特檢驗法,很好的檢驗出了初等回歸模型沒有異方差性;自相關我們采用了DW檢驗,最終檢驗出了初等模型有輕微的負自相關性。為了模型更貼近實際,我們又分別進行了前進逐步回歸,后退逐步回歸的分析,并對兩種逐步回歸做了模型預測,在兩種逐步回歸法得到的結論中我們發(fā)現(xiàn)采用后退逐步回歸得到的回歸模型比前進逐步回歸得到的模型要好一些,更為接近預測值。并且在分析中我們發(fā)現(xiàn)了變量之間存在共線性,因此我們又進一步借助spss軟件對變量之間的多重共線性給了診斷,最后確定了確實存在多重共線性,從而又進一步對多重共線性給予了消除,重新建立了符合實際的線性回歸方程。











參考文獻
【1】 易丹輝.數(shù)據分析與EViews應用.北京:中國人民大學出版社,2008
【2】 何曉群,劉文卿.應用回歸分析(第三版).北京:中國人民大學出版社,2011
【3】 張曉峒.EViews實用指南與案例.北京:機械工業(yè)出版社,2007
【4】 百度文庫.網址:(http://www.baidu.com/s?wd=%B0%D9%B6%C8%CE%C4%BF%E2&rsv_bp=0&rsv_spt=3&inputT=4144)




















附錄:
    1.關于我國原油產量 (萬噸)、生鐵產量 (萬噸)、原煤產量 (億噸)、發(fā)電量 (億千瓦時)、鐵路貨運量 (萬噸)、固定資產投資額 (億元)、居民消費 (億元)、政府消費 (億元)作為影響變量,成品鋼材的需求量為 (萬噸)各變量的動態(tài)曲線。
 
分析:從圖中我們可以明顯看出,中國原油產量 (萬噸)與固定資產投資額 (億元)的曲線變化相對較大,中途 快速上升,而 卻有下降部分說明1988年到1990年有相對的國事影響了曲線;我國生鐵產量 (萬噸)、發(fā)電量 (億千瓦時)、居民消費 (億元)、政府消費 (億元)與成品鋼材的需求量為 (萬噸)的各變量的曲線始終隨時間的增加而逐步增長;我國原煤產量 (億噸)、鐵路貨運量 (萬噸)在1996年突然下降,這可能是我國原煤產量 受到自然資源和國家政策影響,從而導致了鐵路貨運量 的下降,同時也說明了變量 可能存在相關性或共線性。
2.關于我國成品鋼材的需求量為 (萬噸)與原油產量 (萬噸)、生鐵產量 (萬噸)、原煤產量 (億噸)、發(fā)電量 (億千瓦時)、鐵路貨運量 (萬噸)、固定資產投資額 (億元)、居民消費 (億元)、政府消費 (億元)的散點圖。
 
分析:從因變量 與其他各變量的的散點圖來看,他們都存在一定的線性關系,而且線性關系很明顯,以此我們可以對他們做多元線性回歸。



參考文獻:
   參考文獻【1】 易丹輝.數(shù)據分析與EViews應用.北京:中國人民大學出版社,2008 【2】 何曉群,劉文卿.應用回歸分析(第三版).北京:中國人民大學出版社,2011 【3】 張曉峒.EViews實用指南與案例.北京:機械工業(yè)出版社,2007 【4】 百度文庫.網址:(http://www.baidu.com/s?wd=%B0%D9%B6%C8%CE%C4%BF%E2&rsv     

  

  

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多