日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

SAS 分析常用的過程 過程步大全

 wenasunny 2017-12-31

為區(qū)分過程名稱的拼寫,故意部分小寫,以便識別和記憶。

 

基本SAS程序代碼結構:

---------

PROC MODE data=Arndata.moddat;          /* 命令的解釋 */

                var y x1-x6;                           /* 命令的解釋 */

                model y = x1-x6;

run;

------------------------------------------

 

 


 

正態(tài)性檢驗

PROC UNIvariate

---------

PROC UNIvariate data=Arndata.unidat;

                var x1;

run;

 ------------------------------------------

 

 

 


 

相關分析和回歸分析

PROC REG 回歸

---------

PROC REG data=Arndata.regdat;

                var y x1-x6;

                model y = x1-x6 / selection=stepwise; /* 加入逐步回歸選項 */

                print cli;                                            /* 加入輸出預測結果部分,還可以輸出acov,all,cli,clm,collin,collinoint,cookd,corrb,

                                                                            covb,dw(時序檢驗統(tǒng)計量),i,influence,p,partial,pcorr1,pcorr2,r,

                                                                            scorr1,scorr2,seqb,spec,ss1,ss2,stb,tol,vif(異方差檢驗統(tǒng)計量),xpx*/

                plot y*x2 / conf95;                            /* 做散點圖 */

run;

 ------------------------------------------

---------

DATA Arndata.regdat;

x2x2 = x2*x2;

x1x2 = x1*x2;

PROC REG data=Arndata.regdat;

                var y x1 x2 x2x2 x1x2 ;                                /* 多項式回歸,非線性回歸 */

                model y = x1 x2 x2x2 x1x2 / selection=stepwise;    /* 加入逐步回歸選項 */

                print cli; 

                plot y*x2 / conf95;                              /* 做散點圖 */

run;

 ------------------------------------------

PROC RSreg 二次響應面回歸

PROC ORTHOreg 病態(tài)數據回歸

PROC NLIN 非線性回歸

PROC TRANSreg 變換回歸

PROC CALIS 線性結構方程和路徑分析

PROC GLM 一般線性模型

PROC GENmod 廣義線性模型

 


 

方差分析

PROC ANOVA 單因素均衡數據和非均衡數據

---------

PROC ANOVA data=Arndata.anovadat;          /* 命令的解釋 */

                class typ;                                   /* 命令的解釋 */

                model y = typ;                            /* 可以看出此處是 單因素方差分析(分類型自變量對數值型自變量的影響) */

run;

------------------------------------------

PROC GLM 多因素非均衡數據:

---------

 

PROC GLM data=Arndata.glmdat;          /* 命令的解釋 */

                class typea typeb;                /* 命令的解釋 */

                model y = typea typeb;        /* 可以看出此處是 不考慮交互作用的多因素方差分析(分類型自變量對數值型自變量的影響) */

run;

------------------------------------------

---------

 

PROC GLM data=Arndata.glmdat;          /* 命令的解釋 */

                class typea typeb;                /* 命令的解釋 */

                model y = typea typeb typea*typeb;        /* 可以看出此處是 考慮交互作用的多因素方差分析(分類型自變量對數值型自變量的影響) */

run;

------------------------------------------

 

 

 


 

主成分分析

PROC PRINcomp

---------

PROC PRINcomp data=Arndata.pmdat   n=4  out=w1 outstat=w2 ;          

                var x1-x6;                        

PROC print data=w1;

PROC plot data=w1 vpct=80;                                          /* 一句話,其實print就是plot輸出圖形的文字形式而已 */

         plot prin1*prin2 $ districts='*'/

                haxis=-3.5 to 3 by 0.5 HREF=-2,0,2

                vaxis=-3 to 4.5 by 1.5 HREF=-2,0,2;              /* 主成分的散點圖,也就是載荷圖 */

run;

------------------------------------------

 

因子分析

PROC FACTOR

---------

PROC FACTOR data=Arndata.factordat simple corr ;         

                var y x1-x6;                         

                title'18個財務指標的分析';

                title2'主成分解';

run;

PROC FACTOR data=Arndata.factordat n=4 ;                        /* 選擇4個公共因子 */

                var y x1-x6;   

run;

PROC FACTOR data=Arndata.factordat n=4

                rotate=VARImax REorder;                                   /* 因子旋轉:方差最大因子法 */

                var y x1-x6;   

run;

------------------------------------------

PROC SCORE

 ---------

PROC FACTOR data=Arndata.factordat n=4

                rotate=VARImax REorder score out=score_Out;     /* 輸出因子得分矩陣 */

run;

PROC print data=score_Out;

         var districts factor1 factor2 factor3 factor4;

run; 

PROC plot data=score_Out;

         plot factor1*factor2 $ districts='*' / href=0 Vref=0;     /* 因子的散點圖,也就是載荷圖 */

run;

------------------------------------------

 

 

 


 

典型相關分析

PROC CANcorr

基本SAS程序代碼結構:

---------

DATA jt(TYPE=CORR);                               /* TYPE=CORR 表明數據類型為相關矩陣,而不是原始數據, type還可以是cov,ucov,factor,sscp,ucorr等*/

         input names$ 1-2(x1 x2 y1-y3)(6.);   /* name $ 表示讀取左側的變量名,1-2表示變量名的字符落在第1,2列上 */

         cards;

x1 1 0.8 ……

x2 ……

y1 ……

y2 ……

y3 ……

;

PROC CANcorr data=Arndata.cancorrdat

                edf=70 redundancy;                  /* 誤差自由度的參考值,默認值是n=1000; redundancy表示輸出冗余度分析的結果 */

                var x1 x2;

                with y1 y2 y3;

run;

------------------------------------------

對應分析                 /* 交叉表分析的拓展,尋找行和列的關系,一般行指代各種cases,而列代表各種visions */ 

PROC CORResp

 

---------

PROC CORResp data=Arndata.correspdat out=result;         

                var x1-x6;                        

                id Type;

run;

options ps=40;

proc plot data=result;

       plot dim2*dim1="*" $ Type / box

             haxis=-0.2 to 0.3 by 0.1

             Vaxis=-0.1 to 0.3 by 0.1

             Href=0 Vref=0;

run;

------------------------------------------


 

聚類分析

PROC CLUSTER

---------

PROC CLUSTER data=Arndata.clusdat
                      method=ave outtree=clusdat_Out;  

                      var x1-x6;  

                      id datid;

run;

proc tree horizontal;                 /* 做聚類樹 */
run;

------------------------------------------

PROC FASTclus

---------

PROC FASTclus data=Arndata.clusdat
                       maxclusters=3 list out=clusdat_Out;

                       var x1-x6;
                       id datid;
run;

------------------------------------------

 

 

PROC ACEclus

PROC VARCLUS

---------

PROC VARclus data=Arndata.clusdat; /* 系統(tǒng)默認使用主成分法聚類 */

                       var x1-x6; 
run;

 
---------

PROC VARclus hierarchy data=Arndata.clusdat; /* 保證分析過程中不同水平的譜系結構 */

                       var x1-x6; 
run;

 
---------

PROC VARclus centroid data=Arndata.clusdat outtree=clusdat_out; /* 使用重心法聚類 */

var x1-x6; 
run;

 

------------------------------------------

PROC TREE
---------

PROC TREE data=Arndata.clusdat horizontal; /* 使用TREE過程繪制聚類譜系圖 */

var x1-x6; 
run;

 

------------------------------------------

 

判別分析

PROC DISCRIM

---------

PROC DISCRIM data=Arndata.discrimdat
                       list out=discrimdat_Out distance pool=yes;
                       class Typ; /* 指定分類變量 */
                       var x1-x6; /* 用于建立判別識別函數的變量 */
                       id iddiscrim; /* 標注樣本的變量 */
run;
---------

第二種方法,將需要判別的新樣本放在testdata里:

---------

PROC DISCRIM data=Arndata.discrimdat1 testdata=Arndata.discrimdat2
                       testlist testout=discrimdat_Out; /* 將原來的幾個選項加注test標示 */
                       class Typ; /* 指定分類變量 */
                       var x1-x6; /* 用于建立判別識別函數的變量 */
                       id iddiscrim; /* 標注樣本的變量 */
run;

 ------------------------------------------

PROC STEPdisc: 逐步判別分析過程

---------

PROC STEPdisc method=stepwise data=Arndata.discrimdat
                       SLentry=0.10 SLstay=0.10; /* 設定引入和剔除的顯著性水平 */
                       class Typ; /* 指定分類變量 */
                       var x1-x6; /* 用于建立判別識別函數的變量 */
run;

------------------------------------------

PROC CANdisc: Fisher判別分析過程

---------

PROC CANdisc data=Arndata.discrimdat out=discrimdat_Out
                       distance simple;
                       class Typ; /* 指定分類變量 */
                       var x1-x6; /* 用于建立判別識別函數的變量 */
run;
proc print data=discrimdat_Out;
run;
 

------------------------------------------

 

-----------------------------------------------------------------------------------------------------------------

友情協助:

特征庫 www.
豆瓣統(tǒng)計學小組 www.douban.com/group/stats

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多