讀《Stata統(tǒng)計(jì)分析:社會(huì)科學(xué)應(yīng)用指南》第二章,stata簡介。摘錄(略有修改)一些精彩的句子,如下。根據(jù)統(tǒng)計(jì)軟件的不同,命令也被稱作代碼、腳本或語法。 使用stata有三種方式:1是下拉菜單,2是輸入命令,3是do文件。該書認(rèn)為do文件是“更為便捷的”。我們需要事先知道命令的名稱,如果你不知道具體的命令,可使用關(guān)鍵詞進(jìn)行查找。比如search regression。語法命令/菜單中的if,in,if表示條件選擇,in表示觀測(cè)選擇。文本數(shù)據(jù)在編輯器中是紅色的,數(shù)值數(shù)據(jù)是黑色的。默認(rèn)數(shù)值型數(shù)據(jù)是浮點(diǎn)數(shù)float。輸入數(shù)據(jù)的最簡單方法,其實(shí)是直接復(fù)制粘貼數(shù)據(jù)到stata。不太或完全不需要語法命令導(dǎo)入。clear:清理/清除當(dāng)前正在使用的數(shù)據(jù)集 codebook:查看分類變量的水平、標(biāo)簽值misstable sum:數(shù)據(jù)集的缺失情況匯總建議不用recode,建議聯(lián)合使用recode與gen,來完成分類重新編碼為新變量比起gen,更要掌握的是egen,但二者有區(qū)別,比如我在知乎看到一個(gè)案例(摘自知乎):gen主要進(jìn)行加減乘除、冪次等基本運(yùn)算,而egen使用函數(shù)(mean, max等)來為新變量取值,egen命令無法使用任何運(yùn)算符生成變量值。encode:將字符串轉(zhuǎn)換為數(shù)值型變量decode:將數(shù)值型變量轉(zhuǎn)換為字符串keep:在一個(gè)大數(shù)據(jù)集里面,僅想保留少數(shù)變量 drop:刪除某些不想要的變量,也可以和in聯(lián)用刪除觀測(cè)uniform(x) 生成(0,1)內(nèi)均勻分布的偽隨機(jī)數(shù)substr(s,n1,n2) 獲得從S的n1個(gè)字符開始的n2個(gè)字符組成的字符串real(x) 將字符串s轉(zhuǎn)換為數(shù)值函數(shù)int(x) 去掉x的小數(shù)部分,得到整數(shù)
|