今天將開始學(xué)習(xí)簡(jiǎn)單的摘要測(cè)量以及變量的測(cè)量級(jí)別如何影響應(yīng)使用的統(tǒng)計(jì)量類型。使用demo.sav數(shù)據(jù),資料來源于PASW_Statistics_18_Brief_Guide.
度量水平
不同的摘要測(cè)量適用于不同類型的數(shù)據(jù),這具體取決于測(cè)量級(jí)別:
分類。包含有限數(shù)量的不同值或類別(例如,性別或婚姻狀況)的數(shù)據(jù)。也稱為定性數(shù)據(jù)。分類變量可以為字符串(字母數(shù)字)數(shù)據(jù),也可以為使用數(shù)字代碼來表示類別的數(shù)值變量(例如,0 = Unmarried,1 = Married)。存在兩種基本類型的分類數(shù)據(jù):
名義。不具有固有的類別順序的分類數(shù)據(jù)。例如,工作類別 sales 不高于也不低于工作類別 marketing 或 research。
有序。具有有意義的類別順序但各類別之間沒有可測(cè)量距離的分類數(shù)據(jù)。例如,值high、medium 和 low 具有順序,但無法計(jì)算這些值之間的“距離”。
標(biāo)度。以區(qū)間或比例刻度度量的數(shù)據(jù),其中數(shù)據(jù)值既表示值的順序,也表示值之間的距離。例如,72,195 美元的薪金比 52,398 美元的薪金高,這兩個(gè)值之間的距離是19,797 美元。也 稱為定量或連續(xù)數(shù)據(jù)。
分類數(shù)據(jù)的摘要測(cè)量
對(duì)于分類數(shù)據(jù),最典型的摘要測(cè)量是每個(gè)類別中的個(gè)案的數(shù)目或百分比。眾數(shù)是具有最大個(gè)案數(shù)目的類別。對(duì)于有序數(shù)據(jù),如果存在大量的類別,則中位數(shù)(半數(shù)個(gè)案位于其
上下的值)可能也是一個(gè)有用的摘要測(cè)量。
“頻率”過程將生成頻率表,其中顯示變量的每個(gè)觀察值的個(gè)案數(shù)目和百分比。
從菜單中選擇:
分析
描述統(tǒng)計(jì)
頻率...
選擇 Owns PDA [ownpda] 和 Owns TV [owntv] 并將其移動(dòng)到“變量”列表中。

單擊確定以運(yùn)行該過程。

頻率表顯示在瀏覽器窗口中。頻率表揭示僅有 20.4% 的人擁有個(gè)人數(shù)字助理,但幾乎每個(gè)人都擁有電視 (99.0%)。這些可能不是有趣的發(fā)現(xiàn),盡管發(fā)現(xiàn)一小部分人沒有電視可能十分有趣。
分類數(shù)據(jù)的圖表
可以用條形圖或餅圖來圖形化顯示頻率表中的信息。
再次打開“頻率”對(duì)話框。(兩個(gè)變量應(yīng)仍處于選中狀態(tài)。)可以使用工具欄上的“對(duì)話框調(diào)用”按鈕快速返回到最近用過的過程。

單擊圖表。
選擇條形圖,然后單擊繼續(xù)。

單擊主對(duì)話框中的確定以運(yùn)行該過程。

除了頻率表之外,當(dāng)前還以條形圖的形式顯示了相同信息,以便于輕松看出大多數(shù)人沒有個(gè)人數(shù)字助理,但幾乎每個(gè)人都擁有電視這一事實(shí)。
刻度變量的摘要測(cè)量
有許多可用于刻度變量的摘要測(cè)量,其中包括:
集中趨勢(shì)的測(cè)量。最常見的集中趨勢(shì)測(cè)量是均值(算術(shù)平均數(shù))和中位數(shù)(半數(shù)個(gè)案位于其上下的值)。
離散測(cè)量。測(cè)量數(shù)據(jù)中變異量或分散量的統(tǒng)計(jì)量,包括標(biāo)準(zhǔn)差、最小值和最大值。
再次打開“頻率”對(duì)話框。
單擊重置清除以前的所有設(shè)置。
選擇 Household income in thousands [income] 并將其移到“變量”列表中。

單擊統(tǒng)計(jì)量。
選擇均值、中位數(shù)、標(biāo)準(zhǔn)差、最小值和最大值。

單擊繼續(xù)。
取消選中主對(duì)話框中的顯示頻率表格。(頻率表通常對(duì)刻度變量沒有幫助,因?yàn)椴煌档臄?shù)目可能與數(shù)據(jù)文件中的個(gè)案數(shù)幾乎一樣多)。
單擊確定以運(yùn)行該過程。
“頻率統(tǒng)計(jì)量”表將顯示在瀏覽器窗口中。

在此示例中,均值和中值之間具有較大的差異。均值幾乎比中值大 25,000,這表明值為非正態(tài)分布。可以使用直方圖來直觀檢查分布。
刻度變量的直方圖
再次打開“頻率”對(duì)話框。
單擊圖表。
選擇直方圖和帶正態(tài)曲線。

單擊繼續(xù),然后單擊主對(duì)話框中的確定以運(yùn)行該過程。

大多數(shù)個(gè)案聚類在刻度的較低端,其中多數(shù)在 100,000 以下。但是,也有少數(shù)個(gè)案在500,000 及以上(極少數(shù)個(gè)案甚至需要修改直方圖才能可見)。這些少數(shù)個(gè)案的較高值對(duì)均值具有顯著作用,但對(duì)中位數(shù)沒有或僅有較小作用,因而在此示例中,中位數(shù)是對(duì)集中趨勢(shì)的較好指示。
網(wǎng)游數(shù)據(jù)挖掘與分析高級(jí)群(171461228)& 網(wǎng)游數(shù)據(jù)分析論壇(www.xuefenxi.com),歡迎熱衷于網(wǎng)游數(shù)據(jù)分析的各位前輩和新人加入,共同討論學(xué)習(xí)。如有疑問請(qǐng)聯(lián)系xfx_2012@126.com