前提介紹:為什么需要統(tǒng)計(jì)量?統(tǒng)計(jì)量:描述數(shù)據(jù)特征
1. 集中趨勢衡量
中位數(shù) (median):將數(shù)據(jù)中的各個(gè)數(shù)值按照大小順序排列,居于中間位置的變量 眾數(shù) (mode):數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù) 離散程度衡量方差(variance)
標(biāo)準(zhǔn)差 (standard deviation)1. 介紹:回歸(regression) Y變量為連續(xù)數(shù)值型(continuous numerical variable) 如:房價(jià),人數(shù),降雨量 分類(Classification): Y變量為類別型(categorical variable) 如:顏色類別,電腦品牌,有無信譽(yù)
2. 簡單線性回歸(Simple Linear Regression)
3. 簡單線性回歸介紹 3.1 簡單線性回歸包含一個(gè)自變量(x)和一個(gè)因變量(y) 3.2 以上兩個(gè)變量的關(guān)系用一條直線來模擬 3.3 如果包含兩個(gè)以上的自變量,則稱作多元回歸分析(multiple regression)
4. 簡單線性回歸模型
5. 簡單線性回歸方程 E(y) = β0+β1x 這個(gè)方程對應(yīng)的圖像是一條直線,稱作回歸線 其中,β0是回歸線的截距 β1是回歸線的斜率 E(y)是在一個(gè)給定x值下y的期望值(均值)
6. 正向線性關(guān)系:7. 負(fù)向線性關(guān)系:8. 無關(guān)系9. 估計(jì)的簡單線性回歸方程
10. 線性回歸分析流程:11. 關(guān)于偏差ε的假定 11.1 是一個(gè)隨機(jī)的變量,均值為0 11.2 ε的方差(variance)對于所有的自變量x是一樣的 11.3 ε的值是獨(dú)立的 11.4 ε滿足正態(tài)分布
|
|