“天底下只有一種方法,可以使任何一個(gè)人去做任何一件事情,你有沒(méi)有靜下來(lái)想一想?是的,只有一種方法,那就是讓人愿意去做那件事情” -- 《人性的弱點(diǎn)》 昨天和大家重點(diǎn)介紹了Logistic Regression的數(shù)學(xué)原理,大家get到了么?小白自己沒(méi)事兒都會(huì)不停的后頭看看復(fù)習(xí)復(fù)習(xí),大家也要記得哦?;仡欉^(guò)去一段時(shí)間給大家講解的知識(shí)點(diǎn),重點(diǎn)圍繞在概率論和梳理統(tǒng)計(jì)相關(guān)核心知識(shí)點(diǎn)上,今天我們來(lái)為其做一次收尾,對(duì)統(tǒng)計(jì)分析方法做一次系統(tǒng)性的介紹。全文將圍繞著一下幾點(diǎn)進(jìn)行詳述:一、統(tǒng)計(jì)分析方法定義;二、統(tǒng)計(jì)分析方法的特征;三、統(tǒng)計(jì)分析方法的分類;四、統(tǒng)計(jì)分析常見(jiàn)方法 一、統(tǒng)計(jì)分析方法定義 統(tǒng)計(jì),顧名思義即將信息統(tǒng)括起來(lái)進(jìn)行計(jì)算的意思,它是對(duì)數(shù)據(jù)進(jìn)行定量處理的理論與技術(shù)。 統(tǒng)計(jì)工作的方法論: 1、統(tǒng)計(jì)設(shè)計(jì)(目標(biāo)設(shè)定) 2、資料收集(數(shù)據(jù)獲?。?/p> 3、整理匯總(數(shù)據(jù)處理) 4、統(tǒng)計(jì)分析 5、信息反饋(決策反饋) 看到這兒,是不是有一點(diǎn)似成相識(shí)?是的,統(tǒng)計(jì)的過(guò)程方法論和數(shù)據(jù)科學(xué)方法論是一致的,因?yàn)榻y(tǒng)計(jì)是數(shù)據(jù)科學(xué)的一種解決方法,或者叫分支。 二、統(tǒng)計(jì)分析方法的特征 采用統(tǒng)計(jì)分析方法進(jìn)行研究,是研究達(dá)到高水平的客觀要求,應(yīng)用統(tǒng)計(jì)分析方法進(jìn)行科學(xué)研究,有以下幾個(gè)基本特征: 1、科學(xué)性 2、直觀性 3、可重復(fù)性 4、可比性(可比性是統(tǒng)計(jì)分析的最核心特征,如果統(tǒng)計(jì)分析的數(shù)據(jù)沒(méi)有可比性,那么是沒(méi)有任何意義的) 三、統(tǒng)計(jì)分析方法的分類 統(tǒng)計(jì)分析方法,按不同的分類標(biāo)志,可劃分為不同的類別,而常用的分類標(biāo)準(zhǔn)是功能標(biāo)準(zhǔn),依此標(biāo)準(zhǔn)進(jìn)行劃分,統(tǒng)計(jì)分析可分為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。 1、描述統(tǒng)計(jì) 描述統(tǒng)計(jì)是將研究中所得的數(shù)據(jù)加以整理、歸類、簡(jiǎn)化或繪制成圖表,以此描述和歸納數(shù)據(jù)的特征及變量之間的關(guān)系的一種最基本的統(tǒng)計(jì)方法。描述統(tǒng)計(jì)主要涉及數(shù)據(jù)的集中趨勢(shì)、離散程度和相關(guān)強(qiáng)度,最常用的指標(biāo)有平均數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù)等。 2、推斷統(tǒng)計(jì) 推斷統(tǒng)計(jì)指用概率形式來(lái)決斷數(shù)據(jù)之間是否存在某種關(guān)系及用樣本統(tǒng)計(jì)值來(lái)推測(cè)總體特征的一種重要的統(tǒng)計(jì)方法。推斷統(tǒng)計(jì)包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn),最常用的方法有Z檢驗(yàn)、T檢驗(yàn)、卡方檢驗(yàn)等。 描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)二者彼此聯(lián)系,相輔相成,描述統(tǒng)計(jì)是推斷統(tǒng)計(jì)的基礎(chǔ),推斷統(tǒng)計(jì)是描述統(tǒng)計(jì)的升華。具體研究中,是采用描述統(tǒng)計(jì)還是推斷統(tǒng)計(jì),應(yīng)視具體的研究目的而定,如研究的目的是要描述數(shù)據(jù)的特征,則需描述統(tǒng)計(jì);若還需對(duì)多組數(shù)據(jù)進(jìn)行比較或需以樣本信息來(lái)推斷總體的情況,則需用推斷統(tǒng)計(jì)。 四、統(tǒng)計(jì)分析常見(jiàn)方法 常見(jiàn)統(tǒng)計(jì)分析方法圖譜 如上圖所示,為常見(jiàn)的統(tǒng)計(jì)分析方法圖譜: (1)比較分析 是統(tǒng)計(jì)分析中最常用的方法。是通過(guò)有關(guān)的指標(biāo)對(duì)比來(lái)反映事物數(shù)量上差異和變化的方法。指標(biāo)分析對(duì)比分析方法可分為靜態(tài)比較和動(dòng)態(tài)比較分析。靜態(tài)比較是同一時(shí)間條件下不同總體指標(biāo)比較,如不同部門、不同地區(qū)、不同國(guó)家的比較,也叫橫向比較;動(dòng)態(tài)比較是同一總體條件不同時(shí)期指標(biāo)數(shù)值的比較,也叫縱向比較。這兩種方法既可單獨(dú)使用,也可結(jié)合使用。 (2)分組分析 統(tǒng)計(jì)分析不僅要對(duì)總體數(shù)量特征和數(shù)量關(guān)系進(jìn)行分析,還要深入總體的內(nèi)部進(jìn)行分組分析。分組分析法就是根據(jù)統(tǒng)計(jì)分析的目的要求,把所研究的總體按照一個(gè)或者幾個(gè)標(biāo)志劃分為若干個(gè)部分,加以整理,進(jìn)行觀察、分析,以揭示其內(nèi)在的聯(lián)系和規(guī)律性。統(tǒng)計(jì)分組法的關(guān)鍵問(wèn)題在于正確選擇分組標(biāo)值和劃分各組界限。 (3)相關(guān)分析 以經(jīng)濟(jì)為例作相關(guān)分析的概述。社會(huì)經(jīng)濟(jì)現(xiàn)象是相互聯(lián)系的,在其聯(lián)系中存在因果關(guān)系、比例關(guān)系、平衡關(guān)系等。相關(guān)分析就是利用這種社會(huì)經(jīng)濟(jì)現(xiàn)象相互聯(lián)系進(jìn)行數(shù)量關(guān)系的分析,以研究其中存在的規(guī)律性。事物的發(fā)展變化,內(nèi)因是根據(jù),外因是條件。社會(huì)其他現(xiàn)象也是如此 (4)因素分析 因素分析法的最大功用,就是運(yùn)用數(shù)學(xué)方法對(duì)可觀測(cè)的事物在發(fā)展中所表現(xiàn)出的外部特征和聯(lián)系進(jìn)行由表及里、由此及彼、去粗取精、去偽存真的處理,從而得出客觀事物普遍本質(zhì)的概括。其次,使用因素分析法可以使復(fù)雜的研究課題大為簡(jiǎn)化,并保持其基本的信息量。 (5)回歸分析 回歸分析法是依據(jù)事物發(fā)展變化的因果關(guān)系來(lái)預(yù)測(cè)事物未來(lái)的發(fā)展走勢(shì),它是研究變量間相互關(guān)系的一種定量預(yù)測(cè)方法,回歸分析中,當(dāng)研究的因果關(guān)系只涉及因變量和一個(gè)自變量時(shí),叫做一元回歸分析;當(dāng)研究的因果關(guān)系涉及因變量和兩個(gè)或兩個(gè)以上自變量時(shí),叫做多元回歸分析。此外,回歸分析中,又依據(jù)描述自變量與因變量之間因果關(guān)系的函數(shù)表達(dá)式是線性的還是非線性的,分為線性回歸分析和非線性回歸分析。 備注:本文內(nèi)容為數(shù)據(jù)科學(xué)小白原創(chuàng),授權(quán)頭條號(hào)發(fā)表,轉(zhuǎn)載請(qǐng)注明出處 參考文獻(xiàn): 1、https://jingyan.baidu.com/article/86fae346fdbf2a3c49121a27.html 2、http://wiki.mbalib.com/wiki/%E7%BB%9F%E8%AE%A1%E5%88%86%E6%9E%90 |
|