日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

CART算法--分類和回歸樹算法

 dadaadao 2011-01-24
  CART(Classification And Regression Tree)算法采用一種二分遞歸分割的技術(shù),將當(dāng)前 的樣本集分為兩個子樣本集,使得生成的決策樹的每個非葉子節(jié)點(diǎn)都有兩個分支。因此,CART算法生成的決策樹是結(jié)構(gòu)簡潔的二叉樹。
  以下是算法描述:其中T代表當(dāng)前樣本集,當(dāng)前候選屬性集用T_attributelist表示。
  (1)創(chuàng)建根節(jié)點(diǎn)N
 ?。?)為N分配類別
 ?。?)if T都屬于同一類別or T中只剩下 一個樣本則返回N為葉節(jié)點(diǎn),為其分配屬性
  (4)for each T_attributelist中屬性執(zhí)行該屬性上的一個劃分,計(jì)算此劃分的GINI系數(shù)
 ?。?)N的測試屬性test_attribute=T_attributelist中最小GINI系數(shù)的屬性
 ?。?)劃分T得到T1 T2子集
  (7)對于T1重復(fù)(1)-(6)
 ?。?)對于T2重復(fù)(1)-(6)
  CART算法考慮到每個節(jié)點(diǎn)都有成為葉子節(jié)點(diǎn)的可能,對每個節(jié)點(diǎn)都分配類別。分配類別的方法可以用當(dāng)前節(jié)點(diǎn)中出現(xiàn)最多的類別,也可以參考當(dāng)前節(jié)點(diǎn)的分類錯誤或者其他更復(fù)雜的方法。
  CART算法仍然使用后剪枝。在樹的生成過程中,多展開一層就會有多一些的信息被發(fā)現(xiàn),CART算法運(yùn)行到不能再長出分支位置,從而得到一棵最大的決策樹。然后對這棵大樹進(jìn)行剪枝。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多