日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

新版白話空間統(tǒng)計(jì)(44)空間聚類:局部莫蘭指數(shù)(Anselin Local Moran''s I)簡(jiǎn)介與參數(shù)說(shuō)明

 godxiasad 2023-04-21 發(fā)布于北京

好了,寫(xiě)了好幾篇的聚類,有同學(xué)都在問(wèn)蝦神,說(shuō)沒(méi)想到你這個(gè)濃眉大眼的家伙也當(dāng)叛徒了,背叛了空間統(tǒng)計(jì)學(xué)隊(duì)伍……好吧,還是那句話,空間統(tǒng)計(jì)學(xué)是蝦神的看家本領(lǐng),所以那是肯定不能丟掉的。

當(dāng)然,今天我們要講的還是聚類,不過(guò)是妥妥的空間聚類。

話說(shuō),前面一直都在強(qiáng)調(diào),空間分布模式主要就是三種:

全局的莫蘭指數(shù)可以通過(guò)計(jì)算公式,來(lái)表明整個(gè)研究空間中的樣本數(shù)據(jù)所表達(dá)出來(lái)的總體特征,但是這個(gè)總體特征是所有模型加權(quán)出來(lái)的結(jié)果,自然就會(huì)掩蓋掉里面的很多細(xì)節(jié)。

比如我們要說(shuō)20世紀(jì)最出名的輕武器,肯定AK47必然有一席之地,做為世界上是世界上裝備大、產(chǎn)量最高、適用范圍最廣和改進(jìn)類型最多的槍械,沒(méi)人會(huì)否認(rèn)AK是一把槍,但是做為好槍,是不是就完美無(wú)缺呢?答案自然是否定的——AK最被人詬病的就是射擊精度的問(wèn)題。比如在蝦神讀大學(xué)的時(shí)候,常玩的CS,因?yàn)闃尫ǔ?,就老不喜歡用AK了(蝦神玩警的時(shí)候喜歡用AUG(游戲里面的B44),玩匪的時(shí)候喜歡用SSG552 (B42),就下面這兩個(gè):

主要是蝦神槍法太臭,所以得靠這兩個(gè)帶著瞄準(zhǔn)器的槍……不過(guò)蝦神一直都是盒子精本精

而且就算用了瞄準(zhǔn)器的搶,結(jié)果依然是:

好了,言歸正傳,整體的完美,不代表細(xì)節(jié)就一樣完美,整體模式被識(shí)別為聚集,不代表所有數(shù)據(jù)在研究空間內(nèi),都表現(xiàn)出聚集的模式,所以在這種背景下:LISA(Local Moran's I analysis)就應(yīng)運(yùn)而生了。

因?yàn)長(zhǎng)ISA是通過(guò)局部關(guān)系從觀察值以及他們的空間上的相鄰來(lái)進(jìn)行計(jì)算的。所以也被直接稱之為:局部空間自相關(guān)。

局部空間自相關(guān)的原理非常簡(jiǎn)單:整個(gè)分析把結(jié)論分成兩種:聚類和異常:

所謂的聚類,就是把相同的放在一起:

而異常則正好相反(也就是某種離散):

當(dāng)然,做為默認(rèn)的結(jié)果,肯定還有隨機(jī):

如果拋開(kāi)隨機(jī)不談,只看聚集和異常的話,就會(huì)有如下四種組合:

而這種模型到底是如何進(jìn)行計(jì)算的?結(jié)果又有啥意義呢?我們后面將花上好幾篇的時(shí)間來(lái)給大家慢慢講講。

當(dāng)然,習(xí)慣上,我們還是從創(chuàng)始人開(kāi)始:

LISA的創(chuàng)始人,就是大名鼎鼎的Luc Anselin院士,當(dāng)今世界空間統(tǒng)計(jì)學(xué)領(lǐng)軍人物,另外,也是蝦神唯三見(jiàn)過(guò)的活著的GIS傳奇人物(還有兩個(gè)是goodchild和Jack):

(目測(cè)老爺子身高超過(guò)190cm)

Anselin院士領(lǐng)導(dǎo)的芝加哥大學(xué)GeoDaCenter(原來(lái)在亞利桑那大學(xué)),是世界知名的空間分析實(shí)驗(yàn)室,其中標(biāo)志性的軟件就是GeoDa。

我在以前的文章中已經(jīng)介紹過(guò)GeoDa了,所以這里不多贅述,后面我們一些演示還通過(guò)GeoDa來(lái)進(jìn)行講解。

下面繼續(xù)來(lái)講LISA。

從算法上講,全局最優(yōu)一般不代表局部最優(yōu),同樣的,宏觀上的結(jié)論,也不能掩蓋微觀上的一些問(wèn)題,比如我們對(duì)全國(guó)數(shù)據(jù)進(jìn)行分析的總體結(jié)論是空間上的正相關(guān),并且呈現(xiàn)比較顯著的聚集趨勢(shì),但是是不是每個(gè)區(qū)域都聚集呢?東南沿海和西北內(nèi)陸的空間分布模式是否完全一樣呢?顯然不可能。

所以我們就需要一種,能夠在更微觀的尺度上對(duì)空間分布進(jìn)行探索和分析的模型。而LISA就是其中之一。

LISA改進(jìn)了莫蘭指數(shù)模型,把整體的關(guān)系破壞掉,那么就可以以此來(lái)計(jì)算每一個(gè)組成部分的局部空間自相關(guān)。這種局部的空間自相關(guān),可以用來(lái)檢驗(yàn)聚類區(qū)域,也可以用來(lái)驗(yàn)證觀察值聚集的熱點(diǎn)以及冷點(diǎn)。

我們可以先來(lái)看看LISA怎么做,然后再來(lái)逐步分析它的原理和結(jié)果。

在ArcGIS里面,LISA的名稱就叫做Cluster and Outlier Analysis(Anaselin Local Moran's I):聚類與異常分析:Anselin 局部莫蘭指數(shù)。在空間統(tǒng)計(jì)的聚類與分布制圖工具箱里面(不像莫蘭指數(shù),在空間分布模式工具箱中):

從歸屬來(lái)看,空間統(tǒng)計(jì)學(xué)屆是把這個(gè)東西作為聚類分析來(lái)看待的,而非空間分布模型來(lái)看待。

整體的參數(shù)說(shuō)明,與全局莫蘭指數(shù)幾乎是一模一樣,必選項(xiàng)就是三個(gè):

輸入要分析的要素、輸入要分析的字段,輸出的結(jié)果,然后下面是空間關(guān)系概念化的選擇:

這些參數(shù)在以前的分析工具中,大家也都司空見(jiàn)慣,是啥意義也都了如指掌,另外關(guān)于不同空間關(guān)系在局部莫蘭指數(shù)中的應(yīng)用,后面在講案例的時(shí)候也會(huì)說(shuō)到。

這里具體說(shuō)一下最后兩個(gè)參數(shù):

1、Apply False Discovery Rate(FDR) Correction——官方翻譯直接叫做:應(yīng)用錯(cuò)誤發(fā)現(xiàn)率 (FDR) 校正。(這里先吐槽一下這個(gè)翻譯,挖坑待填)

這是一個(gè)布爾型參數(shù),我們可以指定在工具運(yùn)行的時(shí)候,評(píng)估統(tǒng)計(jì)顯著性時(shí)是否使用 FDR 校正。

  • 如果選中,則統(tǒng)計(jì)顯著性將以置信度為 95% 的錯(cuò)誤發(fā)現(xiàn)率校正為基礎(chǔ)。

  • 如果不選中(這是默認(rèn)設(shè)置),那么p 值小于 0.05 的要素就直接顯示在 COType 字段中了,反映置信度為 95% 的統(tǒng)計(jì)顯著性聚類或異常值。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多