論文推薦| 黃鴻：空-譜協(xié)同正則化稀疏超圖嵌入的高光譜圖像分類

沐沐閱覽室 2019-07-16

展開全文

《測繪學(xué)報》

構(gòu)建與學(xué)術(shù)的橋梁拉近與權(quán)威的距離

空-譜協(xié)同正則化稀疏超圖嵌入的高光譜圖像分類

黃鴻, 陳美利, 王麗華, 李政英

重慶大學(xué)光電技術(shù)與系統(tǒng)教育部重點實驗室, 重慶 400044

收稿日期：2018-10-15；修回日期：2019-03-21

基金項目：重慶市基礎(chǔ)研究與前沿探索項目（cstc2018jcyjAX0093）；重慶市研究生科研創(chuàng)新項目（CYB18048；CYS18035）

第一作者簡介：黃鴻(1980-), 男, 教授, 博士生導(dǎo)師, 研究方向為流形學(xué)習(xí)、模式識別、遙感影像智能化處理。E-mail:hhuang@cqu.edu.cn

摘要：傳統(tǒng)依據(jù)圖嵌入的高光譜圖像維數(shù)約簡算法多數(shù)僅利用光譜信息表征像元間單一關(guān)系，忽視了數(shù)據(jù)間的多元幾何結(jié)構(gòu)。本文提出了一種面向高光譜圖像分類的空-譜協(xié)同正則化稀疏超圖嵌入算法（SSRSHE）。該算法首先利用稀疏表示揭示像元之間的相關(guān)性，自適應(yīng)選擇近鄰，并構(gòu)建稀疏本征超圖和懲罰超圖，以有效表征像元間的復(fù)雜多元關(guān)系，并進(jìn)行正則化處理。然后利用遙感圖像空間一致性原則，計算局部空間鄰域散度來保持樣本局部鄰域結(jié)構(gòu)，并引入樣本總體散度來保持高光譜數(shù)據(jù)的整體結(jié)構(gòu)。在低維嵌入空間中，盡可能使類內(nèi)數(shù)據(jù)聚集、類間數(shù)據(jù)遠(yuǎn)離，提取鑒別特征用于分類。在Indian Pines和PaviaU高光譜遙感數(shù)據(jù)集上試驗結(jié)果表明，本文算法總體分類精度分別達(dá)到86.7%和92.2%。相比傳統(tǒng)光譜維數(shù)約簡算法，該算法可有效改善高光譜圖像地物分類性能。

關(guān)鍵詞：高光譜圖像維數(shù)約簡正則化稀疏超圖模型空-譜聯(lián)合分類

Using spatial-spectral regularized hypergraph embedding for hyperspectral image classification

HUANG Hong, CHEN Meili, WANG Lihua, LI Zhengying

Key Laboratory of Optoelectronic Technique System of the Ministry of Education, Chongqing University, Chongqing 400044, China

Foundation support: The Basic and Frontier Research Programmes of Chongqing (No. cstc2018jcyjAX0093); The Chongqing University Postgraduates Innovation Project (Nos. CYB18048; CYS18035)

First author: HUANG Hong (1980—), male, professor, PhD supervisor, majors in manifold learning, pattern recognition and intelligent processing of remote sensing images. E-mail:hhuang@cqu.edu.cn.

Abstract: In recent years, many graph embedding methods were developed for dimensionality reduction (DR) of hyperspectral image (HSI), while these methods only use spectral information to reveal a simple intrinsic relation and ignore complex spatial-spectral structure in HSI. A new DR method termed spatial-spectral regularized sparse hypergraph embedding (SSRSHE) is proposed for the HSI classification. SSRSHE explores sparse coefficients to adaptively select neighbors for constructing the regularized sparse intrinsic hypergraph and the regularized sparse penalty hypergraph. Based on the spatial consistency property of HSI, a local spatial neighborhood scatter is computed to preserve local structure, and a total scatter is computed for global structure of HSI. Then, the optimal discriminant projection is obtained by possessing better intrinsic data compactness and penalty pixels separability, which is beneficial for classification. The experimental results on Indian Pines and PaviaU hyperspectral data sets show that the overall classification accuracies respectively reach 86.7% and 92.2%. The proposed SSRSHE method can effectively improve classification performance compared with the traditional spectral DR algorithms.

Key words: hyperspectral image dimensionality reduction regularized sparse hypergraph spatial-spectral features image classification

高光譜遙感圖像通過從可見光到短波紅外區(qū)域的密集光譜采樣，可在數(shù)百個窄而連續(xù)的相鄰光譜波段中提供空間場景，包含了豐富的空間、輻射和光譜信息，為地物精細(xì)分類提供了強(qiáng)有力的探測手段，目前已廣泛應(yīng)用于礦物勘探、環(huán)境監(jiān)測、精準(zhǔn)農(nóng)業(yè)和目標(biāo)識別等領(lǐng)域^[1^-2^]。然而，高光譜數(shù)據(jù)具有數(shù)據(jù)量大、波段數(shù)多、波段間相關(guān)性強(qiáng)等特點，傳統(tǒng)方法易導(dǎo)致“維數(shù)災(zāi)難”問題^[3^-4^]。因此，如何減少波段數(shù)且盡量保留有用信息已成為高光譜遙感領(lǐng)域的研究熱點問題。

維數(shù)約簡是克服數(shù)據(jù)冗余的有效方法，可在降低數(shù)據(jù)維數(shù)的同時盡可能保留數(shù)據(jù)中的本征信息^[5^]。目前學(xué)者們提出了一系列的維數(shù)約簡方法，如主成分分析(principal component analysis, PCA)^[6^]、線性判別分析(linear discriminant analysis, LDA)^[7^]、等距映射(isometric feature mapping, ISOMAP)^[8^]、局部線性嵌入(local linear embedding, LLE)^[9^]、鄰域保持嵌入(neighborhood preserving embedding, NPE)^[10^]、拉普拉斯等距離映射(Laplacian eigenmaps, LE)^[11^]及局部保持投影(locality preserving projection, LPP)^[12^]。上述方法可統(tǒng)一在圖嵌入框架(graph embedding, GE)^[13^-14^]下，其異于如何定義本征圖和懲罰圖，但都為非監(jiān)督方法，其分類性能受限。針對此問題，學(xué)者們通過將樣本先驗知識引入到圖嵌入框架來改善分類性能，提出了邊緣Fisher分析(marginal Fisher analysis, MFA)^[15^]和正則化局部判別嵌入(regularized local discriminant embedding, RLDE)^[16^]等監(jiān)督學(xué)習(xí)方法，以提升分類精度。

然而，直接圖嵌入方法只考慮數(shù)據(jù)間一元關(guān)系，在實際應(yīng)用中高維數(shù)據(jù)通常具有復(fù)雜的多元幾何結(jié)構(gòu)^[17^-18^]。為表征高維數(shù)據(jù)中的復(fù)雜結(jié)構(gòu)，學(xué)者們試圖引入超圖學(xué)習(xí)來表示高光譜數(shù)據(jù)間的高階關(guān)系。文獻(xiàn)[19]提出了一種判別超-拉普拉斯投影(discriminant hyper-Laplacian projections, DHLP)方法，通過構(gòu)造超圖來獲得超-拉普拉斯矩陣，實現(xiàn)維數(shù)約簡。文獻(xiàn)[20]提出了一種超圖拉普拉斯聯(lián)合稀疏化處理方法來分析像元的內(nèi)在關(guān)系，以提取低維特征進(jìn)行分類。

上述方法僅利用了樣本的光譜信息，卻忽略了像元之間的空間位置關(guān)系，而研究表明空-譜聯(lián)合維數(shù)約簡方法可明顯提高地物分類性能。文獻(xiàn)[21]通過空間自適應(yīng)方法提取影像的空間特征和光譜特征，在分類精度和計算效率上均取得了較好效果。文獻(xiàn)[22]提出了一種空-譜協(xié)同嵌入方法(spatial-spectral coordination embedding, SSCE)，利用樣本空間塊替代單個樣本度量數(shù)據(jù)間相似性，降低異類地物被選為近鄰的概率，從而改善地物分類效果。與此同時，空間信息也被引入超圖模型中，文獻(xiàn)[17]提出了一種融合空-譜信息的超圖嵌入方法，利用像元空間鄰域構(gòu)造超邊，能有效提取低維特征，但忽視了像元的類別信息。在文獻(xiàn)[23]中，通過像元波段選取提取擴(kuò)展形態(tài)學(xué)特征，并與光譜信息融合來構(gòu)建超圖模型，提取嵌入特征以提升地物分類性能。上述空-譜聯(lián)合維數(shù)約簡方法，或是忽略了像元間多元幾何結(jié)構(gòu)關(guān)系，或是在構(gòu)造超圖模型時沒有充分利用樣本標(biāo)簽信息，限制了分類性能的進(jìn)一步提升。

針對上述問題，本文提出了一種空-譜協(xié)同正則化稀疏超圖嵌入方法(spatial-spectral regularized sparse hypergraph embedding, SSRSHE)。該方法運用稀疏系數(shù)自適應(yīng)揭示數(shù)據(jù)間近鄰關(guān)系，并結(jié)合類別信息構(gòu)建正則化稀疏超圖，從而有效表征高光譜數(shù)據(jù)的多元幾何結(jié)構(gòu)。同時，融入圖像的空間信息，構(gòu)造局部空間鄰域散度來表征樣本局部鄰域結(jié)構(gòu)，同時定義樣本總體散度矩陣來保證數(shù)據(jù)全局信息，提取有效鑒別特征，實現(xiàn)維數(shù)約簡。在Indian Pines和PaviaU高光譜數(shù)據(jù)集上驗證了本文算法的有效性。

1 本文算法

假設(shè)文中高光譜數(shù)據(jù)集Z=[z₁, z₂, …, z_i, …, z_n]∈R^d×n，其中d為波段數(shù)，n為樣本數(shù)，類別標(biāo)簽集L=[l₁, l₂, …, l_i, …, l_n]，l_i∈{1, 2, …, u}，其中u為樣本類別數(shù)。低維嵌入特征可表示為Y=P^TZ, Y∈R^τ×n，τ(τ<<d)為嵌入維數(shù)，P∈R^d×τ為映射矩陣。

1.1 圖嵌入學(xué)習(xí)

為更好地理解維數(shù)約簡算法，學(xué)者們提出了一種圖嵌入框架(GE)來表示數(shù)據(jù)幾何結(jié)構(gòu)，并將PCA、LDA、ISOMAP、LLE、LE、NPE及LPP等算法統(tǒng)一到該框架中。在圖嵌入框架下，需構(gòu)建本征圖和懲罰圖兩個無向圖。本征圖G^I(V, W^I)表征數(shù)據(jù)中需要保持的統(tǒng)計或幾何性質(zhì)，懲罰圖G^P(V, W^P)描述數(shù)據(jù)中應(yīng)避免的某種特性，其中V為頂點集，W^I和W^P分別為圖G^I和G^P的權(quán)重矩陣，可通過簡單法或熱核函數(shù)來定義。

圖嵌入框架意在低維空間中保留數(shù)據(jù)集的某些統(tǒng)計或幾何屬性，其低維嵌入特征可通過優(yōu)化以下目標(biāo)函數(shù)得到

(1)

式中，D^I是對角矩陣，且D_ii^I=∑_jw_ij^I；L^I=D^I-W^I為本征圖G^I的拉普拉斯矩陣; C為一常量矩陣；H為約束矩陣，可為單位陣以實現(xiàn)歸一化處理，或為懲罰圖G^P的拉普拉斯矩陣，即H=L^P=D^P-W^P, D_ii^P=∑_jw_ij^P。

1.2 超圖模型

直接圖嵌入模型僅考慮了兩點間一階關(guān)系，而超圖模型能有效表征數(shù)據(jù)間的多元特性^[17^]。超圖模型可表示為G_H=(V_H, E_H, W_H)，其中V_H表示頂點集，E_H為超邊集，對應(yīng)的相似權(quán)重矩陣是W_H，以度量超邊內(nèi)各頂點間相關(guān)性。

為表示G_H的內(nèi)在關(guān)系，假設(shè)每一超邊e_i含有N(e_i)個頂點，其權(quán)重表示為w(e_i)∈E_H，則關(guān)聯(lián)矩陣H=[H_mn:h(e_m, v_n)]∈R^|E_H|^×|V_H|、超邊e_m的度d(e_m)和頂點v_n的度d(v_n)可分別定義為

(2)

(3)

(4)

式中，，即值等于超邊內(nèi)目標(biāo)像素與其近鄰點權(quán)重之和；h為熱核系數(shù)。

綜上，超圖內(nèi)每一超邊由某一像元與其近鄰點構(gòu)成，揭示數(shù)據(jù)間內(nèi)在多元關(guān)系。其對應(yīng)的關(guān)聯(lián)矩陣H，每行中的非零元素，描述每一超邊內(nèi)各點分布情況。超圖通過多對頂點連通以表征鄰域內(nèi)頂點間多元結(jié)構(gòu)，因而可更好地描述數(shù)據(jù)中多元關(guān)系。

1.3 SSRSHE算法

為表征高光譜數(shù)據(jù)中的多元幾何結(jié)構(gòu)關(guān)系，并聯(lián)合像元的空間-光譜信息，本文提出了一種空-譜協(xié)同正則化稀疏超圖嵌入(SSRSHE)方法。首先利用樣本的稀疏系數(shù)來自適應(yīng)性選擇其近鄰，構(gòu)建稀疏本征超圖和懲罰超圖來揭示高光譜數(shù)據(jù)間的多元結(jié)構(gòu)。同時，依據(jù)空間一致性原理構(gòu)造局部空間鄰域散度以保持像元局部空間近鄰關(guān)系, 并采用樣本總體散度來表征高光譜數(shù)據(jù)整體特性。在低維鑒別空間中，使類內(nèi)數(shù)據(jù)盡可能聚集、類間數(shù)據(jù)盡可能發(fā)散，提取鑒別特征，提升地物分類性能。該算法的具體流程如圖 1所示。

圖 1 SSRSHE算法流程Fig. 1 Flowchart of the proposed SSRSHE method

1.3.1 正則化稀疏超圖模型構(gòu)建

在構(gòu)建超圖時，首先需要選擇合適的樣本近鄰點。目前的歐氏距離度量方法存在近鄰點選取不準(zhǔn)確及參數(shù)難以確定等問題，而稀疏表示具有自然鑒別力能自適應(yīng)地揭示出數(shù)據(jù)的內(nèi)在關(guān)系。某個樣本可以由一個足夠大的樣本空間來近似線性表示，且表示系數(shù)大部分為零，只有極少數(shù)與該樣本同類別數(shù)據(jù)對應(yīng)的系數(shù)為非零，因此可反映數(shù)據(jù)的本征屬性。

基于此，本文提出了一種正則化稀疏超圖模型，首先通過稀疏表示^[24^]得到數(shù)據(jù)的稀疏系數(shù)矩陣，揭示數(shù)據(jù)內(nèi)在關(guān)聯(lián)特性，以自適應(yīng)獲取像元近鄰。稀疏系數(shù)可通過以下l₁范數(shù)求解

(5)

式中，ε為稀疏誤差；E是全為1的向量。在具體計算中，可通過將式(5)問題進(jìn)一步轉(zhuǎn)化為Lasso問題求解^[25^]，即可得到稀疏系數(shù)矩陣S=[s₁, s₂, …, s_n]^T。

圖 2為基于稀疏系數(shù)自適應(yīng)選取近鄰構(gòu)造超邊示意圖。因稀疏系數(shù)可反映數(shù)據(jù)間相似性，對應(yīng)系數(shù)非零則表示像元間具有相關(guān)性，其值越大則屬于同類近鄰點可能性越大。因此相比歐氏度量，利用稀疏系數(shù)自適應(yīng)選擇近鄰能更為有效反映數(shù)據(jù)內(nèi)蘊(yùn)信息。

圖 2 基于稀疏系數(shù)的自適應(yīng)選取近鄰構(gòu)造超邊Fig. 2 Construction of sparse hyperedge

根據(jù)樣本稀疏特性和類別信息，構(gòu)建稀疏本征超圖G^w={Z, E_H^w, W_H^w}，揭示類內(nèi)數(shù)據(jù)的本征特性；同時，構(gòu)建稀疏懲罰超圖G^b={Z, E_H^b, W_H^b}，表征異類數(shù)據(jù)間幾何結(jié)構(gòu)；其中Z為頂點集，E_H^w、E_H^b分別是本征超邊集和懲罰超邊集，對應(yīng)權(quán)重矩陣為W_H^w、W_H^b。在稀疏本征超圖G^w中，根據(jù)稀疏系數(shù)矩陣具有的自適應(yīng)表征能力，本征超邊e_i^w由樣本z_i與其對應(yīng)稀疏系數(shù)非零點連接而成。則其超邊權(quán)值w_ij^w可定義為

(6)

式中，s_ij為稀疏系數(shù)矩陣S中第i行第j列元素，以表征像元z_i和z_j互相關(guān)程度；系數(shù)α(α>1)用于調(diào)節(jié)同類像元權(quán)重，強(qiáng)化同類樣本貢獻(xiàn)率，進(jìn)而提升分類性能。由此，本征超邊e_i^w的相似權(quán)重w(e_i^w)為

(7)

式中，N(e_i^w)表示本征超邊e_i^w包含的頂點數(shù)目。

同時，稀疏本征超圖的關(guān)聯(lián)矩陣H^w=[H_ij^w:h(e_j^w, z_i)]∈R^{|E^w|}^×|Z|計算如下

(8)

式中，。根據(jù)H^w和w(e_i^w)，計算像元z_i與超邊e_i^w的度

(9)

(10)

同理，在稀疏懲罰超圖G^b中，懲罰超邊e_i^b由樣本z_i與其對應(yīng)稀疏系數(shù)非零且類別不同的點連接而成，其邊權(quán)值可定義為

(11)

由式(11)可獲取懲罰超邊e_i^b的權(quán)重w(e_i^b)，表述了z_i與其不同類近鄰樣本間的相似特性

(12)

式中，N(e_i^b)表示懲罰超邊e_i^b含有的頂點數(shù)。

其對應(yīng)的關(guān)聯(lián)矩陣H^b=[H_ij^b:h(e_j^b, z_i)]∈R^{|E^b|}^×|Z|可表示為

(13)

由式(13)求解頂點z_i和懲罰超邊e_i^b的度分別是

(14)

(15)

在低維映射空間中，為提取鑒別特征，應(yīng)使同類數(shù)據(jù)盡可能聚集、不同類數(shù)據(jù)盡可能遠(yuǎn)離，因此目標(biāo)函數(shù)可表示為

(16)

(17)

式中，L^w=D_z^w－H^wW^w(D_e^w)^－1(H^w)^T和L^b=D_z^b－H^bW^b(D_e^b)^－1(H^b)^T分別是G^w和G^b對應(yīng)的拉普拉斯矩陣；D_z^w、D_z^b分別為θ^w和θ^b對角陣；D_e^w表示本征超邊度對角矩陣，D_e^b代表懲罰超邊度對角矩陣。稀疏本征超圖保持了同類樣本的聚集性，而稀疏懲罰超圖避免了非同類樣本在低維嵌入空間內(nèi)過于接近。

由式(16)、式(17)中的目標(biāo)函數(shù)，可進(jìn)一步轉(zhuǎn)化為以下最優(yōu)化問題

(18)

在訓(xùn)練樣本較少的情況下，式(18)易受奇異點影響。故在此引入正則化項，則式(18)中的優(yōu)化問題可拓展為

(19)

式中，η(0 < η < 1)表示正則化參數(shù)。正則項ZZ^T用于保持樣本的多樣性。將ZL^wZ^T對角化，以改善式(19)問題求解的穩(wěn)定性，即其對應(yīng)的特征值在較大時可自適應(yīng)減小，在極小或是零時增大。因此，式中分母項矩陣滿足非奇異性。假如η=0，式(19)即為式(18)；若η=1，以單位矩陣替代對角矩陣，式(19)則等效為PCA。

1.3.2 局部空間鄰域散度和總體散度計算

鑒于高光譜圖像空間一致性特點，即在空間局部鄰域內(nèi)近鄰屬于同類概率較大。以像元z_i:(x_i, y_i)為中心作方形窗口δ(z_i)，(x_i, y_i)為z_i在圖像中的空間坐標(biāo)位置，則窗口為γ×γ(γ是正奇數(shù))的空間鄰域像元集可記作

(20)

式中，c=(γ-1)/2，z_im:(x_m, y_m)對應(yīng)空間鄰域里第m個像元點。δ(z_i)共有γ×γ個像元。則空間鄰域距離可定義為

(21)

式中，，度量像元z_i與鄰域內(nèi)像元間相似權(quán)重，且。對于所有訓(xùn)練樣本局部空間鄰域散度矩陣

(22)

此外，為揭示影像數(shù)據(jù)多樣性，保持?jǐn)?shù)據(jù)的整體結(jié)構(gòu)，定義總體散度矩陣

(23)

式中, z是訓(xùn)練樣本均值。

1.3.3 空-譜協(xié)同低維嵌入

為在嵌入空間中提取低維空-譜鑒別特征，不僅要保持高光譜數(shù)據(jù)局部空間近鄰結(jié)構(gòu)，還需使超圖中的類內(nèi)數(shù)據(jù)聚集、類間數(shù)據(jù)遠(yuǎn)離。因此，式(19)、式(22)和式(23)可進(jìn)一步轉(zhuǎn)化為以下優(yōu)化問題

(24)

式中，參數(shù)η, ξ∈[0, 1]；M^w=ξ[(1-η)N^w+ηdiag(diag(N^w))]+(1-ξ)A，用于表征類內(nèi)與局部數(shù)據(jù)緊致性，N^w=ZL^wZ^T；M^b=ξ[(1-η)N^b+ηZZ^T]+(1-ξ)B，用于表示類間與全局?jǐn)?shù)據(jù)發(fā)散度，N^b=ZL^bZ^T。

依據(jù)拉格朗日乘子法，式(24)可轉(zhuǎn)換為以下廣義特征值求解

(25)

將式(25)特征值降序排列，選取前τ個特征值對應(yīng)的特征向量構(gòu)成最優(yōu)映射矩陣P=[p₁, p₂, …, p_τ-1, p_τ]。在低維空間里，測試樣本z_test的空-譜協(xié)同特征是y_test=P^Tz_test。

2 試驗結(jié)果與分析

為驗證本文算法的有效性，在公開的Indian Pines和PaviaU高光譜數(shù)據(jù)集上進(jìn)行分類試驗，并與相關(guān)的維數(shù)約簡算法進(jìn)行了對比。

2.1 數(shù)據(jù)集

(1) Indian Pines數(shù)據(jù)集為美國宇航局在1992年利用AVIRIS傳感器拍攝位于美國Indian州西北100 km²范圍的高光譜遙感影像，其尺寸為145×145像素，共220個波段，空間分辨率為20 m，剔除受水氣(噪聲)影響的波段后，余下200個波段用于試驗。該數(shù)據(jù)集主要包含16類地物，其假彩色圖和真實地物圖如圖 3所示。

圖 3 Indian Pines高光譜圖像Fig. 3 Indian Pines hyperspectral image

(2) PaviaU數(shù)據(jù)集為2002年采用ROSIS傳感器拍攝的意大利北部的帕維亞大學(xué)周圍的高光譜影像，其尺寸為610×340像素，空間分辨率為1.3 m，共有115個波段，去除受噪聲影響嚴(yán)重的12個波段后，剩余103個波段用于對比試驗。該數(shù)據(jù)集包括道路、磚塊、屋頂和裸土等9類地物，圖 4為其假彩色圖和真實地物圖。

圖 4 PaviaU高光譜圖像Fig. 4 University of Pavia hyperspectral image

2.2 試驗設(shè)置

在試驗中，每次試驗隨機(jī)選取一定數(shù)目的樣本用于訓(xùn)練，其余進(jìn)行測試。鑒于在實際應(yīng)用中，高光譜圖像中存在部分地物類別樣本數(shù)量非常少，例如在Indian Pines數(shù)據(jù)集中，Alfalfa(46)、Oats(20)、Stone-steel towers(93)，括號中為對應(yīng)的樣本數(shù)。為避免出現(xiàn)某些類別選取訓(xùn)練樣本所占比例過高或數(shù)量過少，在試驗中設(shè)置如下：假設(shè)每類地物隨機(jī)選取樣本量為n_i，N_i表示某類地物的總樣本數(shù)，若n_i≥N_i/2，則n_i＝N_i/2；若n_i≤10，則定n_i＝10。通過采用各維數(shù)約簡算法得到投影矩陣后，將所有樣本投影到低維空間得到嵌入特征，并通過利用最近鄰分類器(1-NN)進(jìn)行分類。在每種試驗條件下均進(jìn)行10次重復(fù)試驗，將總體分類精度(the overall accuracies，OAs)、平均分類精度(the average accuracies，AAs)及Kappa系數(shù)作為分類結(jié)果的評價指標(biāo)。

試驗中，將本文方法與PCA、LDA、MFA、LPP、RLDE、DHLP、SSCE、LPSNPE等維數(shù)約簡算法進(jìn)行比較，采用交叉驗證方法獲得各算法的最佳參數(shù)。SSCE在兩個數(shù)據(jù)集中空間窗口均設(shè)置為5，SSCE和LPP的最近鄰取5，DHLP中近鄰數(shù)為9；RLDE和MFA的類內(nèi)和類間近鄰數(shù)分別為3、5，8、60。LDA的嵌入維數(shù)為u-1，u為類別數(shù)，其他算法的嵌入維數(shù)均設(shè)置為30。

為探索本文方法中參數(shù)η、ξ，空間窗口γ對分類精度的影響，從數(shù)據(jù)集中每類地物中隨機(jī)選取5個樣本進(jìn)行訓(xùn)練，其余樣本作為測試樣本。令α=10，ε=0.006，η與ξ的取值范圍均設(shè)置為{0, 0.01, 0.05, 0.1, 0.2, …, 0.9, 1}，γ={3, 5, …, 39}。圖 5為本文SSRSHE算法在不同η和ξ值下的分類結(jié)果，圖 6是本文SSRSHE算法在不同γ下的分類結(jié)果。

圖 5 SSRSHE在不同η和ξ參數(shù)值下的總體分類精度Fig. 5 OAs of SSRSHE with different values of parameters η and ξ on Indian Pines and PaviaU data sets

圖 6 SSRSHE在不同空間窗口γ下的總體分類精度Fig. 6 OAs of SSRSHE with different size γ on different data sets

由圖 5可知，隨著ξ的增加，其分類精度隨之增加而后達(dá)到平穩(wěn)，但是ξ值過大時，分類精度有所下降。這是因為在SSRSHE中，ξ用于平衡光譜信息和空間結(jié)構(gòu)在特征提取中作用，ξ過小時未能有效利用超圖所表征的像元間的復(fù)雜多元結(jié)構(gòu)關(guān)系，過大時則忽略了空間結(jié)構(gòu)，也不利于鑒別特征提取。與此同時，盡管試驗中每類樣本數(shù)量僅有5個，但是在同一η值下，分類結(jié)果比較穩(wěn)定，有利于實際場景應(yīng)用。為平衡光譜信息與空間信息對分類性能的影響，依據(jù)試驗結(jié)果，本文在Indian Pines數(shù)據(jù)集設(shè)置ξ為0.3，η為0.7；對于PaviaU數(shù)據(jù)集，設(shè)置η=0.5及ξ=0.2。

由圖 6知，隨著空間窗口γ變大，能利用的空間信息愈發(fā)豐富，分類精度隨之增加；但γ過大時，空間窗口內(nèi)包含來自于不同類數(shù)據(jù)的可能性增大，導(dǎo)致分類性能下降，且窗口過大，會導(dǎo)致計算復(fù)雜度增加。因此，綜合考慮算法性能及計算效率，在Indian Pines數(shù)據(jù)集上設(shè)置γ=7，在PaviaU數(shù)據(jù)集上γ=15。

2.3 Indian Pines試驗結(jié)果與分析

試驗中，從Indian Pines數(shù)據(jù)集的每類地物里分別按照5、20、50、100、200樣本數(shù)隨機(jī)選取數(shù)據(jù)用于訓(xùn)練，剩余樣本用于測試。采用各維數(shù)約簡算法訓(xùn)練得到嵌入特征后，采用1-NN進(jìn)行分類。表 1為在不同樣本數(shù)量下不同算法的總體分類精度和Kappa系數(shù)值。

表 1 不同降維算法在Indian Pines數(shù)據(jù)集上的分類效果Tab. 1 Classification with different numbers of training data via different DR methods on Indian Pines data set

	5		20		50		100		200
	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa
RAW	43.6±2.8	0.372	54.9±1.7	0.495	60.1±1.4	0.552	63.6±0.9	0.588	66.9±0.6	0.622
PCA	43.4±2.7	0.370	54.9±1.6	0.495	60.2±1.2	0.553	63.9±0.8	0.591	67.0±0.6	0.622
LDA	32.5±4.8	0.253	51.6±1.9	0.459	64.4±1.2	0.599	71.0±0.5	0.672	74.4±0.7	0.706
LPP	43.6±3.7	0.371	54.5±1.8	0.491	59.7±1.2	0.546	62.7±1.0	0.578	65.8±0.5	0.609
MFA	44.1±4.0	0.377	57.1±1.6	0.520	66.8±1.9	0.625	70.8±1.1	0.669	72.0±1.0	0.680
RLDE	41.7±3.7	0.351	60.9±1.5	0.561	69.8±1.4	0.659	74.6±0.7	0.711	78.4±0.6	0.751
RSHE	48.6±3.4	0.422	63.2±1.9	0.587	71.0±1.7	0.672	77.1±0.9	0.739	80.0±0.7	0.770
DHLP	44.1±3.8	0.377	57.2±2.1	0.522	68.9±1.2	0.649	73.8±0.8	0.702	77.6±0.7	0.741
SSCE	30.2±4.5	0.230	69.7±1.0	0.658	76.3±0.9	0.730	79.1±0.5	0.760	82.9±0.6	0.801
LPSNPE	60.2±3.5	0.594	74.0±1.4	0.706	79.3±0.7	0.759	81.6±0.6	0.791	84.2±0.6	0.817
SSRSHE	65.6±2.3	0.615	74.8±1.2	0.706	80.0±1.0	0.765	82.9±1.0	0.803	86.7±1.0	0.829

從表 1可得知，各種維數(shù)約簡算法的分類性能都隨著訓(xùn)練樣本數(shù)目的增大而不斷提高，這是由于隨著訓(xùn)練數(shù)據(jù)量的增加，蘊(yùn)含的信息就越豐富，有利于特征提取。DHLP、RSHE等超圖方法的分類精度大多數(shù)情況下均優(yōu)于傳統(tǒng)圖嵌入方法，表明利用數(shù)據(jù)間的多元幾何結(jié)構(gòu)特性可有效提高分類精度。與此同時，SSCE、LPSNPE等空-譜類方法，通過融合樣本數(shù)據(jù)的空間信息，其分類性能要優(yōu)于PCA、LDA、LPP、MFA、RLDE等僅利用了光譜信息的圖嵌入方法。在各種訓(xùn)練條件下SSRSHE方法的分類性能均優(yōu)于其他算法，因為它利用了超圖框架來表示各樣本鄰域內(nèi)頂點間的多元幾何關(guān)系，因而可更好描述數(shù)據(jù)中復(fù)雜鄰域結(jié)構(gòu)。同時SSRSHE將樣本類別信息融入超圖框架，分別構(gòu)建了稀疏本征超圖和懲罰超圖，能充分揭示數(shù)據(jù)間的復(fù)雜判別多元關(guān)系，提取出更有效的低維鑒別特征，進(jìn)一步提升分類精度。

為進(jìn)一步探索SSRSHE對每種地物的分類性能，從Indian Pines數(shù)據(jù)集每一類里隨機(jī)選擇3%的像元為訓(xùn)練樣本，余下數(shù)據(jù)用于測試。表 2為不同維數(shù)約簡算法對于每一種地物的總體分類精度、平均分類精度、Kappa系數(shù)及降維運行時間，其對應(yīng)在整個數(shù)據(jù)集上的分類結(jié)果如圖 7所示。

表 2 不同算法在Indian Pines數(shù)據(jù)集每類地物上的分類精度Tab. 2 Classification accuracy of different types of features on Indian Pines data set by different algorithms

(%)
class	train	test	RAW	PCA	LDA	LPP	MFA	RLDE	RSHE	DHLP	SSCE	LPSNPE	SSRSHE
1	10	36	41.67	41.67	77.78	36.11	50.00	61.11	47.22	63.89	55.56	77.78	94.44
2	143	1285	53.39	52.45	64.12	51.05	56.03	72.14	66.15	66.69	60.31	80.78	88.17
3	83	747	57.30	55.29	57.70	47.12	50.07	61.58	63.32	61.58	63.45	74.30	80.46
4	24	213	41.78	44.60	52.58	43.19	21.60	58.69	59.62	59.15	51.17	77.00	84.04
5	48	435	78.85	78.62	89.43	77.93	78.85	86.90	82.99	87.82	80.46	91.72	96.55
6	73	657	90.26	89.50	95.74	91.02	94.67	95.28	97.41	95.89	94.52	96.04	97.02
7	10	18	77.78	88.89	100	88.89	77.78	94.44	100	94.44	100	94.44	100
8	48	430	95.58	95.58	99.53	93.95	93.26	99.30	93.49	99.77	92.56	99.53	98.60
9	10	10	70.00	70.00	60.00	50.00	70.00	80.00	80.00	90.00	90.00	100	80.00
10	97	875	61.03	60.46	60.91	57.49	42.06	68.91	73.83	63.20	72.11	82.74	83.89
11	246	2209	69.76	69.85	71.89	69.62	58.85	79.36	82.66	79.22	74.02	85.92	89.50
12	59	534	39.33	37.45	65.36	32.02	47.38	67.42	60.30	62.73	50.56	87.83	83.71
13	21	184	88.04	88.04	97.83	88.04	94.57	97.28	95.65	98.37	94.57	98.91	100
14	127	1138	94.02	93.94	94.11	92.88	90.69	96.66	93.15	95.61	93.94	96.10	95.52
15	39	347	31.12	30.55	54.18	25.07	42.65	40.92	56.48	48.41	55.04	71.47	83.57
16	10	83	91.57	91.57	90.36	85.54	85.54	90.36	84.34	92.77	84.34	92.77	97.59
OA			68.33	67.88	74.44	65.91	64.03	78.27	78.17	77.00	74.06	87.65	89.78
AA			67.59	68.03	76.97	64.37	65.87	78.15	77.29	78.72	75.79	88.02	90.88
Kappa			0.638	0.633	0.707	0.609	0.589	0.751	0.750	0.736	0.704	0.858	0.884
DR time			0	0.01	0.01	0.15	0.20	3.28	11.87	5.86	432.8	15.15	27.87

圖 7 在Indian Pines數(shù)據(jù)集上，各降維算法對應(yīng)的全分類結(jié)果Fig. 7 Classification map of different DR methods on Indian Pines data set

從表 2可發(fā)現(xiàn)，SSRSHE的分類性能表現(xiàn)最佳，在每類上的總體分類精度、平均分類精度、Kappa值均優(yōu)于其他方法，且對比SSCE算法，其運行效率快，優(yōu)勢明顯。這是因為SSRSHE算超圖學(xué)習(xí)，充分揭示了數(shù)據(jù)間高階關(guān)系，以及像元空間特征的有效利用，有效表征了影像內(nèi)蘊(yùn)特性，提取的嵌入特征更具鑒別力，更有助于地物分類。同時，從圖 7可以看到，本文算法相比其他算法，在其分類結(jié)果圖更趨于平滑，尤其在“Alfalfa”、“Soybeans-min”、“Stone-steel towers”等區(qū)域更明顯。由此可見，本文算法基于空-譜信息與超圖模型協(xié)同學(xué)習(xí)，實現(xiàn)有效鑒別特征提取，改善影像分類精度，確實具有一定實踐意義。

2.4 PaviaU試驗結(jié)果與分析

在試驗中，從每種地物中隨機(jī)選取5、20、50、100、200個樣本用于訓(xùn)練，其余數(shù)據(jù)用來測試，采用最近鄰分類器進(jìn)行分類。表 3為在不同的訓(xùn)練樣本數(shù)目下各維數(shù)約簡算法對應(yīng)的總體分類精度及Kappa值。

表 3 不同算法在PaviaU數(shù)據(jù)集上的分類效果Tab. 3 Classification with different numbers of training data via different DR methods on PaviaU data set

算法	5		20		50		100		200
算法	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa	總體分類精準(zhǔn)度/(%)	Kappa
RAW	60.5±4.2	0.512	66.4±2.4	0.583	73.5±1.6	0.663	76.4±0.8	0.698	78.8±0.8	0.724
PCA	60.5±4.2	0.512	66.5±2.2	0.583	73.4±1.6	0.662	76.4±0.8	0.697	78.7±0.8	0.724
LDA	46.7±6.4	0.351	59.6±1.8	0.495	73.5±1.4	0.662	78.9±0.9	0.727	83.4±0.6	0.782
LPP	47.0±5.6	0.354	59.3±2.6	0.500	72.8±2.3	0.654	78.3±1.3	0.722	82.2±1.2	0.768
MFA	64.5±4.3	0.555	69.2±4.5	0.613	76.4±2.0	0.699	78.1±2.4	0.715	79.1±2.2	0.730
RLDE	64.4±3.2	0.555	74.6±2.7	0.677	77.9±2.2	0.718	82.1±1.0	0.770	84.8±1.0	0.802
RSHE	63.2±4.1	0.540	75.4±2.3	0.685	78.3±1.4	0.720	83.4±0.9	0.784	84.9±1.3	0.802
DHLP	56.8±8.0	0.471	62.2±3.6	0.530	70.8±2.1	0.629	77.5±2.7	0.711	80.2±1.5	0.742
SSCE	42.3±5.3	0.309	63.3±2.9	0.543	75.8±1.7	0.692	82.7±1.2	0.814	87.0±0.8	0.828
LPSNPE	68.0±4.2	0.606	80.0±2.2	0.747	86.3±1.3	0.822	87.9±0.9	0.842	89.9±0.6	0.877
SSRSHE	71.6±2.7	0.646	82.6±2.3	0.776	87.5±1.1	0.837	90.0±1.5	0.882	92.2±0.2	0.908

依據(jù)表 3，在大多數(shù)訓(xùn)練條件下，DHLP、RSHE等超圖方法和SSCE、LPSNPE等空-譜聯(lián)合方法的分類結(jié)果要優(yōu)于直接圖嵌入方法，這表明超圖學(xué)習(xí)和空-譜融合信息均有利于高光譜數(shù)據(jù)鑒別特征提取，有效改善地物分類性能。本文提出的SSRSHE方法在各種試驗條件下，均具有最佳分類性能，這是因為其不僅通過超圖學(xué)習(xí)發(fā)現(xiàn)高光譜數(shù)據(jù)中復(fù)雜結(jié)構(gòu)，且有效融入了空間信息，在低維空間中使同類信息聚集、非同類信息遠(yuǎn)離，提高了數(shù)據(jù)可分性，進(jìn)而有效提高地物分類效果。

為進(jìn)一步分析SSRSHE方法在每種地物上的分類性能，從每類地物里隨機(jī)選擇5%的像元組成訓(xùn)練樣本集，其他部分為測試樣本集。表 4反映了不同維數(shù)約簡方法在每類地物的分類效果，圖 8則為各方法對整個PaviaU遙感圖像分類的結(jié)果圖。由表 4可以看到，SSRSHE在大多數(shù)地物類別中的分類性能要優(yōu)于其他方法，表明在影像地物分類過程中，SSRSHE算法可使同類數(shù)據(jù)的關(guān)聯(lián)性，異物數(shù)據(jù)間奇異性增強(qiáng)，鑒別特征尤為突出，分類性能更佳。同時，在圖 8中，本文方法在“Asphalt”，“Meadows”，“Gravel”等地物區(qū)域的分類結(jié)果較為光滑，誤分點較少，且運行時間并沒大幅度增加，表明聯(lián)合空-譜特性與超圖學(xué)習(xí)的SSRSHE算法的地物分類性能有明顯提升，更適合實際應(yīng)用場景。

表 4 不同算法在PaviaU數(shù)據(jù)集每種地物上的分類精度Tab. 4 Classification accuracy of different types of features on PaviaU data set by different algorithms

(%)
class	train	test	RAW	PCA	LDA	LPP	MFA	RLDE	RSHE	DHLP	SSCE	LPSNPE	SSRSHE
1	332	6299	85.62	85.62	87.68	87.82	82.76	90.19	87.46	63.89	89.73	90.20	91.19
2	933	17716	94.65	94.57	94.88	94.76	93.90	97.73	95.80	66.69	96.70	97.53	98.12
3	105	1994	65.15	64.64	63.34	67.00	61.84	74.77	69.71	61.58	72.37	77.28	78.69
4	154	2910	77.22	77.36	81.79	79.01	77.02	84.13	79.59	59.15	84.78	87.83	89.26
5	68	1277	98.83	98.83	98.84	99.30	99.77	99.53	98.98	87.82	99.37	99.77	99.77
6	252	4777	60.26	60.32	65.17	65.47	69.72	70.36	65.24	95.89	73.86	89.68	85.22
7	67	1263	75.30	75.30	66.67	75.69	71.26	80.36	82.58	94.44	88.60	86.06	90.18
8	185	3497	80.27	80.27	74.39	81.42	77.36	84.79	75.24	79.77	82.85	84.68	79.33
9	48	899	100	100	99.44	100	99.67	100	98.44	90.00	99.78	99.89	100
OA			84.92	84.88	85.40	86.27	84.73	89.70	87.31	78.00	89.60	91.30	92.59
AA			81.92	81.88	81.47	83.38	81.48	86.87	85.51	77.72	87.56	89.53	90.55
Kappa			0.797	0.796	0.804	0.815	0.796	0.861	0.825	0.736	0.861	0.883	0.902
DR time			0	0.08	0.03	0.81	1.67	6.80	8.21	5.86	896.2	7.29	15.19

圖 8 在PaviaU數(shù)據(jù)集上，各降維算法對應(yīng)的全分類結(jié)果Fig. 8 Classification map of different DR methods on PaviaU data set

3 總結(jié)

針對傳統(tǒng)圖嵌入降維方法存在不能表征高光譜數(shù)據(jù)中的多元關(guān)系且未有效利用空間信息等問題，本文提出了一種空-譜協(xié)同正則化稀疏超圖嵌入算法。本文算法利用稀疏系數(shù)實現(xiàn)自適應(yīng)近鄰選取，構(gòu)建正則化稀疏超圖模型來揭示高光譜數(shù)據(jù)間的多元幾何結(jié)構(gòu)。此外，考慮到保持樣本的全局特性和局部鄰域結(jié)構(gòu)分別定義樣本總體散度與局部空間鄰域散度，實現(xiàn)空-譜鑒別特征提取。在Indian Pines和PaviaU高光譜數(shù)據(jù)集上試驗結(jié)果表明，相比其他算法，在訓(xùn)練樣本數(shù)較少時，SSRSHE地物分類性能仍有明顯提升。但本文方法僅運用光譜信息構(gòu)建超圖，在下一步工作將考慮空-譜聯(lián)合超圖模型構(gòu)建，以進(jìn)一步提升地物分類效果。

【論文推薦】黃鴻, 陳美利, 王麗華, 等. 空-譜協(xié)同正則化稀疏超圖嵌入的高光譜圖像分類. 測繪學(xué)報，2019，48(6)：676-687. DOI: 10.11947/j.AGCS.2019.20180469