1)、尺度空間的生成;
2)、檢測(cè)尺度空間極值點(diǎn);
3)、精確定位極值點(diǎn);
4)、為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù);
5)、關(guān)鍵點(diǎn)描述子的生成。
![]() ![]() L(x,y,σ), σ= 1.6 a good tradeoff
![]() D(x,y,σ), σ= 1.6 a good tradeoff
![]() ![]() 關(guān)于尺度空間的理解說(shuō)明:圖中的2是必須的,尺度空間是連續(xù)的。在 Lowe的論文中 ,
將第0層的初始尺度定為1.6,圖片的初始尺度定為0.5. 在檢測(cè)極值點(diǎn)前對(duì)原始圖像的高斯
平滑以致圖像丟失高頻信息,所以 Lowe 建議在建立尺度空間前首先對(duì)原始圖像長(zhǎng)寬擴(kuò)展
一倍,以保留原始圖像信息,增加特征點(diǎn)數(shù)量。尺度越大圖像越模糊。
![]() next octave 是由 first octave 降采樣得到(如2)
![]() ![]() 尺度空間的所有取值,s為每組層數(shù),一般為3~5
![]() 同一組中的相鄰尺度(由于k的取值關(guān)系,肯定是上下層)之間進(jìn)行尋找
![]() 在極值比較的過(guò)程中,每一組圖像的首末兩層是無(wú)法進(jìn)行極值比較的,為了滿足尺度
變化的連續(xù)性,我們?cè)诿恳唤M圖像的頂層繼續(xù)用高斯模糊生成了 3 幅圖像,高斯金字
塔有每組S+3層圖像。DOG金字塔每組有S+2層圖像.
![]() ![]() ![]() If ratio > (r+1)2/(r), throw it out (SIFT uses r=10)
![]() 通過(guò)擬和三維二次函數(shù)以精確確定關(guān)鍵點(diǎn)的位置和尺度(達(dá)到亞像素精度)?
![]() 直方圖中的峰值就是主方向,其他的達(dá)到最大值80%的方向可作為輔助方向
![]() Identify peak and assign orientation and sum of magnitude to key point
The user may choose a threshold to exclude key points based on their
assigned sum of magnitudes.
利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù),使算子具備
旋轉(zhuǎn)不變性。以關(guān)鍵點(diǎn)為中心的鄰域窗口內(nèi)采樣,并用直方圖統(tǒng)計(jì)鄰域像素的梯度
方向。梯度直方圖的范圍是0~360度,其中每10度一個(gè)柱,總共36個(gè)柱。隨著距
中心點(diǎn)越遠(yuǎn)的領(lǐng)域其對(duì)直方圖的貢獻(xiàn)也響應(yīng)減小.Lowe論文中還提到要使用高斯函
數(shù)對(duì)直方圖進(jìn)行平滑,減少突變的影響。
![]() 關(guān)鍵點(diǎn)描述子的生成步驟
![]() 通過(guò)對(duì)關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊,計(jì)算塊內(nèi)梯度直方圖,生成具有獨(dú)特性
的向量,這個(gè)向量是該區(qū)域圖像信息的一種抽象,具有唯一性。
![]() 每一個(gè)小格都代表了特征點(diǎn)鄰域所在的尺度空間的一個(gè)像素 ,箭頭方向代表了像素梯
度方向,箭頭長(zhǎng)度代表該像素的幅值。然后在4×4的窗口內(nèi)計(jì)算8個(gè)方向的梯度方向直
方圖。繪制每個(gè)梯度方向的累加可形成一個(gè)種子點(diǎn)。
![]() 每個(gè)直方圖有8方向的梯度方向,每一個(gè)描述符包含一個(gè)位于關(guān)鍵點(diǎn)附近的四個(gè)直方圖
數(shù)組.這就導(dǎo)致了SIFT的特征向量有128維.(先是一個(gè)4×4的來(lái)計(jì)算出一個(gè)直方圖,
每個(gè)直方圖有8個(gè)方向。所以是4×4×8=128維)將這個(gè)向量歸一化之后,就進(jìn)一步
去除了光照的影響。
![]() 旋轉(zhuǎn)為主方向
![]() ![]() ![]() ![]() ![]() ![]() 基本概念及一些補(bǔ)充
什么是局部特征?
·局部特征從總體上說(shuō)是圖像或在視覺(jué)領(lǐng)域中一些有別于其周圍的地方
·局部特征通常是描述一塊區(qū)域,使其能具有高可區(qū)分度
·局部特征的好壞直接會(huì)決定著后面分類、識(shí)別是否會(huì)得到一個(gè)好的結(jié)果
局部特征需具備的特性
·重復(fù)性
·可區(qū)分性
·準(zhǔn)確性
·數(shù)量以及效率
·不變性
局部特征提取算法-sift
·SIFT算法由D.G.Lowe 1999年提出,2004年完善總結(jié)。后來(lái)Y.Ke將其描述子部分用PCA代替直方圖的方式,對(duì)其進(jìn)行改進(jìn)。
·SIFT算法是一種提取局部特征的算法,在尺度空間尋找極值點(diǎn),提取位置,尺度,旋轉(zhuǎn)不變量
·SIFT特征是圖像的局部特征,其對(duì)旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對(duì)視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。
·獨(dú)特性好,信息量豐富,適用于在海量特征數(shù)據(jù)庫(kù)中進(jìn)行快速、準(zhǔn)確的匹配。
·多量性,即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量SIFT特征向量。
·可擴(kuò)展性,可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合。
尺度空間理論
·尺度空間理論目的是模擬圖像數(shù)據(jù)的多尺度特征
·其基本思想是在視覺(jué)信息圖像信息處理模型中引入一個(gè)被視為尺度的參數(shù), 通過(guò)連續(xù)變化尺度參數(shù)獲得不同尺度下的視覺(jué)處理信息, 然后綜合這些信息以深入地挖掘圖像的本質(zhì)特征。
描述子生成的細(xì)節(jié)
·以極值點(diǎn)為中心點(diǎn),并且以此點(diǎn)所處于的高斯尺度sigma值作為半徑因子。對(duì)于遠(yuǎn)離中心點(diǎn)的梯度值降低對(duì)其所處區(qū)域的直方圖的貢獻(xiàn),防止一些突變的影響。
·每個(gè)極值點(diǎn)對(duì)其進(jìn)行三線性插值,這樣可以把此極值點(diǎn)的貢獻(xiàn)均衡的分到直方圖中相鄰的柱子上
歸一化處理
·在求出4*4*8的128維特征向量后,此時(shí)SIFT特征向量已經(jīng)去除了尺度變化、旋轉(zhuǎn)等幾何變形因素的影響。而圖像的對(duì)比度變化相當(dāng)于每個(gè)像素點(diǎn)乘上一個(gè)因子,光照變化是每個(gè)像素點(diǎn)加上一個(gè)值,但這些對(duì)圖像歸一化的梯度沒(méi)有影響。因此將特征向量的長(zhǎng)度歸一化,則可以進(jìn)一步去除光照變化的影響。
·對(duì)于一些非線性的光照變化,SIFT并不具備不變性,但由于這類變化影響的主要是梯度的幅值變化,對(duì)梯度的方向影響較小,因此作者通過(guò)限制梯度幅值的值來(lái)減少這類變化造成的影響。
PCA-SIFT算法
·PCA-SIFT與標(biāo)準(zhǔn)SIFT有相同的亞像素位置,尺度和主方向。但在第4步計(jì)算描述子的設(shè)計(jì),采用的主成分分析的技術(shù)。
·下面介紹一下其特征描述子計(jì)算的部分:
·用特征點(diǎn)周圍的41×41的像斑計(jì)算它的主元,并用PCA-SIFT將原來(lái)的2×39×39維的向量降成20維,以達(dá)到更精確的表示方式。
·它的主要步驟為,對(duì)每一個(gè)關(guān)鍵點(diǎn):在關(guān)鍵點(diǎn)周圍提取一個(gè)41×41的像斑于給定的尺度,旋轉(zhuǎn)到它的主方向 ;計(jì)算39×39水平和垂直的梯度,形成一個(gè)大小為3042的矢量;用預(yù)先計(jì)算好的投影矩陣n×3042與此矢量相乘;這樣生成一個(gè)大小為n的PCA-SIFT描述子。
|
|
來(lái)自: 昵稱20590214 > 《論文相關(guān)》