日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

計(jì)算機(jī)視覺(jué)

 賢人好客 2010-08-09

科技名詞定義

中文名稱:
計(jì)算機(jī)視覺(jué)
英文名稱:
computer vision
定義:
用計(jì)算機(jī)來(lái)模擬人的視覺(jué)機(jī)理獲取和處理信息的能力。
所屬學(xué)科:
測(cè)繪學(xué)(一級(jí)學(xué)科) ;攝影測(cè)量與遙感學(xué)(二級(jí)學(xué)科)

 

計(jì)算機(jī)視覺(jué)是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說(shuō),就是是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等機(jī)器視覺(jué),并進(jìn)一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。作為一個(gè)科學(xué)學(xué)科,計(jì)算機(jī)視覺(jué)研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取‘信息’的人工智能系統(tǒng)。這里所 指的信息指Shannon定義的,可以用來(lái)幫助做一個(gè)“決定”的信息。因?yàn)楦兄梢钥醋魇菑母泄傩盘?hào)中提 取信息,所以計(jì)算機(jī)視覺(jué)也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。

 



  

 
定義

  計(jì)算機(jī)視覺(jué)是使用計(jì)算機(jī)及相關(guān)設(shè)備對(duì)生物視覺(jué)的一種模擬。它的主要任務(wù)就是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息,就像人類和許多其他類生物每天所做的那樣。
  計(jì)算機(jī)視覺(jué)既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺(jué)是一門綜合性的學(xué)科,它已經(jīng)吸引了來(lái)自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。

 
解析

  視覺(jué)是各個(gè)應(yīng)用領(lǐng)域,如制造業(yè)、檢驗(yàn)、文檔分析、醫(yī)療診斷,和軍事等領(lǐng)域中各種智能/自主系統(tǒng)中不可分割的一部分。由于它的重要性,一些先進(jìn)國(guó)家,例如美國(guó)把對(duì)計(jì)算機(jī)視覺(jué)的

計(jì)機(jī)覺(jué)領(lǐng)關(guān)

研究列為對(duì)經(jīng)濟(jì)和科學(xué)有廣泛影響的科學(xué)和工程中的重大基本問(wèn)題,即所謂的重大挑戰(zhàn)(grand challenge)。計(jì)算機(jī)視覺(jué)的挑戰(zhàn)是要為計(jì)算機(jī)和機(jī)器人開發(fā)具有與人類水平相當(dāng)?shù)囊曈X(jué)能力。機(jī)器視覺(jué)需要圖象信號(hào),紋理和顏色建模,幾何處理和推理,以及物體建模。一個(gè)有能力的視覺(jué)系統(tǒng)應(yīng)該把所有這些處理都緊密地集成在一起。作為一門學(xué)科,計(jì)算機(jī)視覺(jué)開始于60年代初,但在計(jì)算機(jī)視覺(jué)的基本研究中的許多重要進(jìn)展是在80年代取得的。計(jì)算機(jī)視覺(jué)與人類視覺(jué)密切相關(guān),對(duì)人類視覺(jué)有一個(gè)正確的認(rèn)識(shí)將對(duì)計(jì)算機(jī)視覺(jué)的研究非常有益。為此我們將先介紹人類視覺(jué)。
  人類正在進(jìn)入信息時(shí)代,計(jì)算機(jī)將越來(lái)越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī),而另一方面是計(jì)算機(jī)的功能越來(lái)越強(qiáng),使用方法越來(lái)越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與目前在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過(guò)視覺(jué)和聽覺(jué),語(yǔ)言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語(yǔ)言來(lái)編寫程序,只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī),必須改變過(guò)去的那種讓人來(lái)適應(yīng)計(jì)算機(jī),來(lái)死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過(guò)來(lái)讓計(jì)算機(jī)來(lái)適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進(jìn)行信息交換,也就是讓計(jì)算機(jī)具有視覺(jué)、聽覺(jué)和說(shuō)話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。
  智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用,同時(shí)如果用這樣的計(jì)算機(jī)來(lái)控制各種自動(dòng)化裝置特別是智能機(jī)器人,就可以使這些自動(dòng)化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場(chǎng)合取代人的繁重工作,或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。

 
原理

  計(jì)算機(jī)視覺(jué)就是用各種成象系統(tǒng)代替視覺(jué)器官作為輸入敏感手段,由計(jì)算機(jī)來(lái)代替大腦完成處理和解釋。計(jì)算機(jī)視覺(jué)的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過(guò)視覺(jué)觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過(guò)長(zhǎng)期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺(jué)系統(tǒng),這個(gè)系統(tǒng)能依據(jù)視覺(jué)敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺(jué)的一個(gè)重要應(yīng)用領(lǐng)域就是自主車輛的視覺(jué)導(dǎo)航,目前還沒(méi)有條件實(shí)現(xiàn)象人那樣能識(shí)別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。因此,目前人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺(jué)輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺(jué)系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺(jué)的方法完成視覺(jué)信息的處理。計(jì)算機(jī)視覺(jué)可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來(lái)進(jìn)行視覺(jué)信息的處理。但是,人類視覺(jué)系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺(jué)系統(tǒng)。如在以下的章節(jié)中會(huì)看到的那樣,對(duì)人類視覺(jué)處理機(jī)制的研究將給計(jì)算機(jī)視覺(jué)的研究提供啟發(fā)和指導(dǎo)。因此,用計(jì)算機(jī)信息處理的方法研究人類視覺(jué)的機(jī)理,建立人類視覺(jué)的計(jì)算理論,也是一個(gè)非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(jué)(Computational Vision)。計(jì)算視覺(jué)可被認(rèn)為是計(jì)算機(jī)視覺(jué)中的一個(gè)研究領(lǐng)域。

 
相關(guān)

  有不少學(xué)科的研究目標(biāo)與計(jì)算機(jī)視覺(jué)相近或與此有關(guān)。這些學(xué)科中包括圖象處理、模式識(shí)別或圖象識(shí)別、景物分析、圖象理解等。由于歷史發(fā)展或領(lǐng)域本身的特點(diǎn)這些學(xué)科互有差別,但又有某種程度的相互重迭。

圖象處理

  圖象處理技術(shù)把輸入圖象轉(zhuǎn)換成具有所希望特性的另一幅圖象。例如,可通過(guò)處理使輸出圖象有較高的信-噪比,或通過(guò)增強(qiáng)處理突出圖象的細(xì)節(jié),以便于操作員的檢驗(yàn)。在計(jì)算機(jī)視覺(jué)研究中經(jīng)常利用圖象處理技術(shù)進(jìn)行預(yù)處理和特征抽取。

模式識(shí)別

  模式識(shí)別技術(shù)根據(jù)從圖象抽取的統(tǒng)計(jì)特性或結(jié)構(gòu)信息,把圖象分成予定的類別。例如,文字識(shí)別或指紋識(shí)別。在計(jì)算機(jī)視覺(jué)中模式識(shí)別技術(shù)經(jīng)常用于對(duì)圖象中的某些部分,例如分割區(qū)域的識(shí)別和分類。

圖象理解

  給定一幅圖象,圖象理解程序不僅描述圖象本身,而且描述和解釋圖象所代表的景物,以便對(duì)圖象代表的內(nèi)容作出決定。在人工智能視覺(jué)研究的初期經(jīng)常使用景物分析這個(gè)術(shù)語(yǔ),以強(qiáng)調(diào)二維圖象與三維景物之間的區(qū)別。圖象理解除了需要復(fù)雜的圖象處理以外還需要具有關(guān)于景物成象的物理規(guī)律的知識(shí)以及與景物內(nèi)容有關(guān)的知識(shí)。
  在建立計(jì)算機(jī)視覺(jué)系統(tǒng)時(shí)需要用到上述學(xué)科中的有關(guān)技術(shù),但計(jì)算機(jī)視覺(jué)研究的內(nèi)容要比這些學(xué)科更為廣泛。計(jì)算機(jī)視覺(jué)的研究與人類視覺(jué)的研究密切相關(guān)。為實(shí)現(xiàn)建立與人的視覺(jué)系統(tǒng)相類似的通用計(jì)算機(jī)視覺(jué)系統(tǒng)的目標(biāo)需要建立人類視覺(jué)的計(jì)算機(jī)理論。

 
現(xiàn)狀

  計(jì)算機(jī)視覺(jué)領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。這一領(lǐng)域的先驅(qū)可追溯到更早的時(shí)候,但是直到20世紀(jì)70年代后期,當(dāng)計(jì)算機(jī)的性能提高到足以處理諸如圖像這樣的大規(guī)模數(shù)據(jù)時(shí),計(jì)算機(jī)視覺(jué)才得到了正式的關(guān)注和發(fā)展。然而這些發(fā)展往往起源于其他不同領(lǐng)域的需要,因而何謂“計(jì)算機(jī)視覺(jué)問(wèn)題”始終沒(méi)有得到正式定義,很自然地,“計(jì)算機(jī)視覺(jué)問(wèn)題”應(yīng)當(dāng)被如何解決也沒(méi)有成型的公式。
  盡管如此,人們已開始掌握部分解決具體計(jì)算機(jī)視覺(jué)任務(wù)的方法,可惜這些方法通常都僅適用于一群狹隘的目標(biāo)(如:臉孔、指紋、文字等),因而無(wú)法被廣泛地應(yīng)用于不同場(chǎng)合。
  對(duì)這些方法的應(yīng)用通常作為某些解決復(fù)雜問(wèn)題的大規(guī)模系統(tǒng)的一個(gè)組成部分(例如醫(yī)學(xué)圖像的處理,工業(yè)制造中的質(zhì)量控制與測(cè)量)。在計(jì)算機(jī)視覺(jué)的大多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方法正日漸普及,一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展,未來(lái)“泛用型”的電腦視覺(jué)應(yīng)用或許可以成真。
  人工智能所研究的一個(gè)主要問(wèn)題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”?從而使之完成特定的技術(shù)動(dòng)作(例如:移動(dòng)一個(gè)機(jī)器人通過(guò)某種特定環(huán)境)。這一問(wèn)題便與計(jì)算機(jī)視覺(jué)問(wèn)題息息相關(guān)。在這里,計(jì)算機(jī)視覺(jué)系統(tǒng)作為一個(gè)感知器,為決策提供信息。另外一些研究方向包括模式識(shí)別和機(jī)器學(xué)習(xí)(這也隸屬于人工智能領(lǐng)域,但與計(jì)算機(jī)視覺(jué)有著重要聯(lián)系),也由此,計(jì)算機(jī)視覺(jué)時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個(gè)分支。
  物理是與計(jì)算機(jī)視覺(jué)有著重要聯(lián)系的另一領(lǐng)域。
  計(jì)算機(jī)視覺(jué)關(guān)注的目標(biāo)在于充分理解電磁波——主要是可見光與紅外線部分——遇到物體表面被反射所形成的圖像,而這一過(guò)程便是基于光學(xué)物理和固態(tài)物理,一些尖端的圖像感知系統(tǒng)甚至?xí)?yīng)用到量子力學(xué)理論,來(lái)解析影像所表示的真實(shí)世界。同時(shí),物理學(xué)中的很多測(cè)量難題也可以通過(guò)計(jì)算機(jī)視覺(jué)得到解決,例如流體運(yùn)動(dòng)。也由此,計(jì)算機(jī)視覺(jué)同樣可以被看作是物理學(xué)的拓展。
  另一個(gè)具有重要意義的領(lǐng)域是神經(jīng)生物學(xué),尤其是其中生物視覺(jué)系統(tǒng)的部分。
  在整個(gè)20世紀(jì)中,人類對(duì)各種動(dòng)物的眼睛、神經(jīng)元、以及與視覺(jué)刺激相關(guān)的腦部組織都進(jìn)行了廣泛研究,這些研究得出了一些有關(guān)“天然的”視覺(jué)系統(tǒng)如何運(yùn)作的描述(盡管仍略嫌粗略),這也形成了計(jì)算機(jī)視覺(jué)中的一個(gè)子領(lǐng)域——人們?cè)噲D建立人工系統(tǒng),使之在不同的復(fù)雜程度上模擬生物的視覺(jué)運(yùn)作。同時(shí)計(jì)算機(jī)視覺(jué)領(lǐng)域中,一些基于機(jī)器學(xué)習(xí)的方法也有參考部分生物機(jī)制。
  計(jì)算機(jī)視覺(jué)的另一個(gè)相關(guān)領(lǐng)域是信號(hào)處理。很多有關(guān)單元變量信號(hào)的處理方法,尤其對(duì)是時(shí)變信號(hào)的處理,都可以很自然的被擴(kuò)展為計(jì)算機(jī)視覺(jué)中對(duì)二元變量信號(hào)或者多元變量信號(hào)的處理方法。但由于圖像數(shù)據(jù)的特有屬性,很多計(jì)算機(jī)視覺(jué)中發(fā)展起來(lái)的方法,在單元信號(hào)的處理方法中卻找不到對(duì)應(yīng)版本。這類方法的一個(gè)主要特征,便是他們的非線性以及圖像信息的多維性,以上二點(diǎn)作為計(jì)算機(jī)視覺(jué)的一部分,在信號(hào)處理學(xué)中形成了一個(gè)特殊的研究方向。
  除了上面提到的領(lǐng)域,很多研究課題同樣可被當(dāng)作純粹的數(shù)學(xué)問(wèn)題。例如,計(jì)算機(jī)視覺(jué)中的很多問(wèn)題,其理論基礎(chǔ)便是統(tǒng)計(jì)學(xué),最優(yōu)化理論以及幾何學(xué)。
  如何使既有方法通過(guò)各種軟硬件實(shí)現(xiàn),或說(shuō)如何對(duì)這些方法加以修改,而使之獲得合理的執(zhí)行速度而又不損失足夠精度,是現(xiàn)今電腦視覺(jué)領(lǐng)域的主要課題。

 
用途

  人類正在進(jìn)入信息時(shí)代,計(jì)算機(jī)將越來(lái)越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī),而另一方面是計(jì)算機(jī)的功能越來(lái)越強(qiáng),使用方法越來(lái)越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與目前在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過(guò)視覺(jué)和聽覺(jué),語(yǔ)言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語(yǔ)言來(lái)編寫程序,只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī),必須改變過(guò)去的那種讓人來(lái)適應(yīng)計(jì)算機(jī),來(lái)死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過(guò)來(lái)讓計(jì)算機(jī)來(lái)適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進(jìn)行信息交換,也就是讓計(jì)算機(jī)具有視覺(jué)、聽覺(jué)和說(shuō)話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。
  智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用,同時(shí)如果用這樣的計(jì)算機(jī)來(lái)控制各種自動(dòng)化裝置特別是智能機(jī)器人,就可以使這些自動(dòng)化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場(chǎng)合取代人的繁重工作,或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。
  計(jì)算機(jī)視覺(jué)就是用各種成象系統(tǒng)代替視覺(jué)器官作為輸入敏感手段,由計(jì)算機(jī)來(lái)代替大腦完成處理和解釋。計(jì)算機(jī)視覺(jué)的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過(guò)視覺(jué)觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過(guò)長(zhǎng)期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺(jué)系統(tǒng),這個(gè)系統(tǒng)能依據(jù)視覺(jué)敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺(jué)的一個(gè)重要應(yīng)用領(lǐng)域就是自主車輛的視覺(jué)導(dǎo)航,目前還沒(méi)有條件實(shí)現(xiàn)象人那樣能識(shí)別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。因此,目前人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺(jué)輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺(jué)系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺(jué)的方法完成視覺(jué)信息的處理。計(jì)算機(jī)視覺(jué)可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來(lái)進(jìn)行視覺(jué)信息的處理。但是,人類視覺(jué)系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺(jué)系統(tǒng)。如在以下的章節(jié)中會(huì)看到的那樣,對(duì)人類視覺(jué)處理機(jī)制的研究將給計(jì)算機(jī)視覺(jué)的研究提供啟發(fā)和指導(dǎo)。因此,用計(jì)算機(jī)信息處理的方法研究人類視覺(jué)的機(jī)理,建立人類視覺(jué)的計(jì)算理論,也是一個(gè)非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(jué)(Computational Vision)。計(jì)算視覺(jué)可被認(rèn)為是計(jì)算機(jī)視覺(jué)中的一個(gè)研究領(lǐng)域。

 
異同

  計(jì)算機(jī)視覺(jué),圖象處理,圖像分析,機(jī)器人視覺(jué)和機(jī)器視覺(jué)是彼此緊密關(guān)聯(lián)的學(xué)科。如果你翻開帶有上面這些名字的教材,你會(huì)發(fā)現(xiàn)在技術(shù)和應(yīng)用領(lǐng)域上他們都有著相當(dāng)大部分的重疊。這表明這些學(xué)科的基礎(chǔ)理論大致是相同的,甚至讓人懷疑他們是同一學(xué)科被冠以不同的名稱。
  然而,各研究機(jī)構(gòu),學(xué)術(shù)期刊,會(huì)議及公司往往把自己特別的歸為其中某一個(gè)領(lǐng)域,于是各種各樣的用來(lái)區(qū)分這些學(xué)科的特征便被提了出來(lái)。下面將給出一種區(qū)分方法,盡管并不能說(shuō)這一區(qū)分方法完全準(zhǔn)確。
  計(jì)算機(jī)視覺(jué)的研究對(duì)象主要是映射到單幅或多幅圖像上的三維場(chǎng)景,例如三維場(chǎng)景的重建。計(jì)算機(jī)視覺(jué)的研究很大程度上針對(duì)圖像的內(nèi)容。
  圖象處理與圖像分析的研究對(duì)象主要是二維圖像,實(shí)現(xiàn)圖像的轉(zhuǎn)化,尤其針對(duì)像素級(jí)的操作,例如提高圖像對(duì)比度,邊緣提取,去噪聲和幾何變換如圖像旋轉(zhuǎn)。這一特征表明無(wú)論是圖像處理還是圖像分析其研究?jī)?nèi)容都和圖像的具體內(nèi)容無(wú)關(guān)。
  機(jī)器視覺(jué)主要是指工業(yè)領(lǐng)域的視覺(jué)研究,例如自主機(jī)器人的視覺(jué),用于檢測(cè)和測(cè)量的視覺(jué)。這表明在這一領(lǐng)域通過(guò)軟件硬件,圖像感知與控制理論往往與圖像處理得到緊密結(jié)合來(lái)實(shí)現(xiàn)高效的機(jī)器人控制或各種實(shí)時(shí)操作。
  模式識(shí)別使用各種方法從信號(hào)中提取信息,主要運(yùn)用統(tǒng)計(jì)學(xué)的理論。此領(lǐng)域的一個(gè)主要方向便是從圖像數(shù)據(jù)中提取信息。
  還有一個(gè)領(lǐng)域被稱為成像技術(shù)。這一領(lǐng)域最初的研究?jī)?nèi)容主要是制作圖像,但有時(shí)也涉及到圖像分析和處理。例如,醫(yī)學(xué)成像就包含大量的醫(yī)學(xué)領(lǐng)域的圖像分析。
  對(duì)于所有這些領(lǐng)域,一個(gè)可能的過(guò)程是你在計(jì)算機(jī)視覺(jué)的實(shí)驗(yàn)室工作,工作中從事著圖象處理,最終解決了機(jī)器視覺(jué)領(lǐng)域的問(wèn)題,然后把自己的成果發(fā)表在了模式識(shí)別的會(huì)議上。

 
問(wèn)題

  幾乎在每個(gè)計(jì)算機(jī)視覺(jué)技術(shù)的具體應(yīng)用都要解決一系列相同的問(wèn)題。這些經(jīng)典的問(wèn)題包括:

識(shí)別

  一個(gè)計(jì)算機(jī)視覺(jué),圖像處理和機(jī)器視覺(jué)所共有的經(jīng)典問(wèn)題便是判定一組圖像數(shù)據(jù)中是否包含某個(gè)特定的物體,圖像特征或運(yùn)動(dòng)狀態(tài)。這一問(wèn)題通??梢酝ㄟ^(guò)機(jī)器自動(dòng)解決,但是到目前為止,還沒(méi)有某個(gè)單一的方法能夠廣泛的對(duì)各種情況進(jìn)行判定:在任意環(huán)境中識(shí)別任意物體。現(xiàn)有技術(shù)能夠也只能夠很好地解決特定目標(biāo)的識(shí)別,比如簡(jiǎn)單幾何圖形識(shí)別,人臉識(shí)別,印刷或手寫文件識(shí)別或者車輛識(shí)別。而且這些識(shí)別需要在特定的環(huán)境中,具有指定的光照,背景和目標(biāo)姿態(tài)要求。
  廣義的識(shí)別在不同的場(chǎng)合又演化成了幾個(gè)略有差異的概念:
  識(shí)別(狹義的):對(duì)一個(gè)或多個(gè)經(jīng)過(guò)預(yù)先定義或?qū)W習(xí)的物體或物類進(jìn)行辨識(shí),通常在辨識(shí)過(guò)程中還要提供他們的二維位置或三維姿態(tài)。
  鑒別:識(shí)別辨認(rèn)單一物體本身。例如:某一人臉的識(shí)別,某一指紋的識(shí)別。
  監(jiān)測(cè):從圖像中發(fā)現(xiàn)特定的情況內(nèi)容。例如:醫(yī)學(xué)中對(duì)細(xì)胞或組織不正常技能的發(fā)現(xiàn),交通監(jiān)視儀器對(duì)過(guò)往車輛的發(fā)現(xiàn)。監(jiān)測(cè)往往是通過(guò)簡(jiǎn)單的圖象處理發(fā)現(xiàn)圖像中的特殊區(qū)域,為后繼更復(fù)雜的操作提供起點(diǎn)。
  識(shí)別的幾個(gè)具體應(yīng)用方向:
  基于內(nèi)容的圖像提?。涸诰薮蟮膱D像集合中尋找包含指定內(nèi)容的所有圖片。被指定的內(nèi)容可以是多種形式,比如一個(gè)紅色的大致是圓形的圖案,或者一輛自行車。在這里對(duì)后一種內(nèi)容的尋找顯然要比前一種更復(fù)雜,因?yàn)榍耙环N描述的是一個(gè)低級(jí)直觀的視覺(jué)特征,而后者則涉及一個(gè)抽象概念(也可以說(shuō)是高級(jí)的視覺(jué)特征),即‘自行車’,顯然的一點(diǎn)就是自行車的外觀并不是固定的。
  姿態(tài)評(píng)估:對(duì)某一物體相對(duì)于攝像機(jī)的位置或者方向的評(píng)估。例如:對(duì)機(jī)器臂姿態(tài)和位置的評(píng)估。
  光學(xué)字符識(shí)別對(duì)圖像中的印刷或手寫文字進(jìn)行識(shí)別鑒別,通常的輸出是將之轉(zhuǎn)化成易于編輯的文檔形式。

運(yùn)動(dòng)

  基于序列圖像的對(duì)物體運(yùn)動(dòng)的監(jiān)測(cè)包含多種類型,諸如:
  自體運(yùn)動(dòng):監(jiān)測(cè)攝像機(jī)的三維剛性運(yùn)動(dòng)。
  圖像跟蹤:跟蹤運(yùn)動(dòng)的物體。

場(chǎng)景重建

  給定一個(gè)場(chǎng)景的二或多幅圖像或者一段錄像,場(chǎng)景重建尋求為該場(chǎng)景建立一個(gè)計(jì)算機(jī)模型/三維模型。最簡(jiǎn)單的情況便是生成一組三維空間中的點(diǎn)。更復(fù)雜的情況下會(huì)建立起完整的三維表面模型。

圖像恢復(fù)

  圖像恢復(fù)的目標(biāo)在于移除圖像中的噪聲,例如儀器噪聲,模糊等。

 
系統(tǒng)

  計(jì)算機(jī)視覺(jué)系統(tǒng)的結(jié)構(gòu)形式很大程度上依賴于其具體應(yīng)用方向。有些是獨(dú)立工作的,用于解決具體的測(cè)量或檢測(cè)問(wèn)題;也有些作為某個(gè)大型復(fù)雜系統(tǒng)的組成部分出現(xiàn),比如和機(jī)械控制系統(tǒng),數(shù)據(jù)庫(kù)系統(tǒng),人機(jī)接口設(shè)備協(xié)同工作。計(jì)算機(jī)視覺(jué)系統(tǒng)的具體實(shí)現(xiàn)方法同時(shí)也由其功能決定——是預(yù)先固定的抑或是在運(yùn)行過(guò)程中自動(dòng)學(xué)習(xí)調(diào)整。盡管如此,有些功能卻幾乎是每個(gè)計(jì)算機(jī)系統(tǒng)都需要具備的:

圖像獲取

  一幅數(shù)字圖像是由一個(gè)或多個(gè)圖像感知器產(chǎn)生,這里的感知器可以是各種光敏攝像機(jī),包括遙感設(shè)備,X射線斷層攝影儀,雷達(dá),超聲波接收器等。去絕不與同的感知器,產(chǎn)生的圖片可以是普通的二維圖像,三維圖組或者一個(gè)圖像序列。圖片的像素值往往對(duì)應(yīng)于光在一個(gè)或多個(gè)光譜段上的強(qiáng)度(灰度圖或彩色圖),但也可以是相關(guān)的各種物理數(shù)據(jù),如聲波,電磁波或核磁共振的深度,吸收度或反射度。

預(yù)處理

  在對(duì)圖像實(shí)施具體的計(jì)算機(jī)視覺(jué)方法來(lái)提取某種特定的信息前,一種或一些預(yù)處理往往被采用來(lái)使圖像滿足后繼方法的要求。例如:
  二次取樣保證圖像坐標(biāo)的正確;
  平滑去噪來(lái)濾除感知器引入的設(shè)備噪聲;
  提高對(duì)比度來(lái)保證實(shí)現(xiàn)相關(guān)信息可以被檢測(cè)到;
  調(diào)整尺度空間使圖像結(jié)構(gòu)適合局部應(yīng)用。

特征提取

  從圖像中提取各種復(fù)雜度的特征。例如:
  線,邊緣提取;
  局部化的特征點(diǎn)檢測(cè)如邊角檢測(cè),斑點(diǎn)檢測(cè);
  更復(fù)雜的特征可能與圖像中的紋理形狀或運(yùn)動(dòng)有關(guān)。

檢測(cè)分割

  在圖像處理過(guò)程中,有時(shí)會(huì)需要對(duì)圖像進(jìn)行分割來(lái)提取有價(jià)值的用于后繼處理的部分,例如
  篩選特征點(diǎn);
  分割一或多幅圖片中含有特定目標(biāo)的部分。

高級(jí)處理

  到了這一步,數(shù)據(jù)往往具有很小的數(shù)量,例如圖像中經(jīng)先前處理被認(rèn)為含有目標(biāo)物體的部分。這時(shí)的處理包括:
  驗(yàn)證得到的數(shù)據(jù)是否符合前提要求;
  估測(cè)特定系數(shù),比如目標(biāo)的姿態(tài),體積;
  對(duì)目標(biāo)進(jìn)行分類。

 
要件

  光源布局影響大需審慎考量。
  正確的選擇鏡組,考量倍率、空間、尺寸、失真… 。
  選擇合適的攝影機(jī)(CCD),考量功能、規(guī)格、穩(wěn)定性、耐用...。
  視覺(jué)軟件開發(fā)需靠經(jīng)驗(yàn)累積,多嘗試、思考問(wèn)題的解決途徑。
  以創(chuàng)造精度的不斷提升,縮短處理時(shí)間為最終目標(biāo)。

 
會(huì)議

頂級(jí)

  ICCV:International Conference on Computer Vision,國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)
  CVPR:International Conference on Computer Vision and Pattern Recognition,國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別大會(huì)
  ECCV:European Conference on Computer Vision,歐洲計(jì)算機(jī)視覺(jué)大會(huì)

較好

  ICIP:International Conference on Image Processing,國(guó)際圖像處理大會(huì)
  BMVC:British Machine Vision Conference,英國(guó)機(jī)器視覺(jué)大會(huì)
  ICPR:International Conference on Pattern Recognition,國(guó)際模式識(shí)別大會(huì)
  ACCV:Asian Conference on Computer Vision,亞洲計(jì)算機(jī)視覺(jué)大會(huì)

 
期刊

頂級(jí)

  PAMI:IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE 模式分析與機(jī)器智能雜志
  IJCV:International Journal on Computer Vision,國(guó)際計(jì)算機(jī)視覺(jué)雜志

較好

  CVIU:Computer Vision and Image Understanding,計(jì)算機(jī)視覺(jué)與圖像理解
  PR:Pattern Recognition,模式識(shí)別
  PRL:Pattern Recognition Letters,模式識(shí)別快報(bào)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多