限時干貨下載:回復(fù)“資料”獲取獲取機(jī)器視覺教程,行業(yè)報告等資源,百度盤群組分享鏈接更新時間:2018-07-15,失效請?jiān)谖哪┝粞?,不要在后臺留言,你也可以在后臺菜單“資源搜索”搜索更多你想要的網(wǎng)盤資源! 來源:https://blog.csdn.net/Hao_Zhang_Vision/article/details/52664757 點(diǎn)擊閱讀原文進(jìn)入 圖像識別任務(wù)面臨著諸多挑戰(zhàn), 這使得它自計(jì)算機(jī)視覺領(lǐng)域1966年誕生以來就成為一個十分活躍的子領(lǐng)域. 本文將簡要討論圖像識別問題的挑戰(zhàn)以及為了應(yīng)對這些挑戰(zhàn)而使用的數(shù)據(jù)驅(qū)動過程. 1. 圖像分類問題的挑戰(zhàn) 雖然從圖像中識別一個對象對人類來說非常的簡單, 但圖像識別對計(jì)算機(jī)來說是一項(xiàng)極具挑戰(zhàn)性的工作. 在計(jì)算機(jī)內(nèi), 圖像是由一個很大三維數(shù)組表示的. 比如一張 1024 * 768 的圖像, 它擁有R, G, B三個分量, 因此, 這張圖像有 1024 * 768 * 3 = 2,359,296 個像素, 每個像素是一個0(黑)到255(白)之間的整數(shù).
除了語義鴻溝之外, 圖像識別還有其他的一些挑戰(zhàn), 見上圖: - 視角變化. 一個相同的目標(biāo)相對攝像機(jī)可以有不同的朝向. 2. 數(shù)據(jù)驅(qū)動過程 我們該怎樣寫出一個算法對圖像進(jìn)行分類呢? 和寫出一個排序算法不同, 我們不知道如果通過指定一系列識別規(guī)則的方法來識別圖像中的目標(biāo)并且能應(yīng)對上述的這些挑戰(zhàn). 回想我們?nèi)祟惸軐D像內(nèi)容進(jìn)行有效的識別, 是因?yàn)槲覀冎耙呀?jīng)積累了許多經(jīng)驗(yàn), 通過對經(jīng)驗(yàn)的利用, 從而對新情況做出判斷. 限時干貨下載:回復(fù)“資料”獲取機(jī)器視覺教程,行業(yè)報告等資源。持續(xù)更新中。。。 |
|