發(fā)文章
發(fā)文工具
撰寫
網(wǎng)文摘手
文檔
視頻
思維導(dǎo)圖
隨筆
相冊
原創(chuàng)同步助手
其他工具
圖片轉(zhuǎn)文字
文件清理
AI助手
留言交流
選自 arXiv
聲音在物體定位中會起到非常重要的作用,人們甚至可以利用自身對聲音的感知來定位視線范圍內(nèi)的物體。在本文中,來自 MIT 計算機(jī)科學(xué)與人工智能實驗室、MIT-IBM 沃森人工智能實驗室團(tuán)隊的研究者提出了一套利用無標(biāo)記的視聽數(shù)據(jù)來自監(jiān)督學(xué)習(xí)的算法,僅依靠立體音頻和攝像機(jī)元數(shù)據(jù)就可以在視覺參考坐標(biāo)系中定位移動的車輛。
論文:https:///pdf/1910.11760.pdf
項目鏈接:http://sound-track.csail./
來自: 西北望msm66g9f > 《培訓(xùn)》
0條評論
發(fā)表
請遵守用戶 評論公約
從視音角度看多模態(tài)學(xué)習(xí)的過去與未來
視音模態(tài)的一致性不僅為多模態(tài)識別任務(wù)提供了基礎(chǔ),還使得用借助某一模態(tài)增強(qiáng)另一模態(tài)信號成為可能。圖2:視音提升任務(wù)4跨模態(tài)感知。認(rèn)...
機(jī)器視覺之外,機(jī)器人的感知補全計劃
機(jī)器視覺之外,機(jī)器人的感知補全計劃。圍繞機(jī)器觸覺,機(jī)器人可以實現(xiàn)靈活的物體感知、抓握推舉等各種動作?,F(xiàn)在除了在我們熟知的機(jī)器視...
【泡泡圖靈智庫】看聽:多模態(tài)融合機(jī)器人場景辨識
【泡泡圖靈智庫】看聽:多模態(tài)融合機(jī)器人場景辨識。(2) 通過對視覺數(shù)據(jù)的訓(xùn)練,對VGG16模型進(jìn)行有監(jiān)督的轉(zhuǎn)移學(xué)習(xí),再加上工程化的一系...
【智能座艙】智能座艙中多模態(tài)交互設(shè)計
【智能座艙】智能座艙中多模態(tài)交互設(shè)計。什么是智能座艙與多模態(tài)交互。目前智能座艙的模態(tài)包括視覺、聽覺、觸覺、嗅覺,對應(yīng)的模態(tài)在智...
分割一切模型SAM首篇全面綜述:28頁、200 篇參考文獻(xiàn)
SAM 模型概覽。此外參考文獻(xiàn) [143] 利用現(xiàn)有遙感目標(biāo)檢測數(shù)據(jù)集和以數(shù)據(jù)為中心的機(jī)器學(xué)習(xí)模型 SAM,構(gòu)建了一個大規(guī)模遙感圖像分割數(shù)據(jù)集...
模型的跨界:我拿Transformer去做目標(biāo)檢測,結(jié)果發(fā)現(xiàn)效果不錯
模型的跨界:我拿Transformer去做目標(biāo)檢測,結(jié)果發(fā)現(xiàn)效果不錯。具體來說,研究者在 COCO 目標(biāo)檢測數(shù)據(jù)集上將 DETR 與 Faster R-CNN 基線...
聽覺記憶不如視覺和觸覺記憶牢固
據(jù)美國《大西洋月刊》報道,我們都會遇到這樣的情況,當(dāng)別人口頭上告訴我們一件事時,我們經(jīng)常會忘得一干二凈。與此同時,對聽覺、觸覺...
知薦 | 自動駕駛中的感知定位優(yōu)化策略(二)
基于視覺傳感器運動估計定位策略基于視覺方案的傳感器定位策略主要是利用攝像頭搭載到車輛前端或側(cè)端檢測環(huán)境信息,以便計算車輛運動。...
基于環(huán)視相機(jī)的視覺SLAM在自動泊車系統(tǒng)上的應(yīng)用
準(zhǔn)確的區(qū)域地圖將有助于自動泊車,以更有效地泊車,這可以通過視覺SLAM方法實現(xiàn),該方法構(gòu)建泊車區(qū)地圖,后期可用于重定位。在本文中,...
微信掃碼,在手機(jī)上查看選中內(nèi)容