● 世界那么大,聲音那么多,我們的大腦究竟是如何分辨出每個(gè)人不同的聲音特質(zhì),每種樂器不同的音色? ● 當(dāng)你接到一個(gè)電話,即使環(huán)境嘈雜、信號(hào)不好,你仍可以不費(fèi)吹灰之力聽出電話那頭是熟人還是陌生人。每天,我們大腦接收來自外界的信息紛繁復(fù)雜,只有大腦對(duì)外來刺激進(jìn)行分類后,我們才有了感知判斷。那么大腦是如何開展這項(xiàng)工作的呢? 7月8日,《神經(jīng)元》期刊在線發(fā)表了題為《小鼠聽皮層神經(jīng)元群體結(jié)構(gòu)動(dòng)態(tài)變化實(shí)現(xiàn)感覺到范疇的轉(zhuǎn)化》的研究論文,該研究由張江上海腦科學(xué)與類腦研究中心、中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心(神經(jīng)科學(xué)研究所)的相關(guān)研究員完成。 張江科學(xué)家由此發(fā)現(xiàn)了大腦聽覺皮層分辨高低音范疇中的些許奧妙:在經(jīng)過訓(xùn)練之后,小鼠能夠準(zhǔn)確將不同頻率的單音分類為高頻音和低頻音。而且在聽到臨近分界線的音頻信號(hào)時(shí),小鼠們會(huì)動(dòng)用大量腦細(xì)胞去提高分辨力。更有趣的是,只有當(dāng)它們?cè)趫?zhí)行分類任務(wù)時(shí),大腦內(nèi)的這些神經(jīng)元才會(huì)被激活。 徐寧龍研究員和論文第一作者博士研究生辛宇在安裝小鼠行為訓(xùn)練裝置 這是由于我們大腦接收到的感覺信息種類繁雜,而我們能夠形成的概念和采取的行動(dòng)則數(shù)目有限,為了形成有意義的認(rèn)知來指導(dǎo)行為,我們的大腦需要對(duì)這些信息進(jìn)行高效的組織管理,而其中最基本的過程就是范疇化(categorization)。簡單來講,就是對(duì)外來刺激進(jìn)行分類與定位,從而可以從外部信息中高效抽取最相關(guān)的信息,形成感知判斷。 例如,當(dāng)接收到豐富多樣的語音信息,我們的大腦會(huì)把語音歸類到屬于不同熟悉程度的人,或陌生人。 還有個(gè)例子是我們對(duì)色彩的認(rèn)知。當(dāng)看到彩虹時(shí),盡管其中可見光的波長是連續(xù)變化的,然而我們對(duì)于波長的物理數(shù)值難以形成感性認(rèn)知或顏色概念,因此我們需要將連續(xù)的波長信息范疇化,將其定義為離散的七種顏色類別,即紅橙黃綠青藍(lán)紫,便于信息存儲(chǔ)與交流。這說明感覺信息范疇化可以幫助大腦高效存儲(chǔ)信息,形成認(rèn)知。 世界各國的科學(xué)家們已經(jīng)在不同物種的各種腦區(qū)觀察到與刺激類別相關(guān)的神經(jīng)活動(dòng)。然而,以往的研究側(cè)重的是神經(jīng)運(yùn)算的結(jié)果,對(duì)于感覺信息怎樣被轉(zhuǎn)化為離散的類別信息這一神經(jīng)運(yùn)算過程,并沒有明確答案。 為了探索這個(gè)問題,中科院腦智卓越中心的研究人員在頭部固定小鼠中建立了一個(gè)基于聽覺的分類抉擇行為范式,經(jīng)過訓(xùn)練,小鼠可以將不同頻率的純音歸類到“高音”或“低音”范疇。 同時(shí),研究人員結(jié)合活體雙光子成像技術(shù),在動(dòng)物執(zhí)行任務(wù)的同時(shí)對(duì)聽覺皮層群體神經(jīng)元活動(dòng)進(jìn)行大規(guī)模記錄,并結(jié)合進(jìn)一步的定量分析,從而研究出大腦皮層的神經(jīng)元如何通過動(dòng)態(tài)編碼將感覺信息轉(zhuǎn)化為類別信息的機(jī)制。
基于張江的科學(xué)家們提出的感知分類和新的神經(jīng)運(yùn)算機(jī)制,人類在了解自我、認(rèn)知大腦工作的機(jī)制上又邁出了一小步,而這一小步將有助于我們大步邁入人工智能的新時(shí)代。 那么對(duì)聲音的認(rèn)知又如何與AI結(jié)合,運(yùn)用到真實(shí)的商業(yè)場(chǎng)景中? 隨著5G時(shí)代的來臨,科技的變化也將帶來人機(jī)交互的變化,在人類聽覺、視覺、觸覺、嗅覺這四感中,聽覺通道無疑占有重要的一席。除了各大互聯(lián)網(wǎng)巨頭扎根智能音箱市場(chǎng),搶占物聯(lián)網(wǎng)時(shí)代的第一入口,動(dòng)態(tài)聲紋識(shí)別技術(shù)也在助力金融服務(wù)業(yè)向更高階的智能化方向演進(jìn)。 聲紋識(shí)別技術(shù)曾經(jīng)歷過很長一段的低潮期,直到2011年,科學(xué)家將聲紋識(shí)別率提升30%,同時(shí)將深度學(xué)習(xí)引入聲紋識(shí)別技術(shù),從此,聲紋識(shí)別技術(shù)邁入飛速發(fā)展階段。在深度學(xué)習(xí)的賦能下,如今的聲紋識(shí)別技術(shù)已經(jīng)相對(duì)完善,具有易采集、非接觸、可靠性高等特點(diǎn)??梢源_定的是,聲紋識(shí)別技術(shù)商業(yè)應(yīng)用的大幕才剛剛拉開,其在金融、安防、社保等領(lǐng)域的廣闊應(yīng)用場(chǎng)景令人期待。 登錄手機(jī)銀行APP,開啟聲紋驗(yàn)證,用戶只要準(zhǔn)確說出隨機(jī)動(dòng)態(tài)碼,系統(tǒng)錄制語音信息,驗(yàn)證身紋及隨機(jī)動(dòng)態(tài)碼后,就能進(jìn)行轉(zhuǎn)賬、支付等交易。這是目前很多手機(jī)銀行和ATM上推出的聲紋驗(yàn)證服務(wù)。截至2018年底,建設(shè)銀行的聲紋用戶已突破100萬,日均交易17萬筆,未發(fā)生一例聲紋識(shí)別風(fēng)險(xiǎn)事件。 “每個(gè)人的聲紋都是獨(dú)一無二的,雖然有些人的聲音聽上去幾乎一模一樣,但他們的聲紋會(huì)顯示出差異性?!?/span> 位于張江的數(shù)鏈聯(lián)盟發(fā)起人卞陽解釋說,聲紋是根據(jù)語音波形中反映說話人心理和行為特征的語音參數(shù),聲紋的“唯一性”使其成為打開身份信息大門的鑰匙。識(shí)別用戶真實(shí)身份,正是金融機(jī)構(gòu)降低壞賬率的關(guān)鍵。 卞陽介紹說,在消費(fèi)金融行業(yè),大部分壞賬來源于黑中介主導(dǎo)的產(chǎn)業(yè)鏈?zhǔn)皆p騙,黑中介有多種偽造用戶身份的辦法,單一的身份識(shí)別手段無法有效解決問題,聲紋技術(shù)的應(yīng)用將為識(shí)別黑中介增加成功的砝碼。具體到應(yīng)用場(chǎng)景,操作也很簡單?!肮ぷ魅藛T打電話給用戶,問一些問題,然后將用戶聲音與聲紋庫的數(shù)據(jù)進(jìn)行比對(duì),確認(rèn)用戶是否曾有過騙貸、逾期不還等異常情況?!?卞陽說,“以現(xiàn)有的技術(shù),用戶說話時(shí)長只要達(dá)到三秒就符合識(shí)別的條件?!?/span> 數(shù)鏈聯(lián)盟就將這項(xiàng)技術(shù)和區(qū)塊鏈技術(shù)相結(jié)合,解決“共債查詢”、“反欺詐”、“黑名單共享”等問題。通常認(rèn)為錄音、變音和語音合成是聲紋識(shí)別的攔路虎,但在科學(xué)家的加持下,這些難題被攻克。 隨著聲紋識(shí)別技術(shù)得到金融監(jiān)管部門的認(rèn)可,憑借著個(gè)人隱私保護(hù)、身份認(rèn)證強(qiáng)度方面的優(yōu)勢(shì),“形簡意豐”(包含有內(nèi)容、身份、情感、年齡及健康狀況等豐富的信息)的語音信號(hào)正在為金融安全保駕護(hù)航,開啟無監(jiān)督情形下一種全新的“聲紋+”身份認(rèn)證方式。 目前,除了眾多銀行在手機(jī)銀行中正式應(yīng)用了聲紋識(shí)別技術(shù),中國銀聯(lián)也在其數(shù)據(jù)平臺(tái)的身份認(rèn)證模塊中集成聲紋識(shí)別功能。在互聯(lián)網(wǎng)金融行業(yè),中國互聯(lián)網(wǎng)金融協(xié)會(huì)在其統(tǒng)一身份核驗(yàn)平臺(tái)集成了聲紋識(shí)別功能,螞蟻金服在支付寶產(chǎn)品、騰訊在微信平臺(tái)中也都開始應(yīng)用聲紋識(shí)別作為身份認(rèn)證的安全手段。無疑,搭載著AI的聲紋識(shí)別技術(shù)將會(huì)在移動(dòng)金融服務(wù)中發(fā)揮更大的作用,相信身處人工智能新高地的張江企業(yè)也有機(jī)會(huì)從中掘出一桶金。 |
|