日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

可理解的多模態(tài)數(shù)據(jù)機(jī)器學(xué)習(xí)模型及其在研究大腦神經(jīng)細(xì)胞的初步應(yīng)用

 skysun000001 2022-02-13

海歸學(xué)者發(fā)起的公益學(xué)術(shù)平臺

分享信息,整合資源

交流學(xué)術(shù),偶爾風(fēng)月

近年來,人工智能的廣泛應(yīng)用激起了對智慧之源大腦的研究。大腦這種復(fù)雜生物系統(tǒng)包含著大量不同功能的神經(jīng)細(xì)胞。不同細(xì)胞之間互相作用也引起了多種多樣腦狀態(tài)包括神經(jīng)類疾病。然而理解導(dǎo)致這些功能和狀態(tài)的生物機(jī)理比如基因表達(dá)和調(diào)控仍然是一個(gè)高難度的工作。不過,通過整合描述大腦神經(jīng)的多個(gè)信息源,我們可以更可靠、更準(zhǔn)確地洞察神經(jīng)細(xì)胞甚至驅(qū)動疾病發(fā)展的生物機(jī)理。

圖片


例如,快速發(fā)展的單細(xì)胞測序技術(shù)(比如Patch-seq)可測量同一神經(jīng)細(xì)胞的多種特征,包括轉(zhuǎn)錄組,電生理信號和細(xì)胞形態(tài),從而產(chǎn)生大量的多模態(tài)單細(xì)胞數(shù)據(jù)(multi-modal data)。這些多模態(tài)數(shù)據(jù)比起單一數(shù)據(jù)類型使人們能更全面的獲取大腦神經(jīng)細(xì)胞的特征(feature)從而分析與之相關(guān)的細(xì)胞功能(function)和區(qū)分不同細(xì)胞表型(phenotype)。

但是, 由于各種數(shù)據(jù)類型有著不同分布,不同數(shù)據(jù)間也有潛在的非線性關(guān)系,能否有效地整合和分析這些多模態(tài)數(shù)據(jù)進(jìn)而理解細(xì)胞生物機(jī)理成了新挑戰(zhàn)。開發(fā)用于整合跨樣本、實(shí)驗(yàn)和測量方式單細(xì)胞數(shù)據(jù)的工具也是單細(xì)胞數(shù)據(jù)科學(xué)中提出的重大挑戰(zhàn)之一。集成多模態(tài)特征很困難,因?yàn)檫@種集成需要我們允許以不同的數(shù)據(jù)尺度解決問題,提供一個(gè)框架來測量任何模態(tài)的不確定性,并在分析過程中對其進(jìn)行量化。此外,多模態(tài)數(shù)據(jù)集成方法需要可擴(kuò)展,以有效處理新技術(shù)提供的越來越多的細(xì)胞、特征和數(shù)據(jù)類型,并允許在不同表型之間進(jìn)行比較,而且能解釋細(xì)胞特征和表型的復(fù)雜關(guān)系。
 
為此,美國威斯康星大學(xué)麥迪遜分校王岱峰實(shí)驗(yàn)室于2022年1月31日在《自然-計(jì)算科學(xué)》上發(fā)表一種可理解的多模態(tài)數(shù)據(jù)機(jī)器學(xué)習(xí)模型(deepManReg)[1]?!蹲匀?計(jì)算科學(xué)》還同期推出了新聞觀點(diǎn)評述,專門介紹這一工作和探討了可解釋多模態(tài)數(shù)據(jù)學(xué)習(xí)領(lǐng)域的前景[2]。

圖片


deepManReg用常見的流型模型(manifold)來表示數(shù)據(jù)特征之間的局部非線性關(guān)系。作者首先通過多個(gè)深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不同模態(tài)的特征之間共有的流型,然后用它把所有可能的特征嵌入到一個(gè)相同的低維空間(co-embedding)。因此跨模態(tài)的特征在此空間的距離可以用于量化特征間的非線性關(guān)系,進(jìn)而得到一個(gè)連接來自不同模態(tài)的特征的特征關(guān)系網(wǎng)絡(luò)(cross-modal feature network)。作者再利用這個(gè)特征網(wǎng)絡(luò)來正則化一個(gè)神經(jīng)網(wǎng)絡(luò)分類器從而達(dá)到改進(jìn)數(shù)據(jù)表型分類的目的(regularized classification)。對于每個(gè)表型,deepManReg可在這個(gè)改進(jìn)的神經(jīng)網(wǎng)絡(luò)分類器上采用積分梯度(integrated gradient)對特征和特征關(guān)系進(jìn)行重要性排序(prioritization)。這種排序解釋了最影響表型的特征和它們之間怎么樣的特征關(guān)系可以用來分類表征。

通過巧妙使用了幾種最先進(jìn)的計(jì)算技術(shù),deepManReg同時(shí)展示出了超高的技術(shù)性能。例如,deepManReg 通過黎曼優(yōu)化過程訓(xùn)練神經(jīng)網(wǎng)絡(luò),降低了在非線性(無法在不重新訓(xùn)練的情況下推廣到新數(shù)據(jù))和參數(shù)(導(dǎo)致對齊不準(zhǔn)確)流形對齊之間進(jìn)行選擇的成本。作者還使用了梯度下降優(yōu)化,計(jì)算多個(gè)數(shù)據(jù)集的 Stiefel 流形上的非線性投影,在神經(jīng)網(wǎng)絡(luò)輸出層保留流形約束等等。此外,因?yàn)閐eepManReg允許比較不同表型以及理解形成它們的多模態(tài)特征之間的變化和關(guān)聯(lián),所以它可以給新數(shù)據(jù)樣本預(yù)測先前研究的表型(即使是連續(xù)表型)。

為了展示性能,作者應(yīng)用deepManReg分析了不同的數(shù)據(jù)案例。例如,(一)具有多特征的手寫數(shù)字的圖像數(shù)據(jù)和(二)Patch-seq方法得到的大約4000個(gè)小鼠大腦神經(jīng)元細(xì)胞的基因表達(dá)和電生理信號數(shù)據(jù)。在每個(gè)案例中,作者發(fā)現(xiàn) deepManReg不但在分類上均優(yōu)于單一數(shù)據(jù)類型和其他現(xiàn)行多模態(tài)方法,而且能解釋表現(xiàn)重要的特征及其之間關(guān)系。特別是在案例二中,作者找到了不同大腦皮層的神經(jīng)元細(xì)胞的重要基因網(wǎng)絡(luò)和電生理特征。這為揭示基因網(wǎng)絡(luò)中的電生理功能變化提供了重要信息,并提供了關(guān)于基因功能如何在不同大腦皮層下協(xié)調(diào)的新思考角度。
 

圖片


除了可理解性,deepManReg在使用不同數(shù)量功能的CPU和GPU架構(gòu)中的運(yùn)行時(shí)間相較其他方法也具有一定優(yōu)勢。此外,作者還建議了一可以些適當(dāng)調(diào)整的因素,這些調(diào)整可以使deepManReg擴(kuò)展到更大的數(shù)據(jù)集并使用兩種以上的數(shù)據(jù)類型。鑒于可使用的單細(xì)胞多模態(tài)數(shù)據(jù)集的數(shù)量不斷增加的現(xiàn)狀,以及使用deepManReg進(jìn)行綜合分析的優(yōu)勢,可以見得它將成為研究復(fù)雜疾病和表型的流行替代方案。盡管如此,作者仍然分析可解釋多模態(tài)數(shù)據(jù)學(xué)習(xí)未來可以改進(jìn)的方面,比如多個(gè)神經(jīng)網(wǎng)絡(luò)超參數(shù)優(yōu)化以及分析高維數(shù)據(jù)所需的計(jì)算資源,以便更有效地使用包括deepManReg在內(nèi)的機(jī)器學(xué)習(xí)模型和工具。

圖片

論文信息:

Nam D Nguyen, Jiawei Huang, Daifeng Wang, A deep manifold-regularized learning model for improving phenotype prediction from multi-modal data, Nature Computational Science, 2, 38–46, 2022. https://www./articles/s43588-021-00185-x 

新聞評論:
Daniel Osorio, Interpretable multi-modal data integration, Nature Computational Science, 2, 8-9, 2022. https://www./articles/s43588-021-00186-w 

作者簡介:
通訊作者王岱峰博士是美國威斯康星大學(xué)麥迪遜分校生物統(tǒng)計(jì)和醫(yī)學(xué)信息系及計(jì)算機(jī)科學(xué)系助理教授,威斯康星大學(xué)威斯曼中心PI和美國自然科學(xué)基金職業(yè)獎獲得者(NSF Career)。其實(shí)驗(yàn)室長期致力于研究開發(fā)可用于理解生物機(jī)理和精準(zhǔn)醫(yī)學(xué)的人工智能及機(jī)器學(xué)習(xí)方法,并主要應(yīng)用于大腦和腦疾病功能基因組研究。第一作者為實(shí)驗(yàn)室2021屆計(jì)算機(jī)科學(xué)博士生Nam Nguyen (現(xiàn)卡耐基梅隆大學(xué)計(jì)算機(jī)學(xué)院計(jì)算生物學(xué)Lane Fellow)。第二作者為實(shí)驗(yàn)室2021屆統(tǒng)計(jì)學(xué)數(shù)據(jù)科學(xué)碩士生黃嘉煒(現(xiàn)辛辛那提大學(xué)商學(xué)院博士生)。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多