日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

一場學習革命

 昵稱16619343 2019-04-17

(北京大學 趙鵬巍 編譯自Marric Stephens. Physics World,2019,(3):45)

機器學習的基礎(chǔ)工作早在上世紀中葉已經(jīng)奠定。然而,正如Marric Stephens 所發(fā)現(xiàn)的,越來越強大的計算機以及過去十年間不斷改進的算法,正推動著機器學習在從醫(yī)學物理到材料科學等諸多方面應(yīng)用的爆發(fā)。

當銀行打電話提醒你的信用卡在陌生時間發(fā)生可疑大額消費時,這不大可能是經(jīng)由一位親自梳理過你個人帳戶的好心銀行員工發(fā)現(xiàn)的,相反,這更像是機器學會了判斷與犯罪活動相關(guān)聯(lián)的行為,并在你的賬單中發(fā)現(xiàn)了一些意外情況。銀行的計算機系統(tǒng)利用算法可以靜靜地、高效地監(jiān)控你帳戶上的盜刷跡象。

監(jiān)控信用卡只是“機器學習”的一個例子。機器學習是指計算機系統(tǒng)通過在給定的示例集上訓練,從而發(fā)展出靈活自主地執(zhí)行任務(wù)的能力的過程。作為更廣義的人工智能領(lǐng)域的一個子集,機器學習技術(shù)能夠被應(yīng)用于任意可挖掘輸入輸出之間關(guān)聯(lián)的大型復雜數(shù)據(jù)集中。對于上面提到的銀行,算法將分析大量合法以及非法交易數(shù)據(jù),以便從給定輸入(“凌晨3 點產(chǎn)生的大額消費”)產(chǎn)生輸出(“盜刷嫌疑”)。

機器學習不僅僅應(yīng)用于金融領(lǐng)域,也正在被應(yīng)用于醫(yī)療保健、交通運輸、刑事司法以及科學研究等許多其他領(lǐng)域。

圖1 新型學習。人工神經(jīng)網(wǎng)絡(luò)近似模擬真實生物大腦的工作模式,每個輸入經(jīng)由一層或多層隱藏的人工神經(jīng)元處理

量子問題

機器學習對量子物理,特別是“量子多體問題”的求解可能產(chǎn)生深遠的意義。這類問題產(chǎn)生于一組相互作用著的物體,且只能通過考慮其量子性質(zhì)才能理解整個體系。美國紐約西蒙斯基金會Flatiron 研究所的物理學家Giuseppe Carleo 指出:“量子多體問題的共性在于研究體系的性質(zhì)原則上需要完全了解體系的多體波函數(shù)這一事實”,而多體波函數(shù),用Carleo 的話說,“是一個怪物,其復雜程度隨著體系組分數(shù)量的增加而呈現(xiàn)出指數(shù)級的增長”。例如,考慮一組由若干粒子組成的系統(tǒng),每個粒子均有順時針和逆時針兩個自旋方向。對于兩粒子系統(tǒng),共有四種可能的狀態(tài),三粒子系統(tǒng)則有八種可能狀態(tài),這時體系仍然是容易處理的。但隨著粒子數(shù)增多,復雜程度很快就會超出可控范圍。

傳統(tǒng)方法無法有效地處理具有一定組分數(shù)量的量子多體問題,所以Carleo 及其瑞士蘇黎世聯(lián)邦理工學院的同事Matthias Troyer 使用了機器學習方法。他們發(fā)現(xiàn)一個相對較“淺”的神經(jīng)網(wǎng)絡(luò)——僅使用單個隱藏層,已經(jīng)可以有效地“學習”表征體系的波函數(shù)了,一維或二維晶格上的自旋問題便是一例。

與求解量子多體問題相同的困難也出現(xiàn)在“ 量子態(tài)層析成像”中。正如層析成像從外部測量來重建物體的內(nèi)部結(jié)構(gòu)一樣,量子態(tài)層析成像通過對量子態(tài)易于測量的部分進行少量次數(shù)的測量來確定一個系統(tǒng)的量子狀態(tài)。與量子多體問題一樣,編碼在波函數(shù)中的信息量隨著系統(tǒng)中組分數(shù)量的增加而呈指數(shù)增長。

量子比特在量子計算機中的糾纏方式是一個值得描述的量子態(tài),這使得量子態(tài)層析成像對于理解量子計算機應(yīng)該如何應(yīng)對噪聲和退相干性至關(guān)重要。問題在于任何實用的量子計算機都將包含數(shù)十或數(shù)百個量子比特,故直接去確定其量子態(tài)的方法是不合適的。這正是人工神經(jīng)網(wǎng)絡(luò)可以發(fā)揮作用的地方,Carleo 發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)可以高效地重建含100 個量子比特的量子計算機的量子態(tài),而標準方法僅限于大約8個量子比特。

機器學習的應(yīng)用還遠沒有結(jié)束。機器學習方法僅是最近才被應(yīng)用于量子物理領(lǐng)域,這意味著研究仍處于原理論證階段。實際上,Carleo 及其同事展示的方法通常涉及僅含一或兩個隱藏層的神經(jīng)網(wǎng)絡(luò), 而更成熟的商業(yè)應(yīng)用—— 如Google 和Facebook 等,能夠利用更深層的架構(gòu),并在針對特定任務(wù)優(yōu)化的專用硬件上運行。

不幸的是,量子物理的奇異特性使得這些更復雜的神經(jīng)網(wǎng)絡(luò)不能簡單地直接移植到量子問題上,Carleo 等人不得不幾乎從頭開始設(shè)計算法,目前還未達到與機器學習應(yīng)用前沿相當?shù)膹碗s度,而趕上那些成熟的算法,將允許人工神經(jīng)網(wǎng)絡(luò)解決更復雜的量子問題。Carleo指出:“我認為未來幾年會看到原理方法與技術(shù)實現(xiàn)之間的鴻溝越來越小,并帶來我們現(xiàn)在甚至無法想象的應(yīng)用?!?/p>

尋找新材料

雖然人工神經(jīng)網(wǎng)絡(luò)在給出有用的結(jié)果前通常必須有大量數(shù)據(jù)集作為輸入,但美國弗吉尼亞大學的Prasanna Balachandran 使用一些數(shù)據(jù)需求并不是很大的方法。他的研究目標是從巨大的多維可能性空間中找出相對較小的能制造有益材料的配方空間。通過試錯法來尋找這樣的空間將會花費太長時間,而且對應(yīng)屬性已知材料的區(qū)域也僅僅是全空間的極小一部分。

Balachandra 用來解決這一問題的方法是一種特殊類型的機器學習,稱為統(tǒng)計學習。這種方法通過假設(shè)數(shù)據(jù)特征遵循嚴格的統(tǒng)計規(guī)律來繞過機器學習對大量訓練集的需求。他解釋道:“我們訓練機器學習模型去掌握我們已經(jīng)知道的東西,進而用這些模型來預測我們不知道的東西”。

在新材料研究中,我們知道某些材料組合的行為,而想要預測的是每個其他可能組合的性質(zhì)。然而,預測給定材料性質(zhì)的可信度依賴于對其鄰近材料的了解情況,因此,對于每個預測,Balachandran 還量化了與每個預測值相應(yīng)的誤差。

統(tǒng)計,統(tǒng)計,統(tǒng)計

盡管機器學習技術(shù)已經(jīng)在醫(yī)學、量子和材料物理學方面形成了具體的成果和無可替代的前景,但在統(tǒng)計物理學中的進展卻沒有那么清晰。在法國巴黎薩克萊大學研究機器學習理論的Lenka Zdeborová承認道,“我們?nèi)栽诘却粋€被科學同行認可的,沒有機器學習的幫助就無法完成的重要例子?!?/p>

當然,機器學習技術(shù)在統(tǒng)計物理學中有一些有希望的進展,但Zdeborová說這些技術(shù)迄今尚未處于該領(lǐng)域的前沿。她指出,有數(shù)十篇論文使用神經(jīng)網(wǎng)絡(luò)來研究一些統(tǒng)計模型,例如二維伊辛模型——該模型描述了二維晶格上自旋粒子之間的相互作用,但迄今還沒有得到任何全新的發(fā)現(xiàn)。

機器學習尚未推動統(tǒng)計物理學的進步也許會令人感到失望,但相關(guān)的知識與前景必定走向另一方向。試想識別圖像所需的神經(jīng)網(wǎng)絡(luò),每個圖像都會包含大量數(shù)據(jù)(像素)并且會伴有噪音(因為任何給定的圖像都會被大量不相關(guān)的特征掩蔽),而且網(wǎng)絡(luò)中的不同權(quán)重之間也存在相關(guān)性。

令人高興的是,多維、有噪聲和有關(guān)聯(lián)的問題正是統(tǒng)計物理學家自上世紀中葉以來一直在學習如何應(yīng)對的問題。研究一種被稱為“自旋玻璃” 材料的Zdeborová 說道:“試想針對無序系統(tǒng)中發(fā)展出來的物理學理論”。這樣的系統(tǒng)具有許多粒子(即許多的維度),具有有限的溫度(即具有熱噪聲),而且具有許多粒子間的相互作用( 即許多的關(guān)聯(lián))。事實上,在某些情況下,描述機器學習模型的方程與用于處理統(tǒng)計物理系統(tǒng)的方程完全相同。

這一發(fā)現(xiàn)可能是發(fā)展一個全面理論的關(guān)鍵,這一理論可以解釋為什么這些方法會如此有效。雖然目前機器學習的發(fā)展也許比幾十年前通常預測的還要進步一些,但其成功仍然主要來自經(jīng)驗性的試錯法。Zdeborová總結(jié)道:“我們希望能夠預測最優(yōu)的機器學習架構(gòu),知道應(yīng)該如何設(shè)置參數(shù)以及采用何種算法,目前我們還沒有線索知道如何在不投入大量人力的情況下獲得這些知識?!?/p>

圖2 大浪淘沙,沉者為金。統(tǒng)計學習可用于從大量可能的材料結(jié)構(gòu)中篩選出可控的數(shù)量以進行實驗

本文選自《物理》2019年第4期

往期精彩回顧

1.環(huán)形正負電子對撞機:物理、技術(shù)以及現(xiàn)狀

2.量子十問之六:量子計算,這可是一個顛覆性的新技術(shù) | 郭光燦

3.晶體幾何系列之二:平面上圓密排定理的證明

4.單純的元素,復雜的歷史

5.原位電子顯微學探索固體中的離子遷移行為(一)

6.愛因斯坦的物理學成就與年譜 | 曹則賢

7.物理學:A Source of Power for Man

8.回音壁模式光學微腔傳感

9.楊-米爾斯理論說了啥?為什么說這是楊振寧超越他諾獎的貢獻?

10.周末講堂——三位新晉狄拉克獎得主:開宗立派又風格迥異

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多