2019年,事件視界望遠(yuǎn)鏡讓世界第一次看到了黑洞的實(shí)際樣子。但是,公布的圖像并不是傳統(tǒng)意義上的照片,而是通過(guò)數(shù)學(xué)“處理”之后的。處理的數(shù)據(jù)是射電望遠(yuǎn)鏡在美國(guó)、墨西哥、智利、西班牙和南極等地區(qū)獲得相關(guān)信息。數(shù)據(jù)處理團(tuán)隊(duì)也開(kāi)源了相關(guān)的編程代碼,并發(fā)表了相關(guān)文章。因此,科學(xué)界也可以在此基礎(chǔ)上進(jìn)一步深度探索。 開(kāi)源逐漸成為一種趨勢(shì),并且越來(lái)越普遍。從天文學(xué)到動(dòng)物學(xué),現(xiàn)代每一項(xiàng)重大科學(xué)發(fā)現(xiàn)的背后,似乎都有計(jì)算機(jī)的身影。例如,加州斯坦福大學(xué)的計(jì)算生物學(xué)家Michael Levitt 憑借其計(jì)算化學(xué)結(jié)構(gòu)建模策略獲得了2013年諾貝爾化學(xué)獎(jiǎng),他指出,今天的筆記本電腦內(nèi)存和時(shí)鐘速度是1967年的10000多倍。1967年的時(shí)候,正是Michael Levitt創(chuàng)建實(shí)驗(yàn)室并開(kāi)始“諾獎(jiǎng)工作”的年份?!拔覀兘裉齑_實(shí)擁有相當(dāng)可觀的計(jì)算能力,但是問(wèn)題在于,這仍然需要人類的思考?!?/span> 顯然,如果沒(méi)有能夠解決研究問(wèn)題的軟件以及熟知如何編寫和使用軟件的研究人員,光有一臺(tái)強(qiáng)大的計(jì)算機(jī)是毫無(wú)用處的。最近,《自然》雜志將目光投向了科學(xué)發(fā)現(xiàn)的幕后,著眼于過(guò)去幾十年改變世界的關(guān)鍵代碼。
語(yǔ)言先驅(qū):Fortran編譯器(1957) 第一代計(jì)算機(jī)對(duì)用戶并不友好。編程靠手工完成的,通過(guò)用電線連接一排排電路。后來(lái)的機(jī)器語(yǔ)言和匯編語(yǔ)言允許用戶用代碼為計(jì)算機(jī)編程,但這兩種語(yǔ)言都需要對(duì)計(jì)算機(jī)的架構(gòu)有深入的了解,因此,許多科學(xué)家望洋興嘆。 20世紀(jì)50年代,隨著符號(hào)語(yǔ)言的發(fā)展。約翰·巴克斯和他在加州圣何塞的IBM團(tuán)隊(duì)開(kāi)發(fā)的“公式翻譯”語(yǔ)言Fortran面世了,情況也逐漸發(fā)生了改變。使用Fortran,用戶可以用人類可讀的指令來(lái)編程,例如x = 3 + 5。然后編譯器將其轉(zhuǎn)換成快速、高效的機(jī)器代碼。 但這仍然困難重重,一開(kāi)始,程序員用穿孔卡輸入代碼,復(fù)雜的模擬可能需要數(shù)萬(wàn)張穿孔卡。不過(guò),新澤西州普林斯頓大學(xué)(Princeton University)的氣候?qū)W家Manabe Syukuro和他的同事們利用這種語(yǔ)言成功開(kāi)發(fā)了第一批氣候模型。他表示,Fortran讓非計(jì)算機(jī)科學(xué)家也能編程。 現(xiàn)在已經(jīng)80年了,F(xiàn)ortran仍然廣泛應(yīng)用于氣候建模、流體動(dòng)力學(xué)、計(jì)算化學(xué)。這意味著,任何涉及到復(fù)雜線性代數(shù)和需要強(qiáng)大的計(jì)算機(jī)來(lái)快速處理數(shù)字的學(xué)科都還需要Fortran的支持,古老的Fortran代碼庫(kù)仍然活躍在世界各地的實(shí)驗(yàn)室和超級(jí)計(jì)算機(jī)上。
信號(hào)處理器:快速傅立葉變換(1965) 當(dāng)射電天文學(xué)家“觀察”天空時(shí),他們需要“看到”那些隨著時(shí)間變化的信號(hào)背后的雜音。為了理解這些雜音的本質(zhì),天文學(xué)家還要了解這些信號(hào)作為頻率的函數(shù)是什么樣的。雖然有一種叫做傅里葉變換的數(shù)學(xué)過(guò)程允許研究人員這樣做。但問(wèn)題是它的效率很低,例如對(duì)于一個(gè)大小為N的數(shù)據(jù)集需要N^2次計(jì)算。 1965年,美國(guó)數(shù)學(xué)家詹姆斯·庫(kù)利(James Cooley)和約翰·杜基(John Tukey)想出了一種加速方法:使用遞歸,這是一種分而治之的編程方法,其中算法可以實(shí)現(xiàn)重復(fù)地再運(yùn)用。這種快速傅立葉變換(FFT)簡(jiǎn)化了計(jì)算傅立葉變換的問(wèn)題,只需N log2(N)步。而且隨著N的增加,速度也會(huì)提高。對(duì)于1000個(gè)點(diǎn)數(shù),速度提升大約是100倍;100萬(wàn)個(gè)點(diǎn),是5萬(wàn)倍。 英國(guó)牛津大學(xué)的數(shù)學(xué)家Nick Trefethen說(shuō),這個(gè)“發(fā)現(xiàn)”實(shí)際上是一個(gè)再發(fā)現(xiàn)。因?yàn)榈聡?guó)數(shù)學(xué)家Carl Friedrich Gauss在1805年得出了這個(gè)結(jié)論,但他從未發(fā)表過(guò)相關(guān)論文。但Cooley和Tukey發(fā)表了,并開(kāi)啟了快速傅立葉變換在數(shù)字信號(hào)處理、圖像分析、結(jié)構(gòu)生物學(xué)等領(lǐng)域的應(yīng)用。Trefethen表示:“這真的是應(yīng)用數(shù)學(xué)和工程領(lǐng)域的重大事件之一,F(xiàn)FT已經(jīng)在代碼中多次實(shí)現(xiàn)。一個(gè)流行的選擇是FFTW,即“西方最快的傅里葉變換”。
分子編目:生物資料庫(kù)(1965) 數(shù)據(jù)庫(kù)在科學(xué)研究中非常重要,以至于人們很容易忽視它是由軟件驅(qū)動(dòng)的這一事實(shí)。在過(guò)去的幾十年里,數(shù)據(jù)庫(kù)資源的規(guī)模急劇膨脹,影響了許多領(lǐng)域,尤其生物學(xué)領(lǐng)域更加劇烈。 今天龐大的基因組和蛋白質(zhì)數(shù)據(jù)庫(kù)源于瑪格麗特·戴霍夫(Margaret Dayhoff)的工作,她是馬里蘭州銀泉市國(guó)家生物醫(yī)學(xué)研究基金會(huì)(National Biomedical Research Foundation)的生物信息學(xué)先驅(qū)。20世紀(jì)60年代初,當(dāng)生物學(xué)家們致力于梳理蛋白質(zhì)的氨基酸序列時(shí),戴霍夫開(kāi)始尋找不同物種之間進(jìn)化關(guān)系的線索。這項(xiàng)工作首次于1965年與三位共同作者發(fā)表,描述了當(dāng)時(shí)已知的65種蛋白質(zhì)的序列、結(jié)構(gòu)和相似性。歷史學(xué)家布魯諾·斯特拉瑟(Bruno Strasser)在2010年寫道,這是第一個(gè)“與特定研究問(wèn)題無(wú)關(guān)”的數(shù)據(jù)集。將數(shù)據(jù)編碼在穿孔卡片中,這使得擴(kuò)大數(shù)據(jù)庫(kù)和搜索成為可能。 其他計(jì)算機(jī)化的生物數(shù)據(jù)庫(kù)緊隨其后發(fā)布。加州大學(xué)圣地亞哥分校的進(jìn)化生物學(xué)家Russell Doolittle在1981年創(chuàng)建了另一個(gè)名為Newat的蛋白質(zhì)數(shù)據(jù)庫(kù)。1982年數(shù)據(jù)庫(kù)GenBank的發(fā)布,是美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health)維護(hù)的DNA檔案。 這些數(shù)據(jù)庫(kù)資源的價(jià)值在1983年7月得到了證實(shí)。當(dāng)時(shí),由倫敦帝國(guó)癌癥研究基金會(huì)蛋白質(zhì)生物化學(xué)家邁克爾·沃特菲爾德領(lǐng)導(dǎo)的團(tuán)隊(duì),與杜利特爾的團(tuán)隊(duì)各自獨(dú)立報(bào)道了一個(gè)特殊的人類生長(zhǎng)因子序列與一種導(dǎo)致猴子出現(xiàn)癌癥的病毒蛋白質(zhì)之間的相似性。觀察結(jié)果顯示了一種病毒誘發(fā)腫瘤機(jī)制——通過(guò)模仿一種生長(zhǎng)因子,病毒會(huì)誘導(dǎo)細(xì)胞不受控制地生長(zhǎng)。美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)前主任詹姆斯·奧斯特爾說(shuō):“這一結(jié)果讓一些對(duì)計(jì)算機(jī)和統(tǒng)計(jì)學(xué)不感興趣的生物學(xué)家頭腦里靈光一閃:我們可以通過(guò)比較序列來(lái)了解有關(guān)癌癥的一些情況?!?/span> 這一發(fā)現(xiàn)標(biāo)志著“客觀生物學(xué)的到來(lái)”。除了設(shè)計(jì)實(shí)驗(yàn)來(lái)測(cè)試特定的假設(shè),研究人員還可以挖掘公共數(shù)據(jù)集,尋找那些實(shí)際收集數(shù)據(jù)的人可能從未想到過(guò)的聯(lián)系。當(dāng)不同的數(shù)據(jù)集連接在一起時(shí),其威力就會(huì)得到急劇加強(qiáng)。
預(yù)測(cè)領(lǐng)導(dǎo)者:環(huán)流模式(1969) 在第二次世界大戰(zhàn)結(jié)束時(shí),計(jì)算機(jī)先驅(qū)約翰·馮·諾伊曼開(kāi)始將幾年前用于計(jì)算彈道軌跡和武器設(shè)計(jì)的計(jì)算機(jī)轉(zhuǎn)向天氣預(yù)測(cè)問(wèn)題。在那之前Manabe解釋說(shuō), “天氣預(yù)報(bào)只是基于經(jīng)驗(yàn)的”,用經(jīng)驗(yàn)和直覺(jué)來(lái)預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么。相比之下,馮·諾伊曼的團(tuán)隊(duì)“試圖基于物理定律進(jìn)行數(shù)值天氣預(yù)測(cè)”。 新澤西州普林斯頓的國(guó)家海洋和大氣管理局地球物理流體動(dòng)力學(xué)實(shí)驗(yàn)室的建模系統(tǒng)部門的負(fù)責(zé)人Venkatramani Balaji說(shuō),這些方程式已經(jīng)被人們熟知了幾十年。但早期的氣象學(xué)家無(wú)法實(shí)際解決這些問(wèn)題。要做到這一點(diǎn),需要輸入當(dāng)前的條件,計(jì)算它們?cè)诙虝r(shí)間內(nèi)會(huì)如何變化,并不斷重復(fù)。因此,此過(guò)程非常耗時(shí),以至于在天氣本身出現(xiàn)之前無(wú)法完成數(shù)學(xué)運(yùn)算。1922年,數(shù)學(xué)家劉易斯·弗萊·理查森(Lewis Fry Richardson)花了幾個(gè)月時(shí)間計(jì)算德國(guó)慕尼黑的6小時(shí)預(yù)報(bào)。根據(jù)一段歷史記載,結(jié)果是“極不準(zhǔn)確的”,包括“在任何已知的陸地條件下都不可能發(fā)生的”預(yù)測(cè)。計(jì)算機(jī)使這個(gè)問(wèn)題變得容易解決了。 20世紀(jì)40年代末,馮·諾伊曼在普林斯頓高等研究院建立了他的天氣預(yù)報(bào)團(tuán)隊(duì)。1955年,第二個(gè)團(tuán)隊(duì)——地球物理流體動(dòng)力學(xué)實(shí)驗(yàn)室——開(kāi)始進(jìn)行他所謂的“無(wú)限預(yù)測(cè)”——也就是氣候模擬。 Manabe于1958年加入氣候建模團(tuán)隊(duì),開(kāi)始研究大氣模型;他的同事柯克·布萊恩(Kirk Bryan)向海洋發(fā)表了演講。1969年,他們成功地將兩者結(jié)合起來(lái),創(chuàng)造了《自然》雜志在2006年所說(shuō)的科學(xué)計(jì)算的“里程碑”。 今天的模型可以將地球表面劃分為25 × 25公里的正方形,將大氣劃分為幾十個(gè)等級(jí)。相比之下,Manabe和Bryan的海洋-大氣聯(lián)合模型使用了500平方公里的面積和9個(gè)層次,只覆蓋了地球的六分之一。研究小組也第一次測(cè)試了二氧化硅中二氧化碳含量上升的影響。
數(shù)值計(jì)算研究機(jī):BLAS(1979) 科學(xué)計(jì)算通常涉及到使用向量和矩陣的相對(duì)簡(jiǎn)單的數(shù)學(xué)運(yùn)算,但這樣的向量和矩陣實(shí)在太多了。但在20世紀(jì)70年代,并沒(méi)有一套普遍認(rèn)可的計(jì)算工具來(lái)執(zhí)行這些操作。因此,從事科學(xué)工作的程序員并未專注于科學(xué)問(wèn)題,而是把大量的時(shí)間花在了設(shè)計(jì)代碼進(jìn)行基本的數(shù)學(xué)運(yùn)算上。 編程世界需要的是一個(gè)標(biāo)準(zhǔn)。1979年,它有了一個(gè):基本線性代數(shù)子程序,簡(jiǎn)稱BLAS6。這個(gè)標(biāo)準(zhǔn)一直發(fā)展到1990年,定義了幾十個(gè)向量和后來(lái)的矩陣數(shù)學(xué)的基本程序。 美國(guó)田納西大學(xué)計(jì)算機(jī)科學(xué)家、BLAS開(kāi)發(fā)團(tuán)隊(duì)成員杰克·唐加拉表示,事實(shí)上,BLAS把矩陣和向量數(shù)學(xué)簡(jiǎn)化成了和加法和減法一樣基本的計(jì)算單元。 美國(guó)德克薩斯大學(xué)奧斯汀分校的計(jì)算機(jī)科學(xué)家Robert van de Geijn指出,BLAS“可能是為科學(xué)計(jì)算定義的最重要的接口”。除了為常用函數(shù)提供標(biāo)準(zhǔn)化的名稱之外,研究人員可以確定基于BLAS 的代碼在任何計(jì)算機(jī)上都可以以相同的方式工作。該標(biāo)準(zhǔn)還使計(jì)算機(jī)制造商能夠優(yōu)化BLAS實(shí)現(xiàn),以實(shí)現(xiàn)在其硬件上的快速操作。 40多年來(lái),BLAS代表了科學(xué)計(jì)算堆棧的核心,也就是使科學(xué)軟件運(yùn)轉(zhuǎn)的代碼。華盛頓大學(xué)的機(jī)械和航空航天工程師Lorena Barba稱其為“五層代碼中的機(jī)械”。而杰克·唐加拉說(shuō):“它為我們進(jìn)行計(jì)算提供了基礎(chǔ)?!?/span>
顯微鏡必備:NIH圖像(1987) 上世紀(jì)80年代初,程序員韋恩·拉斯班德(Wayne Rasband)在馬里蘭州貝塞斯達(dá)的美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health)的一個(gè)腦成像實(shí)驗(yàn)室工作。該團(tuán)隊(duì)有一臺(tái)掃描儀來(lái)數(shù)字化x光片,但無(wú)法在電腦上顯示或分析它們。所以Rasband寫了一個(gè)程序來(lái)完成這項(xiàng)任務(wù)。 該程序是專門為一臺(tái)價(jià)值15萬(wàn)美元的PDP-11小型計(jì)算機(jī)設(shè)計(jì)的。隨后,在1987年,蘋果公司發(fā)布了麥金塔II,這是一個(gè)更友好、更實(shí)惠的選擇。拉斯班德說(shuō):“在我看來(lái),這顯然是一種更好的實(shí)驗(yàn)室圖像分析系統(tǒng)?!彼麑⒆约旱能浖浦驳叫缕脚_(tái)上,并建立了一個(gè)圖像分析生態(tài)系統(tǒng)。 國(guó)家衛(wèi)生研究院的圖像和它的后代授權(quán)研究人員在任何計(jì)算機(jī)上查看和量化任何圖像。軟件家族包括ImageJ,這是為Windows和Linux用戶編寫的基于java的版本,以及由Pavel Tomancak在德國(guó)德累斯頓的馬克斯普朗克分子細(xì)胞生物學(xué)和遺傳學(xué)研究所的團(tuán)隊(duì)開(kāi)發(fā)的ImageJ的一個(gè)發(fā)行版,它包含了關(guān)鍵的插件。麻省劍橋Broad研究所成像平臺(tái)的計(jì)算生物學(xué)家評(píng)價(jià)到:“ImageJ是最基礎(chǔ)的工具,幾乎沒(méi)有生物學(xué)家沒(méi)有使用過(guò)它?!?/span> Eliceiri說(shuō):“這個(gè)程序的目的不是成為一切,而是服務(wù)于用戶。不像Photoshop和其他程序,ImageJ可以是任何你想要的。
序列搜索:BLAST(1990) 可能沒(méi)有比軟件名稱成為動(dòng)詞更好的文化相關(guān)性指示符了。提到搜索,會(huì)想到谷歌。提到遺傳學(xué),研究者的第一直覺(jué)會(huì)是BLAST。 通過(guò)諸如替代、刪除、缺失和重排等方式,生物將進(jìn)化中的改變蝕刻在分子序列中。通過(guò)尋找序列之間的相似性——特別是蛋白質(zhì)之間的相似性——研究人員可以發(fā)現(xiàn)進(jìn)化關(guān)系,并深入了解基因功能。關(guān)鍵是要在迅速膨脹的分子信息數(shù)據(jù)庫(kù)中快速而全面地做到這一點(diǎn)。 迪霍夫在1978年提供了一個(gè)關(guān)鍵想法。她設(shè)計(jì)了一種“點(diǎn)接受突變”矩陣,使研究人員不僅可以根據(jù)兩種蛋白質(zhì)序列的相似程度,還可以根據(jù)它們之間的進(jìn)化距離來(lái)為它們的親緣關(guān)系評(píng)分。 1985年,位于夏洛茨維爾的弗吉尼亞大學(xué)的威廉·皮爾森和NCBI(國(guó)家編目局)的大衛(wèi)·利普曼提出FASTP,這是一種結(jié)合了迪霍夫矩陣和快速搜索能力的算法。 數(shù)年后,Lipman與NCBI(國(guó)家編目局)的眾人一起開(kāi)發(fā)了一種更強(qiáng)大的改進(jìn):基本局部對(duì)齊搜索工具(BLAST)。BLAST發(fā)布于1990年,它結(jié)合了處理快速增長(zhǎng)的數(shù)據(jù)庫(kù)所需的搜索速度,以及尋找進(jìn)化上更遙遠(yuǎn)匹配的能力。與此同時(shí),該工具可以計(jì)算出這些匹配偶然發(fā)生的可能性有多大。 阿特舒爾表示,結(jié)果難以置信的快?!昂瓤诳Х鹊墓Ψ?,搜索就完成了?!钡匾氖牵苋菀资褂?。在一個(gè)通過(guò)郵寄更新數(shù)據(jù)庫(kù)的時(shí)代,沃倫·吉什建立了一個(gè)電子郵件系統(tǒng),后來(lái)又建立了一個(gè)基于網(wǎng)絡(luò)的架構(gòu),允許用戶在NCBI計(jì)算機(jī)上遠(yuǎn)程運(yùn)行搜索,從而確保搜索結(jié)果始終是最新的。 哈佛大學(xué)的計(jì)算生物學(xué)家肖恩·艾迪表示,BLAST系統(tǒng)為當(dāng)時(shí)處于萌芽階段的基因組生物學(xué)領(lǐng)域提供了一個(gè)變革性的工具,一種根據(jù)相關(guān)基因找出未知基因可能功能的方法。對(duì)于各地的測(cè)序?qū)嶒?yàn)室,它還提供了一個(gè)新穎的動(dòng)詞?!八潜姸嘤擅~變成動(dòng)詞的例子之一,”艾迪說(shuō),“你會(huì)說(shuō),你正準(zhǔn)備BLAST一下你的序列?!?/span>
預(yù)印本平臺(tái):arXiv.org(1991) 在20世紀(jì)80年代末,高能物理學(xué)家們例行公事地將他們提交的手稿的物理副本郵寄給同事們,征求他們的意見(jiàn),這是出于禮貌——但只發(fā)給少數(shù)人。物理學(xué)家保羅·金斯帕格在2011年寫道:“那些處于食物鏈較低位置的人依賴于一線研究者的成果,而非精英機(jī)構(gòu)中有抱負(fù)的研究人員往往完全脫離特權(quán)圈?!?/span> 1991 年,洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室(Los Alamos National Laboratory)的 Ginsparg 寫了一個(gè)電子郵件自動(dòng)回復(fù)器,嘗試建立公平的競(jìng)爭(zhēng)環(huán)境。郵件訂閱者每天都會(huì)收到一份預(yù)印本列表,每份論文都帶有標(biāo)識(shí)符。如此一來(lái),世界各地的用戶都可以通過(guò)一封電子郵件提交或檢索來(lái)自上述實(shí)驗(yàn)室計(jì)算機(jī)系統(tǒng)的論文。 Ginsparg的計(jì)劃是將文章保留三個(gè)月,并將內(nèi)容限制在高能物理社區(qū)。但一位同事說(shuō)服他無(wú)限期地保留這些文章。他說(shuō):“就在那一刻,它從布告欄變成了檔案館?!?/span>論文從比高能物理學(xué)科更遠(yuǎn)的地方蜂擁而來(lái)。1993年,Ginsparg將這個(gè)系統(tǒng)遷移到萬(wàn)維網(wǎng)上,并在1998年給它取了個(gè)沿用至今的名字:arXiv.org。 至今arXiv已經(jīng)成立30年了,它擁有約180萬(wàn)份預(yù)印本,全部免費(fèi)提供,目前每月仍吸引超過(guò)1.5萬(wàn)份提交和3000萬(wàn)次下載?!?Nature Photonics 的編輯曾表示:arXiv為研究者提供了一種快捷、方便的科研方式,可以告訴大家你在做什么、什么時(shí)間做的,省去了傳統(tǒng)期刊同行評(píng)審的繁瑣。
數(shù)據(jù)瀏覽器:IPython Notebook (2011) Fernando Pérez在2001還是一名研究生的時(shí)候,開(kāi)始探索拖延癥,當(dāng)時(shí)他決定使用Python的一個(gè)核心組件進(jìn)行研究。 Python是一種解釋語(yǔ)言,其程序是逐行執(zhí)行的。程序員可以使用一種稱為“讀-評(píng)-輸出循環(huán)”(REPL)的計(jì)算性調(diào)用和響應(yīng)工具,在這個(gè)工具中輸入代碼,然后由一個(gè)稱為解釋器的程序來(lái)執(zhí)行。REPL允許快速探索和迭代,但Pérez指出,Python的REPL不是為科學(xué)而構(gòu)建的。例如,它不允許用戶容易地預(yù)加載代碼模塊,或保持?jǐn)?shù)據(jù)可視化打開(kāi)狀態(tài)。所以Pérez“寫”了他自己的版本。 2001 年 12 月,Pérez 發(fā)布了交互式 Python 解釋器 IPython,它共有 259 行代碼。10 年后,Pérez 和物理學(xué)家 Brian Granger、數(shù)學(xué)家 Evan Patterson 合作,將該工具遷移到 Web 瀏覽器,創(chuàng)建了 IPython Notebook,掀起了一場(chǎng)數(shù)據(jù)科學(xué)的革命。 與其他notebook一樣,IPython筆記本將代碼、結(jié)果、圖形和文本組合在一個(gè)文檔中。但與其他類似的項(xiàng)目不同的是,IPython Notebook是開(kāi)源的,它邀請(qǐng)了大量開(kāi)發(fā)者社區(qū)的貢獻(xiàn),而且它支持Python。2014年,IPython演變?yōu)镻roject jupiter,支持大約100種語(yǔ)言,允許用戶在遠(yuǎn)程超級(jí)計(jì)算機(jī)上如同在自己的筆記本電腦上一樣輕松地探索數(shù)據(jù)。 《自然》雜志在2018年寫道:“對(duì)于數(shù)據(jù)科學(xué)家來(lái)說(shuō),Jupyter已經(jīng)成為事實(shí)上的標(biāo)準(zhǔn)?!?/span>當(dāng)時(shí),在GitHub代碼共享平臺(tái)上有250萬(wàn)個(gè)Jupyter Notebook;如今已有近一千萬(wàn)個(gè),其中包括 2016 年發(fā)現(xiàn)引力波和 2019 年黑洞成像的記錄。Pérez表示:“我們?yōu)檫@些項(xiàng)目做出了一點(diǎn)貢獻(xiàn),這是非常值得的。”
快速學(xué)習(xí)器:AlexNet(2012) 人工智能有兩種類型。一種是使用成文的規(guī)則,另一種是通過(guò)模擬大腦的神經(jīng)結(jié)構(gòu)來(lái)讓計(jì)算機(jī)“學(xué)習(xí)”。加拿大多倫多大學(xué)的計(jì)算機(jī)科學(xué)家Hinton表示,幾十年來(lái),人工智能研究人員認(rèn)為后者是“一派胡言”。2012年,Hinton的研究生Alex Krizhevsky和Ilya Sutskever證明了事實(shí)并非如此。 在2012年的 ImageNet 的年度競(jìng)賽上,研究人員在一個(gè)包含100萬(wàn)張日常物體圖像的數(shù)據(jù)庫(kù)上訓(xùn)練人工智能,然后在單獨(dú)的圖像集上測(cè)試生成的算法。Hinton說(shuō),當(dāng)時(shí)最好的算法錯(cuò)誤地分類了大約四分之一的圖像。Krizhevsky和Sutskever的AlexNet,一種基于神經(jīng)網(wǎng)絡(luò)的“深度學(xué)習(xí)”算法,將錯(cuò)誤率降低到了16%。Hinton說(shuō):“我們基本上把錯(cuò)誤率減半了,或者幾乎減半了。 Hinton表示,該團(tuán)隊(duì)在2012年的成功反映了足夠大的訓(xùn)練數(shù)據(jù)集、出色的編程和GPU能力的結(jié)合。GPU是最初設(shè)計(jì)用來(lái)加速計(jì)算機(jī)視頻性能的處理器?!巴蝗恢g,我們可以更快地運(yùn)行(算法)30倍,或者學(xué)習(xí)規(guī)模增加30倍后的數(shù)據(jù)?!?/span> 真正的算法突破實(shí)際上發(fā)生在三年前,當(dāng)時(shí)Hinton的實(shí)驗(yàn)室創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò),可以比經(jīng)過(guò)幾十年改進(jìn)的傳統(tǒng)人工智能更準(zhǔn)確地識(shí)別語(yǔ)音?!爸皇巧晕⒑靡稽c(diǎn), 但這已經(jīng)是’不祥之兆’了?!?/span> AlexNet的成功代表著深度學(xué)習(xí)在實(shí)驗(yàn)室、臨床和其他領(lǐng)域的崛起。這就是為什么移動(dòng)電話能夠理解語(yǔ)音查詢,圖像分析工具能夠很容易地從照片顯微圖中挑選出細(xì)胞。這就是 AlexNet “入選”改變科學(xué)、改變世界工具之一的原因。 原文鏈接: https://www./articles/d41586-021-00075-2 [贈(zèng)書福利] AI科技評(píng)論本次聯(lián)合【圖靈教育】為大家?guī)?lái)12本《人工智能簡(jiǎn)史(第2版)》正版新書。 在“《人工智能簡(jiǎn)史》第二版重磅來(lái)襲!| 贈(zèng)書” (點(diǎn)擊超鏈接跳轉(zhuǎn))一文留言區(qū)留言(注意不是本文!),歡迎大家暢所欲言,談一談你對(duì)人工智能發(fā)展歷史上某件大事或某個(gè)人物的看法,或?qū)θ斯ぶ悄芪磥?lái)發(fā)展的看法。 AI 科技評(píng)論將會(huì)選出 12名讀者,每人送出《人工智能簡(jiǎn)史(第2版)》一本。 活動(dòng)規(guī)則: 1. 在“《人工智能簡(jiǎn)史》第二版重磅來(lái)襲!| 贈(zèng)書” (點(diǎn)擊超鏈接跳轉(zhuǎn))一文留言區(qū)留言(注意不是本文?。诰C合留言質(zhì)量(留言是敷衍還是走心)和留言點(diǎn)贊最高的讀者中選出12位讀者獲得贈(zèng)書。獲得贈(zèng)書的讀者請(qǐng)聯(lián)系 AI 科技評(píng)論客服(aitechreview)。 2. 留言內(nèi)容會(huì)有篩選,例如“選我上去”、“這書寫的很棒(僅僅幾個(gè)字)”等內(nèi)容將不會(huì)被篩選,亦不會(huì)中獎(jiǎng)。 3. 本活動(dòng)時(shí)間為2021年2月12日 - 2020年2月19日(23:00),活動(dòng)推送時(shí)間內(nèi)僅允許贈(zèng)書福利中獎(jiǎng)一次。 |
|
來(lái)自: taotao_2016 > 《計(jì)算機(jī)》