GANcraft 是一個(gè)無監(jiān)督 3D 神經(jīng)渲染框架,該方法通過使用 GAN 預(yù)訓(xùn)練網(wǎng)絡(luò)生成 “偽 ground truths”,可以在沒有成對(duì)的《我的世界》真實(shí)數(shù)據(jù)的情況下學(xué)習(xí)如何執(zhí)行此轉(zhuǎn)換。
圖|完整的 GANcraft 架構(gòu) 兩級(jí)結(jié)構(gòu)在減少計(jì)算量和內(nèi)存占用的同時(shí)顯著提高了圖像質(zhì)量,因?yàn)檩椛鋱?chǎng)可以用更簡(jiǎn)單的 MLP 建模,這是基于隱式體積方法的計(jì)算瓶頸。 內(nèi)容來源:https://mp.weixin.qq.com/s/4prx7XvDr0mdGCdbekIYTQhttps://www./watch?v=1Hky092CGFQhttps://twitter.com/arunmallya/status/1382860338584952840https://www./r/MachineLearning/comments/mru35h/r_gancraft_unsupervised_3d_neural_rendering_of 3. AI 重聚知名已故歌手,發(fā)布四首原創(chuàng)歌曲 為了提醒大家關(guān)注音樂人的心理健康,總部位于加拿大的非營(yíng)利組織 Over the Bridge,發(fā)起了一項(xiàng)新的項(xiàng)目:基于 AI 模仿這些英年早逝的音樂人,以他們的創(chuàng)作、演唱風(fēng)格,重新創(chuàng)作歌曲。 經(jīng)過一年的算法優(yōu)化,和半年的錄音、制作,Over The Bridge 發(fā)布了四首單曲,并收錄在專輯《 Lost Tapes of the 27 Club》中出版。這張專輯目前已經(jīng)正式發(fā)布至 YouTube、Spotify ,并被全球多家知名音樂媒體報(bào)道和傳播。 Over the Bridge 董事會(huì)成員 Sean O'Connor 介紹說,該項(xiàng)目主要基于 Google 的 AI 作曲工具 Magenta。 他們從每位音樂人的 20 到 30 首歌曲中,提取了 MIDI 文件(MIDI 是編曲界最廣泛的音樂標(biāo)準(zhǔn)格式,它用音符的數(shù)字控制信號(hào)來記錄音樂,可以說是計(jì)算機(jī)能理解的樂譜),并將它們分解為鉤子(hook),獨(dú)奏(solo),人聲旋律或節(jié)奏吉他,然后分別交給 AI 進(jìn)行訓(xùn)練。 訓(xùn)練模型主要基于 RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))進(jìn)行。掌握這些歌曲的曲風(fēng)之后,AI 會(huì)生成時(shí)長(zhǎng)大約 5 分鐘的 riff (即興重復(fù)段)。
內(nèi)容來源:https://mp.weixin.qq.com/s/eLvCGMD-yhFE2WBPdNNzgQ 4. 測(cè)量誤差 1mm 以內(nèi)、5 分鐘拿到手術(shù)方案,AI 如何為主動(dòng)脈疾病患者多爭(zhēng)取一分鐘? 基于臨床經(jīng)驗(yàn)和觀察,柴象飛博士帶領(lǐng)匯醫(yī)慧影科學(xué)家團(tuán)隊(duì)與中國(guó)人民解放軍總醫(yī)院血管外科進(jìn)行多項(xiàng)數(shù)據(jù)實(shí)驗(yàn),研究成果在歐洲放射學(xué)雜志 ELSEVIER 發(fā)表。 基于學(xué)術(shù)研究,匯醫(yī)慧影 AORTIST 主動(dòng)脈人工智能精準(zhǔn)診療系統(tǒng)于 2016 年研發(fā)落地,以人工智能技術(shù)賦能腎下腹主動(dòng)脈瘤 + B 型主動(dòng)脈夾層診療全流程鏈條。這是全球首個(gè)深入臨床、覆蓋跨學(xué)科多病種疾病診治全流程的醫(yī)學(xué)影像 AI 產(chǎn)品,實(shí)現(xiàn)數(shù)據(jù)分析介入以患者為核心的精準(zhǔn)醫(yī)療。 為了最大程度降低誤差,柴象飛博士團(tuán)隊(duì)對(duì)數(shù)據(jù)進(jìn)行雙盲的標(biāo)注和專家的驗(yàn)證,將測(cè)量誤差控制在 1mm 以內(nèi),較常規(guī)手動(dòng)測(cè)量精準(zhǔn)度提升約 70%,自動(dòng)分割結(jié)果準(zhǔn)確率達(dá) 95%,與專家測(cè)量相比高達(dá) 98%。 另外,將深度學(xué)習(xí)技術(shù)應(yīng)用到主動(dòng)脈三維重建、分割、中心線提取等環(huán)節(jié),30 秒內(nèi)能完成主動(dòng)脈和髂動(dòng)脈整體、瘤腔、血栓及鈣化及內(nèi)臟動(dòng)脈的自動(dòng)分割測(cè)量,并在 5 分鐘內(nèi)生成手術(shù)方案文檔。 內(nèi)容來源:https://mp.weixin.qq.com/s/S7FE4ZESIl8fQu0T_3U1SA 5. 考駕照選擇 AI 教練,心態(tài)穩(wěn)定不會(huì)罵人 近日,上海某駕校采用 AI 教練授課的視頻登上微博熱搜。據(jù)介紹,截至目前已有超過 2100 名學(xué)員,在該校 AI 教練的協(xié)助下,成功畢業(yè)。 在硬件方面,給教練車配置 GPS 定位儀和雷達(dá)。兩個(gè)高精度 GPS 定位儀,可以實(shí)時(shí)監(jiān)測(cè)教練車的位置。車頭處安裝的多個(gè)雷達(dá),則用于檢測(cè)障礙物。在軟件方面,AI 教練還會(huì)為每位學(xué)員建立個(gè)人檔案,評(píng)測(cè)學(xué)員訓(xùn)練能力,依據(jù)學(xué)員學(xué)習(xí)情況調(diào)整練習(xí)內(nèi)容。此外該車還設(shè)置了主動(dòng)剎車功能,以便在突發(fā)狀況下保證學(xué)員獨(dú)自練習(xí)時(shí)的安全。然而駕校在不斷嘗試新技術(shù)、新突破的背后,也透露出一種不得已而為之的焦慮。 內(nèi)容來源:https://mp.weixin.qq.com/s/MySO4ObDipdauvL08gc2Ew 6. 史上最酷變形金剛 “中國(guó)制造”!能自動(dòng)變形、語音控制,還能編程 在 PULSE FAN FEST 2021 上,和中國(guó)機(jī)器人公司樂森(Robosen)聯(lián)合推出的革命性變形金剛系列產(chǎn)品之一,能自動(dòng)變身的現(xiàn)實(shí)版擎天柱。擎天柱在機(jī)器人形態(tài)和汽車形態(tài)之間變身的時(shí)間大約 10 秒,整個(gè)動(dòng)作非常連貫流暢,簡(jiǎn)直就是完美還原《變形金剛》動(dòng)畫中的擎天柱。孩之寶在公布擎天柱時(shí),表示這是世界上第一個(gè)自動(dòng)轉(zhuǎn)換,交互式,可編程,語音激活,移動(dòng)控制的擎天柱機(jī)器人。
ImageDraw.Draw 與森林綠色(forest green colour)色碼一起使用,并隨機(jī)放置在身體圖像上,類似于 fast.ai 中的 Crappify ;
Photoshop 也被用來在需要彎曲和角度改變的對(duì)象上放置紋身。
內(nèi)容來源:https://mp.weixin.qq.com/s/eM-FjqyHmjo8oPafLsCVvQ 二、觀點(diǎn)評(píng)論解讀 1. 華為田奇:人工智能兩大趨勢(shì),大模型,AI+X 隨著 AI 在各行各業(yè)的應(yīng)用逐漸深化,應(yīng)用碎片化的問題逐漸凸顯。與此同時(shí),提升 AI 的可解釋性也是未來發(fā)展的關(guān)鍵。 就在前幾天,2021 華為全球分析師大會(huì)發(fā)布的“邁向智能世界 2030 的九大技術(shù)挑戰(zhàn)與研究方向”中提出: AI 模型的通用性是解決應(yīng)用碎片性的關(guān)鍵。通過大量無標(biāo)注的數(shù)據(jù)和更大的模型,從全監(jiān)督到自監(jiān)督,構(gòu)建通用的 AI 系統(tǒng),這是當(dāng)前需要突破的方向。其次,把 AI 與科學(xué)計(jì)算交匯,這也為 AI 應(yīng)用走出碎片提供了大用場(chǎng)。AI 為科學(xué)計(jì)算帶來了新思路、新方法、新工具,而科學(xué)計(jì)算的嚴(yán)謹(jǐn)體系也有助于提升 AI 的可解釋性。 華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow 田奇博士最近也在蘇州舉辦的 2020 中國(guó)人工智能產(chǎn)業(yè)年會(huì)上重申了相似的觀點(diǎn):1)從小模型到大模型的范式轉(zhuǎn)變,這導(dǎo)致了模型應(yīng)用向大公司集中,大模型正在改變 AI 產(chǎn)業(yè)的規(guī)則與格局;2)人工智能與科學(xué)計(jì)算的深度融合,AI+X 逐漸迸發(fā)光彩。 內(nèi)容來源:https://mp.weixin.qq.com/s/uiCdd2wZofxYaXB9JB49UQ 2. AI 給老照片上色,真的準(zhǔn)嗎?技術(shù)圈和歷史圈吵了 1000 帖 AI 給老照片上色,近來確實(shí)很火爆,但上的顏色真的準(zhǔn)確嗎?有人便就此做了個(gè)實(shí)驗(yàn),把 20 世紀(jì)初俄國(guó)的彩色照片去色后,再與 AI 上色的結(jié)果做對(duì)比。
此帖一出,在 Reddit 上的機(jī)器學(xué)習(xí)社區(qū)和歷史愛好者社區(qū)引發(fā)了大激辯。不到一天的時(shí)間蓋起一千多樓,總計(jì) 3 萬 5 千贊。來自機(jī)器學(xué)習(xí)版塊的選手首先提出了質(zhì)疑:你用的這個(gè)算法,他是 State of the Art 嗎?一看就是簡(jiǎn)單地將損失函數(shù)設(shè)計(jì)成計(jì)算周圍像素的均方誤差 (MSE) 一類的東西,這樣就會(huì)促使 AI 選擇低飽和度的顏色 在照片上色愛好者聚集地,人們認(rèn)為手動(dòng)給老照片上色最有價(jià)值的環(huán)節(jié)其實(shí)是搜集資料。尋找照片中事物應(yīng)有顏色的過程中總是能學(xué)到很酷的歷史知識(shí)。也有人指出,在網(wǎng)上發(fā)布 AI 上色的照片,人們的焦點(diǎn)都放在對(duì)技術(shù)進(jìn)步的慶祝了。老照片背后的人文價(jià)值卻被忽略。 內(nèi)容來源:https://mp.weixin.qq.com/s/IsIY55QI1Bo7E-uF5xZgaghttps://www./r/MachineLearning/comments/mqqnxj/d_r_aiml_colorisation_versus_actual_color_photos/https://www./r/Colorization/comments/mqn103/the_problem_with_ai_colorization/ 三、產(chǎn)業(yè)動(dòng)態(tài)聚焦 1. 微軟重資押注醫(yī)療 AI , 或?qū)?160 億美元收購(gòu) Nuance 近日,微軟正在進(jìn)行關(guān)于收購(gòu)全球最大語音識(shí)別技術(shù)公司 Nuance Communications 的談判。微軟的出價(jià)是每股 56 美元,這比 Nuance 上周五的收盤價(jià)溢價(jià) 23%,使其的股權(quán)價(jià)值達(dá)到近 160 億美元。因此,如果最終交易成功,這將是微軟史上第二大收購(gòu)案(僅次于 2016 年 270 億美元對(duì) LinkedIn 的收購(gòu))。 這一行為背后,微軟可能正在向醫(yī)療 AI 押下重注。此次收購(gòu)對(duì)于微軟來說,最直接的益處是提升其在語音軟件領(lǐng)域的實(shí)力。Nuance 的知名之處是其 AI 語音識(shí)別技術(shù),被網(wǎng)友成為 “美國(guó)的科大訊飛”,比如 Nuance 是蘋果 Siri 語音識(shí)別技術(shù)的合作伙伴。并且, Nuance 研發(fā)的語音識(shí)別、記錄工具在醫(yī)生問診、客服電話和語音郵件中都有應(yīng)用。 雖然目前微軟已經(jīng)向開發(fā)者提供了諸如語言轉(zhuǎn)錄等相似功能,但通過此次收購(gòu),微軟依然可以將 Nuance 的相關(guān)技術(shù)和其他 AI 工具整合到自身產(chǎn)品中,從而提升語音軟件實(shí)力。從更長(zhǎng)遠(yuǎn)的角度看,微軟的目的是向醫(yī)療 AI 領(lǐng)域增加投入。Nuance 近年圍繞醫(yī)院和醫(yī)生的云系統(tǒng)進(jìn)行了業(yè)務(wù)重建,而微軟也在拓展醫(yī)療行業(yè)的業(yè)務(wù),盡力提升與醫(yī)療相關(guān)的云計(jì)算軟件銷量。 內(nèi)容來源:https://mp.weixin.qq.com/s/SRpOEm62Uw2gNl-thLe5rw 2. 報(bào)告|中國(guó)人工智能專利申請(qǐng)量世界第 1,是美國(guó)的 8.2 倍 2020 中國(guó)人工智能產(chǎn)業(yè)年會(huì)日前在蘇州舉行,會(huì)上《中國(guó)人工智能發(fā)展報(bào)告 2020》正式發(fā)布。數(shù)據(jù)顯示,過去十年(2011-2020)全球人工智能專利申請(qǐng)量 521264 件,總體上呈逐年上升趨勢(shì)。報(bào)告顯示,過去十年,全球人工智能專利申請(qǐng)集中在中國(guó)、美國(guó)、日本、韓國(guó)。其中,中國(guó)和美國(guó)處于領(lǐng)先地位。中國(guó)專利申請(qǐng)量為 389571,位居世界第一,占全球總量的 74.7%,是排名第二的美國(guó)的 8.2 倍。 從專利申請(qǐng)的地域分布來看,廣東省的 AI 專利申請(qǐng)量以 72737 位居第一,比排名第二的北京市(50906)多出 42.8%,具有突出優(yōu)勢(shì)。前十名的省份主要分布在東部、中部、西部等地區(qū),分布較為均衡,但是以東部省市居多,江浙滬三省市均位居前五名。這與這些地區(qū)的經(jīng)濟(jì)水平、發(fā)展程度、科研投入及知識(shí)產(chǎn)權(quán)保護(hù)等因素密切相關(guān)。 此外報(bào)告顯示,過去十年,全球人工智能專利申請(qǐng)之中,將近一半的申請(qǐng)人是來自于企業(yè)。高校和研究所的相關(guān)申請(qǐng)量共計(jì)約兩成。從人工智能領(lǐng)域的人才角度來看,國(guó)內(nèi) AI 領(lǐng)域高層次人才也主要分布在京津冀、長(zhǎng)三角和珠三角地區(qū),其中,京津冀地區(qū)(主要是北京市)在 AI 領(lǐng)域的高層次人才數(shù)量最多。長(zhǎng)三角地區(qū)也有較多的 AI 高層次人才分布。相比之下,內(nèi)陸地區(qū)領(lǐng)域高層次人才較為缺乏。 內(nèi)容來源:https://mp.weixin.qq.com/s/_Yhh1K2Xl7xaHvyS1Fz_qw 3. 英偉達(dá)推出首個(gè) CPU,基于 ARM 架構(gòu)主攻巨型 AI,性能超 x86 十倍 北京時(shí)間 4 月 13 日凌晨,英偉達(dá)在 GCT 2021 大會(huì)上宣布了 Grace、BlueField-3 DPU,還有用于自動(dòng)駕駛的汽車 SoC 芯片三款處理器,均基于 Arm 架構(gòu)打造。 其中最引人矚目的當(dāng)屬名為 Grace 的 CPU 產(chǎn)品,這款產(chǎn)品主要為現(xiàn)代數(shù)據(jù)中心設(shè)計(jì)。這是英偉達(dá)首款服務(wù)器 CPU。 英偉達(dá)認(rèn)為,AI 模型的數(shù)據(jù)量和規(guī)模正在成倍增長(zhǎng)。當(dāng)今最大的 AI 模型包括數(shù)十億個(gè)參數(shù),并且每?jī)蓚€(gè)半月就會(huì)翻一番。訓(xùn)練它們需要一個(gè)新的 CPU,可以與 GPU 緊密結(jié)合,以消除系統(tǒng)瓶頸。 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“前沿的 AI 和數(shù)據(jù)科學(xué)正推動(dòng)當(dāng)今的計(jì)算機(jī)架構(gòu)超越其極限,以處理規(guī)模難以想象的海量數(shù)據(jù)。NVIDIA 借助 Arm 授權(quán)的 IP 設(shè)計(jì)了 Grace,這是一款專為大規(guī)模 AI 和 HPC 設(shè)計(jì)的 CPU。與 GPU 和 DPU 一起,Grace 為我們提供了計(jì)算的第三種基礎(chǔ)技術(shù),以及為了推進(jìn) AI 發(fā)展重構(gòu)數(shù)據(jù)中心的能力。NVIDIA 現(xiàn)在是一家擁有三種芯片的公司?!?/section> 內(nèi)容來源:https://mp.weixin.qq.com/s/j29sAdm4bDIXtr2_v8HG5ghttps://www.cnbeta.com/articles/tech/1113887.htmhttps://www.cnbeta.com/articles/tech/1113901.htmhttps://www.cnbeta.com/articles/tech/1113891.htm