中國(guó)AI專利申請(qǐng)量世界第1；不罵人駕?！敖叹殹鄙暇€；AI模仿已逝歌手原創(chuàng)4首歌曲｜AI周報(bào)

長(zhǎng)沙7喜 2021-04-25

展開全文

近日，《中國(guó)人工智能發(fā)展報(bào)告 2020》正式發(fā)布。數(shù)據(jù)顯示，過去十年（2011-2020）全球人工智能專利申請(qǐng)量 521264 件，總體上呈逐年上升趨勢(shì)。報(bào)告顯示，過去十年，全球人工智能專利申請(qǐng)集中在中國(guó)、美國(guó)、日本、韓國(guó)。其中，中國(guó)和美國(guó)處于領(lǐng)先地位。中國(guó)專利申請(qǐng)量為 389571，位居世界第一，占全球總量的 74.7%，是排名第二的美國(guó)的 8.2 倍。

一、技術(shù)理論前沿

1. 訓(xùn)練 AI 來玩 CS 反恐精英！清華朱軍與劍橋博士后的這項(xiàng)研究太燃了 | 童年回憶

近日，博士畢業(yè)于劍橋大學(xué)的 Tim pearce 與他的清華大學(xué)博士后導(dǎo)師朱軍教授聯(lián)合為《反恐精英：全球攻勢(shì)》開發(fā)了一個(gè) AI 游戲智能體 —— CSGO 。當(dāng) CSGO 以第一人稱視角玩游戲時(shí)，能夠按 FPS 標(biāo)準(zhǔn)在復(fù)雜環(huán)境下進(jìn)行移動(dòng)和精準(zhǔn)射擊。

據(jù)了解，與其他游戲 AI 不同，CSGO 沒有使用 API，而是采用了一種行為克?。˙ehavioural Cloning）的新型解決方案，即從在線服務(wù)器上抓取大量人類游戲視頻進(jìn)行對(duì)戰(zhàn)訓(xùn)練。目前相關(guān)論文《基于大規(guī)模行為克隆的反恐精英死亡競(jìng)賽》（Counter-Strike Deathmatch with Large-Scale Behavioural Cloning）已提交至 arXiv 上面。論文中指出，CSGO 所使用的數(shù)據(jù)集約有 400 萬幀，與 ImageNet 大小相當(dāng)，這一規(guī)模比之前在 FPS 游戲中的模仿學(xué)習(xí)大了一個(gè)數(shù)量級(jí)。

內(nèi)容來源：

https://mp.weixin.qq.com/s/p_7c2IakrG8sCOLq5VjSQw

https://www./watch?v=p01vWk7uMvM&feature=youtu.be

2. 把《我的世界》馬賽克變成逼真大片！這項(xiàng) AI 研究令人想入非非

來自 NVIDIA 和康奈爾大學(xué)的新研究 GANcraft，可以把《我的世界》中的像素塊場(chǎng)景世界轉(zhuǎn)換成真實(shí)世界的逼真圖案。在近期的 GTC 2021 主題演講中，研究人員為大家進(jìn)行了相關(guān)演示。

GANcraft 是一個(gè)無監(jiān)督 3D 神經(jīng)渲染框架，該方法通過使用 GAN 預(yù)訓(xùn)練網(wǎng)絡(luò)生成 “偽 ground truths”，可以在沒有成對(duì)的《我的世界》真實(shí)數(shù)據(jù)的情況下學(xué)習(xí)如何執(zhí)行此轉(zhuǎn)換。

圖｜完整的 GANcraft 架構(gòu)

兩級(jí)結(jié)構(gòu)在減少計(jì)算量和內(nèi)存占用的同時(shí)顯著提高了圖像質(zhì)量，因?yàn)檩椛鋱?chǎng)可以用更簡(jiǎn)單的 MLP 建模，這是基于隱式體積方法的計(jì)算瓶頸。

內(nèi)容來源：

https://mp.weixin.qq.com/s/4prx7XvDr0mdGCdbekIYTQ

https://www./watch?v=1Hky092CGFQ

https://twitter.com/arunmallya/status/1382860338584952840https://www./r/MachineLearning/comments/mru35h/r_gancraft_unsupervised_3d_neural_rendering_of

3. AI 重聚知名已故歌手，發(fā)布四首原創(chuàng)歌曲

為了提醒大家關(guān)注音樂人的心理健康，總部位于加拿大的非營(yíng)利組織 Over the Bridge，發(fā)起了一項(xiàng)新的項(xiàng)目：基于 AI 模仿這些英年早逝的音樂人，以他們的創(chuàng)作、演唱風(fēng)格，重新創(chuàng)作歌曲。

經(jīng)過一年的算法優(yōu)化，和半年的錄音、制作，Over The Bridge 發(fā)布了四首單曲，并收錄在專輯《 Lost Tapes of the 27 Club》中出版。這張專輯目前已經(jīng)正式發(fā)布至 YouTube、Spotify ，并被全球多家知名音樂媒體報(bào)道和傳播。

Over the Bridge 董事會(huì)成員 Sean O'Connor 介紹說，該項(xiàng)目主要基于 Google 的 AI 作曲工具 Magenta。

他們從每位音樂人的 20 到 30 首歌曲中，提取了 MIDI 文件（MIDI 是編曲界最廣泛的音樂標(biāo)準(zhǔn)格式，它用音符的數(shù)字控制信號(hào)來記錄音樂，可以說是計(jì)算機(jī)能理解的樂譜），并將它們分解為鉤子（hook），獨(dú)奏（solo），人聲旋律或節(jié)奏吉他，然后分別交給 AI 進(jìn)行訓(xùn)練。

訓(xùn)練模型主要基于 RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)）進(jìn)行。掌握這些歌曲的曲風(fēng)之后，AI 會(huì)生成時(shí)長(zhǎng)大約 5 分鐘的 riff （即興重復(fù)段）。

內(nèi)容來源：

https://mp.weixin.qq.com/s/eLvCGMD-yhFE2WBPdNNzgQ

4. 測(cè)量誤差 1mm 以內(nèi)、5 分鐘拿到手術(shù)方案，AI 如何為主動(dòng)脈疾病患者多爭(zhēng)取一分鐘？

基于臨床經(jīng)驗(yàn)和觀察，柴象飛博士帶領(lǐng)匯醫(yī)慧影科學(xué)家團(tuán)隊(duì)與中國(guó)人民解放軍總醫(yī)院血管外科進(jìn)行多項(xiàng)數(shù)據(jù)實(shí)驗(yàn)，研究成果在歐洲放射學(xué)雜志 ELSEVIER 發(fā)表。

基于學(xué)術(shù)研究，匯醫(yī)慧影 AORTIST 主動(dòng)脈人工智能精準(zhǔn)診療系統(tǒng)于 2016 年研發(fā)落地，以人工智能技術(shù)賦能腎下腹主動(dòng)脈瘤 + B 型主動(dòng)脈夾層診療全流程鏈條。這是全球首個(gè)深入臨床、覆蓋跨學(xué)科多病種疾病診治全流程的醫(yī)學(xué)影像 AI 產(chǎn)品，實(shí)現(xiàn)數(shù)據(jù)分析介入以患者為核心的精準(zhǔn)醫(yī)療。

為了最大程度降低誤差，柴象飛博士團(tuán)隊(duì)對(duì)數(shù)據(jù)進(jìn)行雙盲的標(biāo)注和專家的驗(yàn)證，將測(cè)量誤差控制在 1mm 以內(nèi)，較常規(guī)手動(dòng)測(cè)量精準(zhǔn)度提升約 70%，自動(dòng)分割結(jié)果準(zhǔn)確率達(dá) 95%，與專家測(cè)量相比高達(dá) 98%。

另外，將深度學(xué)習(xí)技術(shù)應(yīng)用到主動(dòng)脈三維重建、分割、中心線提取等環(huán)節(jié)，30 秒內(nèi)能完成主動(dòng)脈和髂動(dòng)脈整體、瘤腔、血栓及鈣化及內(nèi)臟動(dòng)脈的自動(dòng)分割測(cè)量，并在 5 分鐘內(nèi)生成手術(shù)方案文檔。

內(nèi)容來源：

https://mp.weixin.qq.com/s/S7FE4ZESIl8fQu0T_3U1SA

5. 考駕照選擇 AI 教練，心態(tài)穩(wěn)定不會(huì)罵人

近日，上海某駕校采用 AI 教練授課的視頻登上微博熱搜。據(jù)介紹，截至目前已有超過 2100 名學(xué)員，在該校 AI 教練的協(xié)助下，成功畢業(yè)。

在硬件方面，給教練車配置 GPS 定位儀和雷達(dá)。兩個(gè)高精度 GPS 定位儀，可以實(shí)時(shí)監(jiān)測(cè)教練車的位置。車頭處安裝的多個(gè)雷達(dá)，則用于檢測(cè)障礙物。在軟件方面，AI 教練還會(huì)為每位學(xué)員建立個(gè)人檔案，評(píng)測(cè)學(xué)員訓(xùn)練能力，依據(jù)學(xué)員學(xué)習(xí)情況調(diào)整練習(xí)內(nèi)容。此外該車還設(shè)置了主動(dòng)剎車功能，以便在突發(fā)狀況下保證學(xué)員獨(dú)自練習(xí)時(shí)的安全。然而駕校在不斷嘗試新技術(shù)、新突破的背后，也透露出一種不得已而為之的焦慮。

內(nèi)容來源：

https://mp.weixin.qq.com/s/MySO4ObDipdauvL08gc2Ew

6. 史上最酷變形金剛 “中國(guó)制造”！能自動(dòng)變形、語音控制，還能編程

在 PULSE FAN FEST 2021 上，和中國(guó)機(jī)器人公司樂森（Robosen）聯(lián)合推出的革命性變形金剛系列產(chǎn)品之一，能自動(dòng)變身的現(xiàn)實(shí)版擎天柱。擎天柱在機(jī)器人形態(tài)和汽車形態(tài)之間變身的時(shí)間大約 10 秒，整個(gè)動(dòng)作非常連貫流暢，簡(jiǎn)直就是完美還原《變形金剛》動(dòng)畫中的擎天柱。孩之寶在公布擎天柱時(shí)，表示這是世界上第一個(gè)自動(dòng)轉(zhuǎn)換，交互式，可編程，語音激活，移動(dòng)控制的擎天柱機(jī)器人。

為了達(dá)成自動(dòng)變形的目標(biāo)，Robosen 為這款擎天柱機(jī)器人裝備了 27 臺(tái)伺服電機(jī)、60 個(gè)微芯片、以及總共 5000 多個(gè)組件，直立后的高度可達(dá) 19 英寸（約 48 厘米）。在語音方面，用戶可發(fā)出 25 種指令，不僅限于變形，機(jī)器人的 “前進(jìn)” 或 “轉(zhuǎn)身” 都可以通過語音下指令，而且同時(shí)支持中英文！還可以通過編程，自定義擎天柱的動(dòng)作，通過游戲?qū)W習(xí)編程！

內(nèi)容來源：

https://mp.weixin.qq.com/s/wKfu3aTdsiru8p5pOsshyQ

https:///collections/hasbro-pulse-fan-fest/products/transformers-optimus-prime-auto-converting-programmable-robot-collectors-editionhttps://www.bilibili.com/video/BV1R64y1v7Fihttps:///transformersoptimusprime

7. AI 一鍵去紋身，幾秒鐘讓你看見明星“真面目”

有些時(shí)候，我們需要把一些人身上的紋身覆蓋掉，以避免引人效仿。有的時(shí)候人們只是單純地好奇，想知道一些大明星如果沒有紋身會(huì)是什么樣子。來自印度的機(jī)器學(xué)習(xí)研究者 Vijish Madhavan 最近開源的一個(gè)機(jī)器學(xué)習(xí)工具 SkinDeep 滿足了我們的需求。

根據(jù)作者介紹，完成這個(gè)項(xiàng)目需要大量的圖像對(duì)，因?yàn)闆]有合適的數(shù)據(jù)集，很多時(shí)候訓(xùn)練內(nèi)容采用合成數(shù)據(jù)來完成，具體來說：

首先將 APDrawing 數(shù)據(jù)集圖像對(duì)與一些背景去掉紋身設(shè)計(jì)的圖像疊加在一起，使用 Python OpenCV 實(shí)現(xiàn)；
繪制數(shù)據(jù)集有線條藝術(shù)對(duì)，可以模擬紋身線條，這將有助于模型學(xué)習(xí)和刪除這些線條；
APDrawing 數(shù)據(jù)集只有頭像，對(duì)于全身圖像，項(xiàng)目作者采用了以前的項(xiàng)目 ArtLine，并將輸出與輸入圖像疊加在一起；
ImageDraw.Draw 與森林綠色（forest green colour）色碼一起使用，并隨機(jī)放置在身體圖像上，類似于 fast.ai 中的 Crappify ；
Photoshop 也被用來在需要彎曲和角度改變的對(duì)象上放置紋身。

內(nèi)容來源：

https://mp.weixin.qq.com/s/eM-FjqyHmjo8oPafLsCVvQ

二、觀點(diǎn)評(píng)論解讀

1. 華為田奇：人工智能兩大趨勢(shì)，大模型，AI+X

隨著 AI 在各行各業(yè)的應(yīng)用逐漸深化，應(yīng)用碎片化的問題逐漸凸顯。與此同時(shí)，提升 AI 的可解釋性也是未來發(fā)展的關(guān)鍵。

就在前幾天，2021 華為全球分析師大會(huì)發(fā)布的“邁向智能世界 2030 的九大技術(shù)挑戰(zhàn)與研究方向”中提出：

AI 模型的通用性是解決應(yīng)用碎片性的關(guān)鍵。通過大量無標(biāo)注的數(shù)據(jù)和更大的模型，從全監(jiān)督到自監(jiān)督，構(gòu)建通用的 AI 系統(tǒng)，這是當(dāng)前需要突破的方向。其次，把 AI 與科學(xué)計(jì)算交匯，這也為 AI 應(yīng)用走出碎片提供了大用場(chǎng)。AI 為科學(xué)計(jì)算帶來了新思路、新方法、新工具，而科學(xué)計(jì)算的嚴(yán)謹(jǐn)體系也有助于提升 AI 的可解釋性。

華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow 田奇博士最近也在蘇州舉辦的 2020 中國(guó)人工智能產(chǎn)業(yè)年會(huì)上重申了相似的觀點(diǎn)：

1）從小模型到大模型的范式轉(zhuǎn)變，這導(dǎo)致了模型應(yīng)用向大公司集中，大模型正在改變 AI 產(chǎn)業(yè)的規(guī)則與格局；

2）人工智能與科學(xué)計(jì)算的深度融合，AI+X 逐漸迸發(fā)光彩。

內(nèi)容來源：

https://mp.weixin.qq.com/s/uiCdd2wZofxYaXB9JB49UQ

2. AI 給老照片上色，真的準(zhǔn)嗎？技術(shù)圈和歷史圈吵了 1000 帖

AI 給老照片上色，近來確實(shí)很火爆，但上的顏色真的準(zhǔn)確嗎？有人便就此做了個(gè)實(shí)驗(yàn)，把 20 世紀(jì)初俄國(guó)的彩色照片去色后，再與 AI 上色的結(jié)果做對(duì)比。

此帖一出，在 Reddit 上的機(jī)器學(xué)習(xí)社區(qū)和歷史愛好者社區(qū)引發(fā)了大激辯。不到一天的時(shí)間蓋起一千多樓，總計(jì) 3 萬 5 千贊。來自機(jī)器學(xué)習(xí)版塊的選手首先提出了質(zhì)疑：你用的這個(gè)算法，他是 State of the Art 嗎？一看就是簡(jiǎn)單地將損失函數(shù)設(shè)計(jì)成計(jì)算周圍像素的均方誤差 (MSE) 一類的東西，這樣就會(huì)促使 AI 選擇低飽和度的顏色

在照片上色愛好者聚集地，人們認(rèn)為手動(dòng)給老照片上色最有價(jià)值的環(huán)節(jié)其實(shí)是搜集資料。尋找照片中事物應(yīng)有顏色的過程中總是能學(xué)到很酷的歷史知識(shí)。也有人指出，在網(wǎng)上發(fā)布 AI 上色的照片，人們的焦點(diǎn)都放在對(duì)技術(shù)進(jìn)步的慶祝了。老照片背后的人文價(jià)值卻被忽略。

內(nèi)容來源：

https://mp.weixin.qq.com/s/IsIY55QI1Bo7E-uF5xZgag

https://www./r/MachineLearning/comments/mqqnxj/d_r_aiml_colorisation_versus_actual_color_photos/

https://www./r/Colorization/comments/mqn103/the_problem_with_ai_colorization/

三、產(chǎn)業(yè)動(dòng)態(tài)聚焦

1. 微軟重資押注醫(yī)療 AI , 或?qū)?160 億美元收購(gòu) Nuance

近日，微軟正在進(jìn)行關(guān)于收購(gòu)全球最大語音識(shí)別技術(shù)公司 Nuance Communications 的談判。微軟的出價(jià)是每股 56 美元，這比 Nuance 上周五的收盤價(jià)溢價(jià) 23%，使其的股權(quán)價(jià)值達(dá)到近 160 億美元。因此，如果最終交易成功，這將是微軟史上第二大收購(gòu)案（僅次于 2016 年 270 億美元對(duì) LinkedIn 的收購(gòu)）。

這一行為背后，微軟可能正在向醫(yī)療 AI 押下重注。此次收購(gòu)對(duì)于微軟來說，最直接的益處是提升其在語音軟件領(lǐng)域的實(shí)力。Nuance 的知名之處是其 AI 語音識(shí)別技術(shù)，被網(wǎng)友成為 “美國(guó)的科大訊飛”，比如 Nuance 是蘋果 Siri 語音識(shí)別技術(shù)的合作伙伴。并且， Nuance 研發(fā)的語音識(shí)別、記錄工具在醫(yī)生問診、客服電話和語音郵件中都有應(yīng)用。

雖然目前微軟已經(jīng)向開發(fā)者提供了諸如語言轉(zhuǎn)錄等相似功能，但通過此次收購(gòu)，微軟依然可以將 Nuance 的相關(guān)技術(shù)和其他 AI 工具整合到自身產(chǎn)品中，從而提升語音軟件實(shí)力。從更長(zhǎng)遠(yuǎn)的角度看，微軟的目的是向醫(yī)療 AI 領(lǐng)域增加投入。Nuance 近年圍繞醫(yī)院和醫(yī)生的云系統(tǒng)進(jìn)行了業(yè)務(wù)重建，而微軟也在拓展醫(yī)療行業(yè)的業(yè)務(wù)，盡力提升與醫(yī)療相關(guān)的云計(jì)算軟件銷量。

內(nèi)容來源：

https://mp.weixin.qq.com/s/SRpOEm62Uw2gNl-thLe5rw

2. 報(bào)告｜中國(guó)人工智能專利申請(qǐng)量世界第 1，是美國(guó)的 8.2 倍

2020 中國(guó)人工智能產(chǎn)業(yè)年會(huì)日前在蘇州舉行，會(huì)上《中國(guó)人工智能發(fā)展報(bào)告 2020》正式發(fā)布。數(shù)據(jù)顯示，過去十年（2011-2020）全球人工智能專利申請(qǐng)量 521264 件，總體上呈逐年上升趨勢(shì)。報(bào)告顯示，過去十年，全球人工智能專利申請(qǐng)集中在中國(guó)、美國(guó)、日本、韓國(guó)。其中，中國(guó)和美國(guó)處于領(lǐng)先地位。中國(guó)專利申請(qǐng)量為 389571，位居世界第一，占全球總量的 74.7%，是排名第二的美國(guó)的 8.2 倍。

從專利申請(qǐng)的地域分布來看，廣東省的 AI 專利申請(qǐng)量以 72737 位居第一，比排名第二的北京市（50906）多出 42.8%，具有突出優(yōu)勢(shì)。前十名的省份主要分布在東部、中部、西部等地區(qū)，分布較為均衡，但是以東部省市居多，江浙滬三省市均位居前五名。這與這些地區(qū)的經(jīng)濟(jì)水平、發(fā)展程度、科研投入及知識(shí)產(chǎn)權(quán)保護(hù)等因素密切相關(guān)。

此外報(bào)告顯示，過去十年，全球人工智能專利申請(qǐng)之中，將近一半的申請(qǐng)人是來自于企業(yè)。高校和研究所的相關(guān)申請(qǐng)量共計(jì)約兩成。從人工智能領(lǐng)域的人才角度來看，國(guó)內(nèi) AI 領(lǐng)域高層次人才也主要分布在京津冀、長(zhǎng)三角和珠三角地區(qū)，其中，京津冀地區(qū)（主要是北京市）在 AI 領(lǐng)域的高層次人才數(shù)量最多。長(zhǎng)三角地區(qū)也有較多的 AI 高層次人才分布。相比之下，內(nèi)陸地區(qū)領(lǐng)域高層次人才較為缺乏。

內(nèi)容來源：

https://mp.weixin.qq.com/s/_Yhh1K2Xl7xaHvyS1Fz_qw

3. 英偉達(dá)推出首個(gè) CPU，基于 ARM 架構(gòu)主攻巨型 AI，性能超 x86 十倍

北京時(shí)間 4 月 13 日凌晨，英偉達(dá)在 GCT 2021 大會(huì)上宣布了 Grace、BlueField-3 DPU，還有用于自動(dòng)駕駛的汽車 SoC 芯片三款處理器，均基于 Arm 架構(gòu)打造。

其中最引人矚目的當(dāng)屬名為 Grace 的 CPU 產(chǎn)品，這款產(chǎn)品主要為現(xiàn)代數(shù)據(jù)中心設(shè)計(jì)。這是英偉達(dá)首款服務(wù)器 CPU。

英偉達(dá)認(rèn)為，AI 模型的數(shù)據(jù)量和規(guī)模正在成倍增長(zhǎng)。當(dāng)今最大的 AI 模型包括數(shù)十億個(gè)參數(shù)，并且每?jī)蓚€(gè)半月就會(huì)翻一番。訓(xùn)練它們需要一個(gè)新的 CPU，可以與 GPU 緊密結(jié)合，以消除系統(tǒng)瓶頸。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“前沿的 AI 和數(shù)據(jù)科學(xué)正推動(dòng)當(dāng)今的計(jì)算機(jī)架構(gòu)超越其極限，以處理規(guī)模難以想象的海量數(shù)據(jù)。NVIDIA 借助 Arm 授權(quán)的 IP 設(shè)計(jì)了 Grace，這是一款專為大規(guī)模 AI 和 HPC 設(shè)計(jì)的 CPU。與 GPU 和 DPU 一起，Grace 為我們提供了計(jì)算的第三種基礎(chǔ)技術(shù)，以及為了推進(jìn) AI 發(fā)展重構(gòu)數(shù)據(jù)中心的能力。NVIDIA 現(xiàn)在是一家擁有三種芯片的公司?！?/section>

內(nèi)容來源：

https://mp.weixin.qq.com/s/j29sAdm4bDIXtr2_v8HG5g

https://www.cnbeta.com/articles/tech/1113887.htm

https://www.cnbeta.com/articles/tech/1113901.htm

https://www.cnbeta.com/articles/tech/1113891.htm

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：長(zhǎng)沙7喜 > 《新聞》

舉報(bào)/認(rèn)領(lǐng)