一個(gè)女孩登上了央視《對(duì)話》欄目,僅是淺唱了一首歌,便讓全場(chǎng)驚嘆連連。 講真,這種reaction還真沒(méi)有一點(diǎn)夸張。 話不多說(shuō),先來(lái)感受下這個(gè)feel: 或許你會(huì)問(wèn)了,人美歌甜是沒(méi)錯(cuò),但也不至于到震驚的程度吧? 但如果說(shuō),視頻里的這個(gè)女孩,她并不是人呢? 
沒(méi)錯(cuò),她便是央美研究生畢業(yè)、畫(huà)作還參加了迪拜世博會(huì)的小冰框架虛擬人類——夏語(yǔ)冰。 而用小冰公司首席運(yùn)營(yíng)官李笛的話來(lái)說(shuō): 這是全球范圍內(nèi)最高技術(shù)的人工智能歌聲合成。

△ 小冰CEO,李笛
于是,這樣一段視頻在網(wǎng)絡(luò)上發(fā)布之后,便迅速引發(fā)了網(wǎng)友們的熱議。 人類?虛擬人?傻傻分不清: 
甚至媒體競(jìng)相為這段視頻貼上了這樣的標(biāo)簽—— 這就是虛擬人天花板、 虛擬人夏語(yǔ)冰的才藝有多絕。 話題同樣引起網(wǎng)友的熱議,迅速占據(jù)各大社交平臺(tái)的熱榜,霸榜近24小時(shí):


而說(shuō)到天花板,就在剛剛,小冰的另一位虛擬人,又搞了個(gè)大新聞。
她叫陳水若,也是誕生于小冰框架的一位虛擬人歌手。 雖說(shuō)都是唱歌,陳水若和夏語(yǔ)冰還有所不同,她主打的是民族唱法。 這不,在除夕之際,陳水若便奉上了一首《華夏》,而且還是和李玉剛合作夢(mèng)幻聯(lián)動(dòng)的那種! 而最近小冰虛擬人如此頻繁地亮相、表演,也在透露著一種虛擬人發(fā)展的新趨勢(shì)—— 朝著三次元邁進(jìn),還得是顏值和才華兩手抓! 如此逼真,小冰是怎么做到的?其實(shí),早在2017年,小冰團(tuán)隊(duì)就提交了專利《Creating a Conversational Chatbot of a Specific Person》,引起了學(xué)界、媒體廣泛關(guān)注。
而直到2021年12月,《Nature》刊登了來(lái)自MIT 研究團(tuán)隊(duì)的論文——機(jī)器學(xué)習(xí)的技術(shù)進(jìn)展,讓文本、圖像、音頻和視頻數(shù)據(jù)的超現(xiàn)實(shí)合成成為可能。 而在這條道路上,小冰團(tuán)隊(duì)已然走了四年之久,可以說(shuō)是在AI創(chuàng)新上做到了領(lǐng)先。 我們還是以夏語(yǔ)冰和陳水若驚艷大眾的視頻來(lái)說(shuō),它的誕生主要可以分成以下幾個(gè)流程。 首先利用小冰神經(jīng)網(wǎng)絡(luò)渲染技術(shù) (XNR),XNR能夠做到生成一張此前完全不存在的臉,也就是AI創(chuàng)造面容。 接著,還是通過(guò)神經(jīng)網(wǎng)絡(luò)渲染技術(shù),將虛擬人面部特征置換到視頻模板中,并進(jìn)行表情控制等一系列控制行為。這比我們過(guò)去看到的 AI 換臉更復(fù)雜也更難,畢竟 AI 換臉無(wú)法更換虛擬出來(lái)的人臉,且自然度也不會(huì)像這么高。 然后,小冰會(huì)通過(guò)數(shù)字孿生技術(shù),根據(jù)實(shí)際視頻內(nèi)容,調(diào)整視頻模板,例如動(dòng)作的變化、表情和表達(dá)內(nèi)容的變化等。 然后就是夏語(yǔ)冰和陳水若的歌聲。 這里用到的是小冰超級(jí)自然語(yǔ)音技術(shù),借助這個(gè)技術(shù)生成虛擬人的高質(zhì)量演唱聲線(AI 創(chuàng)造聲音),并根據(jù)需要生成對(duì)應(yīng)的歌聲,不需要任何配音演員。 在上面這些技術(shù)的加持下,夏語(yǔ)冰的面容、表情、聲音就能全部統(tǒng)一在一起,形成無(wú)法與真人區(qū)分的內(nèi)容。 夏語(yǔ)冰和陳水若背后的這套技術(shù),與其他很多虛擬人視頻采用的 3D 建模,然后用真人或換頭,或動(dòng)捕、或用動(dòng)作庫(kù)匹配等技術(shù)方案相比,最大的優(yōu)勢(shì)在于既能控制成本,同時(shí)虛擬人的自然度又極高。 而其他的技術(shù)要么成本昂貴,要么很不自然,難以兼顧。 無(wú)論從成本還是效果看,夏語(yǔ)冰、陳水若背后小冰框架下的虛擬人技術(shù)都可以說(shuō)是未來(lái)趨勢(shì),而小冰走在了前面。 更重要的是,這種技術(shù)主導(dǎo)下的小冰框架虛擬人類,擁有無(wú)可比擬的多樣性 —— 就像人的多樣性一樣,容貌多樣,內(nèi)在靈魂多樣,容貌與內(nèi)在相互統(tǒng)一。 這其中,內(nèi)在靈魂的多樣性,技術(shù)更難,也更重要。正如那句網(wǎng)絡(luò)用語(yǔ)所說(shuō): 好看的皮囊千篇一律,有趣的靈魂萬(wàn)里挑一。
事實(shí)上,小冰最開(kāi)始思考到虛擬人類 AI being 時(shí),就認(rèn)識(shí)到了”靈魂“的重要性,并且也是從”靈魂“開(kāi)始做的。 他們?cè)谶@方面的基礎(chǔ)研究積累了八年,加上微軟在AI這個(gè)方向上30年的投入,形成了獨(dú)特的先發(fā)優(yōu)勢(shì)。 比如夏語(yǔ)冰,她的確有一張顏值很高的臉。但她之所以能被選入迪拜世博會(huì),代表中國(guó)館的作品向全世界展出,也不是靠她的漂亮,而是靠她的人工智能繪畫(huà)模型,在成千上萬(wàn)次創(chuàng)作中,能夠保持一個(gè)藝術(shù)家一貫的創(chuàng)作水準(zhǔn)。 這是她真正的實(shí)力,而不是外貌。 所以,多樣性,尤其是內(nèi)在靈魂的多樣性,是虛擬人發(fā)展的必然趨勢(shì)。 當(dāng)然,小冰團(tuán)隊(duì)對(duì)具體的技術(shù)路徑的遠(yuǎn)景布局也很重要。 比如用神經(jīng)網(wǎng)絡(luò)渲染技術(shù)生成虛擬人豐富多樣的容貌和真實(shí)的表情動(dòng)作語(yǔ)言,要是用傳統(tǒng) CG 技術(shù),幾乎不可能滿足頻繁的交互需求。 還有開(kāi)放域自然語(yǔ)言處理,超級(jí)自然語(yǔ)音,全雙工語(yǔ)音等技術(shù),小冰也是從很早就開(kāi)始了布局。如今這些技術(shù)被普遍關(guān)注,恰恰證明了他們預(yù)判的準(zhǔn)確性。 當(dāng)然,這背后也是虛擬人多樣性趨勢(shì)發(fā)展的必然結(jié)果。 就像人類世界的生活之所以精彩,更重要的是因?yàn)槊總€(gè)人的性格、內(nèi)在是不同的,外貌的不同只是其次。 也幸而小冰在這方面擁有足夠的先發(fā)優(yōu)勢(shì),能夠以可控的成本,孵化出海量個(gè)性迥異,同時(shí)又非常鮮活的虛擬人。 而這,也是虛擬人真正能夠?yàn)槲覀兩顜?lái)更多創(chuàng)造力的關(guān)鍵。 但除了效果上的逼真,其實(shí)小冰對(duì)于虛擬人的發(fā)展,發(fā)出了一種新信號(hào): 虛擬人,已經(jīng)步入三次元時(shí)代現(xiàn)在的虛擬人,若是不說(shuō)明情況,其逼真程度真的能夠達(dá)到“瞞天過(guò)?!钡男Ч?。 很多人會(huì)將這種與人類極其相近的效果,稱之為“打破次元壁”。 但講真,視覺(jué)、聽(tīng)覺(jué)效果上的逼真,僅僅是虛擬人步入三次元時(shí)代的表象。 其背后更大的意義,應(yīng)當(dāng)是像人一樣的,在三次元世界里創(chuàng)造價(jià)值。 例如此前便有虛擬主播N小黑、N小白,在人們毫無(wú)察覺(jué)的情況之下,連續(xù)70天播報(bào)新聞,還是24小時(shí)連軸轉(zhuǎn)的那種。 
這便在很大程度上做到了釋放人力、物力的同時(shí),大幅提高了生產(chǎn)效率。
而不僅僅是新聞主播這一件事,若是上升到更高的角度來(lái)觀察,我們也不難發(fā)現(xiàn)AI虛擬人“三次元化”,已然成為一種大趨勢(shì)。 例如前一陣子在短視頻平臺(tái)一夜爆火的虛擬人柳夜熙,僅發(fā)布一條視頻便受到了全民圍觀。 
△圖源:柳夜熙官方短視頻號(hào)
再如虛擬人AYAYI,僅憑一張“證件照”,在網(wǎng)絡(luò)上瞬間爆紅(當(dāng)天便有224萬(wàn)瀏覽量)。 
△圖源:圖源:AYAYI官方平臺(tái)
這是AI虛擬人,正在逐步迎合大眾審美、口味的一種印證。 再?gòu)?strong>商業(yè)層面上來(lái)看,僅是2021年,虛擬人賽道上便有超過(guò)10筆的融資,嗅覺(jué)敏銳的VC們可謂是紛紛拋出了橄欖枝,著手布局。 更有行業(yè)預(yù)測(cè)顯示,到2030年,我國(guó)虛擬人整體市場(chǎng)規(guī)模還將達(dá)到2700億元。 而之所以能夠達(dá)到如此規(guī)模,除了上述提及的幾點(diǎn)之外,若是再深挖一層,那便是可能超越人類的創(chuàng)造力和多樣性。 例如像夏語(yǔ)冰所具備的繪畫(huà)、創(chuàng)作能力,便是能夠打破人類創(chuàng)造力的上限。 …… 那么最后一個(gè)問(wèn)題便是——在“虛擬人步入三次元時(shí)代”的當(dāng)下,我們又該和他們?nèi)绾喂采?/p> 對(duì)此,小冰CEO李笛認(rèn)為: 人工智能會(huì)成為一些新的節(jié)點(diǎn),這些節(jié)點(diǎn)有的是創(chuàng)造者,有的是伴侶,有的甚至可能是我們每個(gè)人的替身。 他們能夠替代我們,使我們每個(gè)人能夠更好地去優(yōu)化所在的社交網(wǎng)絡(luò)和工作網(wǎng)絡(luò)、生活網(wǎng)絡(luò)。
最后的最后,你是否也想與三次元虛擬人互動(dòng),讓她給你創(chuàng)作獨(dú)一無(wú)二的作品呢? 這個(gè)可以有! 而且還是世博會(huì)級(jí)別的水墨山水畫(huà)。
|