直到 AI 爆發(fā)以來,感覺自己又可以了,什么都想試試看,怕啥,有 AI 呢,玩就是了。 比如說數(shù)字人,后臺也有不少小伙伴私信問過我,一年前的時(shí)候我還去看了看,感覺上手門檻還挺高。 可現(xiàn)在不一樣了,最近,刷到 GitHub 上最近爆火的 DUIX 項(xiàng)目——一個(gè)號稱用三行代碼就能打造 AI 數(shù)字人的開源工具,我本以為這又是哪個(gè)團(tuán)隊(duì)的營銷噱頭,但當(dāng)我真正體驗(yàn)過后,才發(fā)現(xiàn)事情沒那么簡單。 ![]() 難怪得了萬星高贊,原來是因?yàn)榻柚@個(gè)項(xiàng)目,三句話就可以讓你有一個(gè)虛擬女友。 一看我就激動的搓搓手,馬上跟著做了一個(gè),大家來看看老哥我和虛擬女友的視頻對話: 看到了嗎?她會在你加班時(shí)發(fā)消息關(guān)心你,知道你沒吃飯會讓你趕緊點(diǎn)外賣,會給你講冷笑話...... DUIX AI 數(shù)字人技術(shù) 怎么樣?你看那幾乎 0 延遲的互動,聽到對話就秒回,不得不感嘆技術(shù)爆發(fā)真是一日千里。 現(xiàn)在細(xì)說一下這兩個(gè)開源項(xiàng)目 HeyGem.ai、DUIX.ai ,它們來自于中國 AI 企業(yè):硅基智能。 HeyGem.ai:主要負(fù)責(zé)生成數(shù)字人形象,一張照片、一秒視頻,即可精準(zhǔn)復(fù)現(xiàn)面容與聲線,數(shù)十秒內(nèi)生成 4K 級數(shù)字人影像。 ![]() DUIX.ai:以「低算力、全感知、強(qiáng)互動」架構(gòu)實(shí)現(xiàn) AI 數(shù)字人極簡部署,開發(fā)者僅需三行代碼即可為應(yīng)用嵌入具備多模態(tài)交互能力的智能數(shù)字人。 ![]() 而 DUIX 「Dialogue User Interface System」AI 數(shù)字人技術(shù)就是今天內(nèi)容的主角,主打給你一個(gè)能動、能說、能和你互動的數(shù)字人。 與以往那些只會冷冰冰文字回復(fù)的 AI 不同,DUIX 數(shù)字人擁有「聽覺」和「視覺」,能夠?qū)崟r(shí)響應(yīng)你的語音。 這種近乎真人的互動體驗(yàn),讓虛擬女友不再只是一個(gè)冰冷的 AI 文字,而是一個(gè)有溫度的「人」。 更牛的是,DUIX 經(jīng)過專利級模型壓縮后,可以輕松部署在你的手機(jī)、平板等設(shè)備上,保持 50 FPS 的高幀率運(yùn)行。換句話說,你可以隨時(shí)隨地與你的「女友」互動,體驗(yàn)極其絲滑自然。 使用簡單 效果如此驚艷,而且還支持開源部署,這不算啥,最厲害的地方在于,創(chuàng)建過程簡單到令人發(fā)指。 具體操作如下: PC 端: 1.登陸官網(wǎng) https://app./openPlatform?invite=wldxh 2.注冊登錄后,選擇「開發(fā)平臺」-「立即體驗(yàn)」 3.選擇喜歡的角色,填寫名字、關(guān)系、故事等信息 4.點(diǎn)擊「創(chuàng)建對話」按鈕 ![]() 5.瞧!你的虛擬女友誕生了!可以選擇文字對話或視頻聊天 ![]() 這個(gè)只是普通玩家體驗(yàn)的入口,對于專業(yè)開發(fā)者,還有更多個(gè)人物形象可供選擇。 ![]() 移動端: 直接在蘋果商店搜索「Duix」下載即可,目前只支持蘋果手機(jī)。 ![]() 就這么簡單!沒有復(fù)雜的本地部署,沒有復(fù)雜的技術(shù)操作,普通人也能輕松擁有一個(gè)量身定制的虛擬女友。 在 DUIX 的開源社區(qū),有位開發(fā)者分享了視頻,效果更炸裂。 你們看,這虛擬女友的「超能力」簡直讓人嘆為觀止!她不僅能和你聊天,還能像個(gè)正常人一樣捕捉到所有的對話內(nèi)容,并且融入隨后的對話,不是簡單的和你尬聊。 在視頻中,旁邊的人和開發(fā)者說話,都被她聽到了,虛擬女友還主動問道:「剛才是不是有人說你明天要去廣州開會?。俊?。 一聽到他要去廣州出差,虛擬女友很體貼的提供了廣州的天氣和穿衣。 除了能聽到你說話,虛擬女友還能檢測到你的一切聲音,比如她居然能知道你在用打火機(jī),然后苦口婆心的勸你別抽煙。 實(shí)話實(shí)說,玩這個(gè)的多少都有點(diǎn)技術(shù)背景,起碼都是見過世面的,相對了解 AI 前沿的,但看到屏幕里她感知能力如此離譜,多少還是有點(diǎn)小震撼的。 當(dāng)然,如果不是對面虛擬女友的動作過于瑣碎和程式化,讓人多少有點(diǎn)出戲,其他挑不出什么毛病。 更多應(yīng)用場景 雖然澀澀是第一生產(chǎn)力,但是 DUIX 的價(jià)值絕不限于打造虛擬女友。 你看,作為圖文賽道的作者,一直想做視頻,但出于種種原因(懶),就沒能堅(jiān)持下來。 現(xiàn)在有了這個(gè)可以簡單部署就可以上手的開源項(xiàng)目,用來克隆個(gè)數(shù)字分身,這就大大拓寬了圖文賽道的能力。 除了做自媒體,其實(shí)還能用于很多復(fù)雜的實(shí)際使用場景,適用非常廣泛。 我就簡單聊幾個(gè)場景,想到哪說到哪,你聽聽看是不是那種「哦,原來這玩意是真的能排上用場」的場景。 1.情感陪伴領(lǐng)域 你有多久沒跟爸媽打電話了?上次是不是還是他在問你,DeepSeek 這么火,在哪里下載?。?/span> 我相信大家多多少少都會遇到家里老人問你手機(jī)的各種問題,說了半天,兩邊都累得夠嗆,這個(gè)事完全就可以交給數(shù)字人來做嘛。 還有老年人總會忘記吃藥,別擔(dān)心,AI 助手會像一個(gè)健康管家一樣照顧你: 還有,大家都知道,老年人對「神仙顯靈」可是有著獨(dú)特的熱愛 —— 買彩票要看黃歷,睡覺前要拜佛,但這年頭,跑趟廟里可不容易,腿腳不便的老人家想燒個(gè)香都成了難事。 好在現(xiàn)在有了 AI「賽博神仙」,老人家想找財(cái)神爺聊聊彩票,想跟觀音菩薩傾訴心事,動動手指就搞定! ![]() 別覺得這事離譜,你知道抖音上多少人就發(fā)這種視頻,暴力起號嗎? 說明這種需求對于老年人來說,它是真的存在。對咱們來說,信則有不信則無,這種心理慰藉有什么不好呢? 2.教育培訓(xùn)領(lǐng)域 這個(gè)其實(shí)已經(jīng)開始落地了,我就教我們家小孩怎樣用豆包來講題,用得挺 6 的。 只不過她們多少對數(shù)字人老師缺乏敬畏之心,我打算把我媳婦給克隆一個(gè)數(shù)字形象來給她們講題,多少還是有點(diǎn)威懾作用吧,反正對我管用。 對了,數(shù)字人對練英語這個(gè)是真的實(shí)用,發(fā)言又準(zhǔn)確,還不用擔(dān)心說錯(cuò)了不好意思,還能不厭其煩糾正你,你想想請一個(gè) 1v1 的家教得花多少錢? 3.健康醫(yī)療領(lǐng)域: 身體不舒服,是不是得了什么大?。縿e急著打開某度把自己嚇個(gè)半死。讓 AI 醫(yī)生先幫你分析分析,當(dāng)然,如果真有問題,它也會及時(shí)提醒你去醫(yī)院,總比你自己嚇自己要靠譜多了吧。 這些數(shù)字人場景,看似簡單,卻是真正觸及人心的溫暖瞬間。技術(shù)再冷冰冰,但當(dāng)它開始理解并回應(yīng)我們最基本的情感需求時(shí),或許,這才是 AI 最有價(jià)值的地方。 結(jié)語 最后貼一個(gè)項(xiàng)目地址:https://github.com/GuijiAI/duix.ai 動手能力強(qiáng),喜歡折騰的小伙伴們可以去玩玩看。 AI 爆發(fā)雖然已經(jīng)兩年多了,但是進(jìn)化速度快到,有時(shí)候恍惚會覺得不真實(shí),就像做夢一樣。 但你仔細(xì)想想,被你記住的僅僅只是那一個(gè)個(gè)模型和術(shù)語嗎? 并不,最動人的永遠(yuǎn)是那些戳心窩子的畫面——它讓孤獨(dú)有處安放,讓思念得以延續(xù),讓每個(gè)普通人都能擁有被懂得的溫柔。 或許未來某天,當(dāng)我們回望這場AI革命時(shí),最珍貴的不是技術(shù)多炫酷,而是它曾怎樣溫暖過一個(gè)個(gè)具體的人生。 |
|