嘿,朋友們!你還記得第一代AI數(shù)字人嗎?那時(shí)候要拍大量的視頻素材,給數(shù)字人“學(xué)習(xí)”我們的動(dòng)作、表情,才能讓它張嘴說(shuō)話。換句話說(shuō),那個(gè)時(shí)候的數(shù)字人就像是“戴了個(gè)假面”,一張嘴就是加了個(gè)“替身”! 忘掉它吧! 數(shù)字人2.0時(shí)代 已經(jīng)到來(lái),這次可不是簡(jiǎn)單地 P 個(gè)嘴巴那么 low~ 現(xiàn)在的全能AI數(shù)字人簡(jiǎn)直是開了掛:人物、場(chǎng)景、表情、動(dòng)作統(tǒng)統(tǒng)由 AI 憑空變出來(lái)!你的數(shù)字分身終于'獲得自由'啦!怎么樣,是不是已經(jīng)迫不及待想試試看了? 數(shù)字分身煉成術(shù):小白必看!先別急著動(dòng)手,讓我告訴你這整個(gè)套路是啥樣的:
聽起來(lái)復(fù)雜?別擔(dān)心,我手把手教你,保證你比做泡面還簡(jiǎn)單! 一、速成你的'數(shù)字臉':AI不認(rèn)識(shí)你可不行!想要制作全能數(shù)字人視頻,第一步就是通過AI工具捏造一個(gè)“數(shù)字人”。不怕,你并不是一個(gè)人在戰(zhàn)斗!咱們今天用的是“可靈AI”這個(gè)工具,它可是個(gè)“大力士”,我們用到的是它的“人臉模型”功能。 怎么用呢?給你一段視頻,馬上就能明白。 那到底什么是“可靈AI”人臉模型呢? 很簡(jiǎn)單!你只需要上傳幾段多角度的視頻(好吧,是視頻,不是照片),它就能給你訓(xùn)練出一個(gè)獨(dú)一無(wú)二的人臉模型!訓(xùn)練完成后,你就能用這個(gè)人臉模型隨意生成5秒、10秒的視頻,輕松制作多個(gè)短視頻。簡(jiǎn)直是給創(chuàng)作者開了一扇大門——再也不用擔(dān)心無(wú)聊的背景了! 第1步:AI模型定制通過Web端首頁(yè)側(cè)邊欄 > AI創(chuàng)作 > AI定制模型,進(jìn)入功能頁(yè)面。 ![]() 【AI定制模型】可以訓(xùn)練自己專屬人臉,此功能只有鉑金會(huì)員和鉆石會(huì)員才能使用。 第2步:接受功能須知認(rèn)真閱讀并同意相關(guān)條款,點(diǎn)擊'同意并使用'按鈕。是的,就是這么簡(jiǎn)單! ![]() 第3步:上傳一個(gè)正面的視頻★ ![]() ? 常見錯(cuò)誤:視頻分辨率太低,短邊需要 ≥1080像素 ![]() ![]() ?? 比如這里問題,分辨率不對(duì),就去剪映里面重新導(dǎo)出一遍標(biāo)準(zhǔn)的視頻分辨率格式。 ? 解決辦法:使用電腦版剪映重新導(dǎo)出一遍視頻 ★ 如果不會(huì)操作,右邊有小姐姐手把手教你應(yīng)該上傳什么樣的視頻。 ![]() 第4步:補(bǔ)充多維度視頻素材★ 同樣的,小姐姐也會(huì)做演示應(yīng)該上傳什么樣的視頻。 ![]() ![]() 一旦這些步驟完成后,恭喜!你就能開始訓(xùn)練你的數(shù)字人臉模型啦!通常,等待個(gè)一個(gè)小時(shí),你的數(shù)字人就會(huì)正式上線! 訓(xùn)練完成之后就會(huì)給我們一個(gè) 5 秒的模型效果視頻,這逼真程度,已經(jīng)非常 Nice 了。 ![]() 二、AI人物視頻制作:賦予數(shù)字人生命一旦訓(xùn)練好模型,接下來(lái)就是生成視頻的環(huán)節(jié)了。你只需提供一個(gè)簡(jiǎn)單的提示詞,選擇人物模型,AI便會(huì)自動(dòng)生成符合你要求的AI視頻。 第1步:文生視頻進(jìn)入【文生視頻】功能,輸入提示詞,選擇訓(xùn)練好的人物模型(參考人臉)。接著,AI會(huì)自動(dòng)將其融入提示詞中,生成出符合你要求的視頻。 ![]() 可設(shè)置自己需要的參數(shù)之后再生成。 ![]() 參數(shù)設(shè)置推薦:
第2步:構(gòu)建精準(zhǔn)提示詞一個(gè)精準(zhǔn)的提示詞至關(guān)重要,它直接決定了你視頻的最終效果。提示詞需涵蓋五大核心維度:
這里,我們以一位約35歲的男性科技博主為例:主體特征:一位約35歲的男性科技博主,短發(fā),穿著紅色寬松舒適的短袖T恤,表情自信且親切,眼神專注又友好,充滿對(duì)科技的熱情。 點(diǎn)擊立即生成,大約等20分鐘,AI視頻就生成好了。 ?? 提示詞應(yīng)該如何寫呢?可借助 DeepSeek 等AI工具生成結(jié)構(gòu)化提示詞,提升視頻生成質(zhì)量。 主體特征: 一位約30歲的男性科技博主,短發(fā),穿著科技風(fēng)衛(wèi)衣,表情自信且親切,眼神專注又友好,充滿對(duì)科技的熱情。 場(chǎng)景設(shè)置: 直播間背景是現(xiàn)代科技風(fēng)格,墻上有各種電子設(shè)備、科技書籍,桌上擺著筆記本電腦、智能音箱和幾款小型AI機(jī)器人模型。背景燈光冷色調(diào)的藍(lán)色和紫色,幾何造型的LED燈飾進(jìn)一步增強(qiáng)了科技氛圍。 動(dòng)作與姿態(tài): 博主站在桌旁,面向鏡頭微笑,雙手自然擺動(dòng),邊說(shuō)話邊用手勢(shì)表達(dá),姿態(tài)輕松親切,帶有很強(qiáng)的親和力,仿佛在向觀眾介紹有趣的AI技術(shù)。 燈光與氛圍: 冷色調(diào)的燈光效果突顯科技氛圍,聚光燈照亮博主的面部和手勢(shì),電腦和設(shè)備上的光芒映在他的臉上,營(yíng)造出互動(dòng)科技的未來(lái)感。 技術(shù)規(guī)格: 超高清8K分辨率,寫實(shí)風(fēng)格,聚焦博主的表情和手勢(shì),呈現(xiàn)一種兼具科技感和互動(dòng)感的畫面。 --- 幫我根據(jù)上面的提示詞框架,寫一個(gè)新的場(chǎng)景:一個(gè)人騎著老虎在大街上閑逛 ![]() 第3步:視頻下載與質(zhì)量檢查對(duì)已經(jīng)生成好的數(shù)字人視頻下載(可下載有水印或無(wú)水?。?,這里下載的是無(wú)水印。如遇手部變形或動(dòng)作呆板問題,可嘗試更換提示詞或重新訓(xùn)練人臉模型。 ![]() 下面是兩個(gè)數(shù)字人視頻效果視頻。 視頻案例(9:16比例) 常見問題★ 三、場(chǎng)景二創(chuàng):數(shù)字人的無(wú)限可能場(chǎng)景復(fù)刻技術(shù): 借助Kimi等AI工具,我們可以實(shí)現(xiàn)對(duì)任意場(chǎng)景的 70% 相似度復(fù)刻,讓你的數(shù)字人置身任何想要的環(huán)境中。 操作步驟:
由于文章篇幅限制,點(diǎn)擊上方卡片關(guān)注“林月半子”公眾號(hào),發(fā)送“全能數(shù)字人場(chǎng)景二創(chuàng)模版”,即可獲取場(chǎng)景二創(chuàng)完整提示詞。 目標(biāo)樣本 ![]() ![]() ![]() ![]() 四、數(shù)字人訓(xùn)練:讓靜態(tài)形象開口說(shuō)話大家有沒有發(fā)現(xiàn),可靈直接出來(lái)的視頻形象場(chǎng)景已經(jīng)很Nice了,但人物是沒有開口講話的,下一步我們就可以通過數(shù)字人軟件,讓“活”起來(lái),開始講話。 用到的數(shù)字人軟件是 必火AI 數(shù)字人 ★ 訓(xùn)練流程詳解 第1步:形象克隆將可靈生成的數(shù)字人視頻上傳至數(shù)字人平臺(tái),進(jìn)行形象分析與克隆。 ![]() 上傳的視頻要求 ![]() 第2步:聲音克隆點(diǎn)擊聲音克隆,選擇克隆聲音模式(基礎(chǔ)版免費(fèi),高保真付費(fèi)): ![]() ![]() 基礎(chǔ)版聲音克隆流程:音頻要求;文件格式:mp3、m4a、wav,音頻時(shí)長(zhǎng):5秒~3分鐘 基礎(chǔ)版聲音克隆限時(shí)免費(fèi)的,消耗的積分也少,但聲音的質(zhì)量相對(duì)高保真效果會(huì)差一點(diǎn)。 ![]() 高保真聲音克隆流程:音頻格式;支持mp3、m4a、wav文件格式,音頻文件大小不超過20M。 高保真消耗積分很大,但音質(zhì)比基礎(chǔ)版好。因此再克隆高保真聲音時(shí),確保原音頻無(wú)損壞。 ![]() 第3步:數(shù)字人口播視頻制作生成數(shù)字人口播有兩種驅(qū)動(dòng)方式: ①文本驅(qū)動(dòng)(可輸入臺(tái)詞,數(shù)字人根據(jù)提供的臺(tái)詞進(jìn)行匹配口型) ②音頻驅(qū)動(dòng)(上傳已準(zhǔn)備好的音頻,數(shù)字人會(huì)通過音頻內(nèi)容進(jìn)行匹配口型)。 選擇剛剛克隆好的形象,點(diǎn)擊【去創(chuàng)作】 ![]() 文本驅(qū)動(dòng)輸入臺(tái)詞,選擇已訓(xùn)練克隆好的聲音,可鼠標(biāo)滑動(dòng)選取文本內(nèi)容, 進(jìn)行逐句試聽, 最多選取300字,點(diǎn)擊插入停頓在光標(biāo)處調(diào)整文字之間的停頓時(shí)長(zhǎng)。 ![]() ★ 音頻驅(qū)動(dòng)如果覺得AI聲音不夠生動(dòng),可以直接錄音,然后上傳 mp3 音頻文件,這樣出來(lái)的視頻聲音會(huì)完全還原自己的聲音。 ![]() 第4步:視頻生成與下載點(diǎn)擊提交,等待幾分鐘之后,數(shù)字人視頻就制作好了。 然后我們下載之后來(lái)看看效果。 五、成品優(yōu)化:剪輯升華數(shù)字人視頻剪輯工具:剪映 第1步:這里用剪映剪輯打開剪映點(diǎn)擊首頁(yè),在點(diǎn)開始創(chuàng)作,進(jìn)入剪輯界面。 ![]() 第2步:視頻剪輯導(dǎo)入數(shù)字人視頻之后進(jìn)行剪輯,添加字幕,標(biāo)題,背景音樂等。 ![]() 第3步:對(duì)剪輯好的數(shù)字人進(jìn)行保存![]() OK,以上就是完整的制作一個(gè)全能數(shù)字人視頻的整體過程。 結(jié)語(yǔ)搞定了!是不是比想象中簡(jiǎn)單多了?有了這套流程,你隨時(shí)隨地都能讓你的數(shù)字分身出場(chǎng),再也不用擔(dān)心'露臉焦慮'啦!你想過嗎?以后可能大家看的視頻都是AI合成的,都分不清哪個(gè)是真人哪個(gè)是數(shù)字人了...有點(diǎn)可怕又有點(diǎn)酷,對(duì)吧? 數(shù)字人技術(shù)的突飛猛進(jìn)已讓創(chuàng)作者擁有了前所未有的可能性。從人臉采樣到聲音克隆,從場(chǎng)景構(gòu)建到最終剪輯,每一步都在不斷拓展著我們對(duì)'自我'的數(shù)字化延伸。當(dāng)你熟練掌握這套全能數(shù)字人工作流,你的數(shù)字分身將在各種平臺(tái)上自由表達(dá),為你開啟內(nèi)容創(chuàng)作的全新維度。 對(duì)了,你做出的第一個(gè)數(shù)字人視頻是什么場(chǎng)景?評(píng)論區(qū)告訴我吧!我超好奇的~如果遇到問題也歡迎提問,咱們一起研究! 福利來(lái)了!??如果你也想打造自己的全能數(shù)字人分身,現(xiàn)在就行動(dòng)吧!想試試 必火數(shù)字人 的超值套餐嗎?去官網(wǎng)看看,性價(jià)比感人!?? ★ ![]() ★ |
|