我用AI復(fù)制了自己，結(jié)果太驚人！數(shù)字分身制作全攻略大公開！

徐徐見之 2025-04-15 發(fā)布于河北

展開全文

我是林月半子，與你「探索AI的無(wú)限可能」，一起擁抱未來(lái)！

嘿，朋友們！你還記得第一代AI數(shù)字人嗎？那時(shí)候要拍大量的視頻素材，給數(shù)字人“學(xué)習(xí)”我們的動(dòng)作、表情，才能讓它張嘴說(shuō)話。換句話說(shuō)，那個(gè)時(shí)候的數(shù)字人就像是“戴了個(gè)假面”，一張嘴就是加了個(gè)“替身”！

忘掉它吧！

數(shù)字人2.0時(shí)代 已經(jīng)到來(lái)，這次可不是簡(jiǎn)單地 P 個(gè)嘴巴那么 low～現(xiàn)在的全能AI數(shù)字人簡(jiǎn)直是開了掛：人物、場(chǎng)景、表情、動(dòng)作統(tǒng)統(tǒng)由 AI 憑空變出來(lái)！你的數(shù)字分身終于'獲得自由'啦！怎么樣，是不是已經(jīng)迫不及待想試試看了？

數(shù)字分身煉成術(shù)：小白必看！

先別急著動(dòng)手，讓我告訴你這整個(gè)套路是啥樣的：

抓臉：拍點(diǎn)自己的高清小視頻（別擔(dān)心，不用化妝，素顏也行??）
煉臉：把視頻丟給AI訓(xùn)練成你的'數(shù)字臉模型'
造場(chǎng)景：想在哪耍就在哪耍，沙灘、雪山、太空站隨你挑！
生成視頻：AI根據(jù)你的臉和想要的場(chǎng)景做出一段短視頻
剪裁：把生成的素材修修剪剪
練形象：讓AI更懂你的樣子和特點(diǎn)
克隆聲音：讓AI學(xué)會(huì)用你的聲音說(shuō)話
合成大片：最終生成會(huì)說(shuō)話的、動(dòng)起來(lái)的數(shù)字人視頻

聽起來(lái)復(fù)雜？別擔(dān)心，我手把手教你，保證你比做泡面還簡(jiǎn)單！

一、速成你的'數(shù)字臉'：AI不認(rèn)識(shí)你可不行！

想要制作全能數(shù)字人視頻，第一步就是通過AI工具捏造一個(gè)“數(shù)字人”。不怕，你并不是一個(gè)人在戰(zhàn)斗！咱們今天用的是“可靈AI”這個(gè)工具，它可是個(gè)“大力士”，我們用到的是它的“人臉模型”功能。

怎么用呢？給你一段視頻，馬上就能明白。

那到底什么是“可靈AI”人臉模型呢？

很簡(jiǎn)單！你只需要上傳幾段多角度的視頻（好吧，是視頻，不是照片），它就能給你訓(xùn)練出一個(gè)獨(dú)一無(wú)二的人臉模型！訓(xùn)練完成后，你就能用這個(gè)人臉模型隨意生成5秒、10秒的視頻，輕松制作多個(gè)短視頻。簡(jiǎn)直是給創(chuàng)作者開了一扇大門——再也不用擔(dān)心無(wú)聊的背景了！

第1步：AI模型定制

通過Web端首頁(yè)側(cè)邊欄 > AI創(chuàng)作 > AI定制模型，進(jìn)入功能頁(yè)面。

【AI定制模型】

可以訓(xùn)練自己專屬人臉，此功能只有鉑金會(huì)員和鉆石會(huì)員才能使用。

第2步：接受功能須知

認(rèn)真閱讀并同意相關(guān)條款，點(diǎn)擊'同意并使用'按鈕。是的，就是這么簡(jiǎn)單！

第3步：上傳一個(gè)正面的視頻

★
你需要上傳一段正面的視頻（10-15秒，1080p，橫豎屏均可）。千萬(wàn)記住，視頻分辨率得高！否則，數(shù)字人可能會(huì)有點(diǎn)“模糊”。調(diào)整完模型名字點(diǎn)保存，然后點(diǎn)擊下一步。

? 常見錯(cuò)誤：視頻分辨率太低，短邊需要 ≥1080像素

?? 比如這里問題，分辨率不對(duì)，就去剪映里面重新導(dǎo)出一遍標(biāo)準(zhǔn)的視頻分辨率格式。

? 解決辦法：使用電腦版剪映重新導(dǎo)出一遍視頻
①比例選擇 9:16
②時(shí)長(zhǎng)控制在 10-15秒之間
③導(dǎo)出時(shí)選擇 1080P

★
關(guān)鍵技術(shù)要求
豎屏視頻：1080 * 1920 分辨率
橫屏視頻：1920 * 1080 分辨率
若分辨率不達(dá)標(biāo)，可用剪映以正確參數(shù)重新導(dǎo)出

如果不會(huì)操作，右邊有小姐姐手把手教你應(yīng)該上傳什么樣的視頻。

第4步：補(bǔ)充多維度視頻素材

★
拍更多不同角度的視頻（10-15秒），至少得有10段。每個(gè)視頻都有它的作用，別偷懶?。∵@些可是你數(shù)字人生命的“營(yíng)養(yǎng)源(豐富訓(xùn)練樣本庫(kù))”。
完成上傳后，系統(tǒng)將開始模型訓(xùn)練，消耗999可靈值(且用且珍惜)。

同樣的，小姐姐也會(huì)做演示應(yīng)該上傳什么樣的視頻。

一旦這些步驟完成后，恭喜！你就能開始訓(xùn)練你的數(shù)字人臉模型啦！通常，等待個(gè)一個(gè)小時(shí)，你的數(shù)字人就會(huì)正式上線！

訓(xùn)練完成之后就會(huì)給我們一個(gè) 5 秒的模型效果視頻，這逼真程度，已經(jīng)非常 Nice 了。

二、AI人物視頻制作：賦予數(shù)字人生命

一旦訓(xùn)練好模型，接下來(lái)就是生成視頻的環(huán)節(jié)了。你只需提供一個(gè)簡(jiǎn)單的提示詞，選擇人物模型，AI便會(huì)自動(dòng)生成符合你要求的AI視頻。

第1步：文生視頻

進(jìn)入【文生視頻】功能，輸入提示詞，選擇訓(xùn)練好的人物模型（參考人臉）。接著，AI會(huì)自動(dòng)將其融入提示詞中，生成出符合你要求的視頻。

可設(shè)置自己需要的參數(shù)之后再生成。

參數(shù)設(shè)置推薦：

生成模式：高品質(zhì)
生成時(shí)長(zhǎng)：10秒（消耗70可靈值，比5秒更具應(yīng)用價(jià)值）
視頻比例：9:16，適合短視頻內(nèi)容
生成數(shù)量：可同時(shí)生成1-4條（可靈值會(huì)疊加）

第2步：構(gòu)建精準(zhǔn)提示詞

一個(gè)精準(zhǔn)的提示詞至關(guān)重要，它直接決定了你視頻的最終效果。提示詞需涵蓋五大核心維度：

主體特征：年齡、性別、著裝、表情特點(diǎn)等
場(chǎng)景設(shè)置：背景環(huán)境、周圍物品、空間氛圍
動(dòng)作與姿態(tài)：肢體語(yǔ)言、面部微表情、互動(dòng)方式
燈光與氛圍：光影效果、色調(diào)氛圍、視覺重點(diǎn)
技術(shù)規(guī)格：分辨率要求、風(fēng)格定位、細(xì)節(jié)要求

這里，我們以一位約35歲的男性科技博主為例：

主體特征：一位約35歲的男性科技博主，短發(fā)，穿著紅色寬松舒適的短袖T恤，表情自信且親切，眼神專注又友好，充滿對(duì)科技的熱情。
場(chǎng)景設(shè)置：直播間背景是現(xiàn)代科技風(fēng)格，中景構(gòu)圖清晰展示博主從腰部以上至頭頂?shù)漠嬅?，同時(shí)呈現(xiàn)周圍環(huán)境。墻上有各種電子設(shè)備、科技書籍，前方是一張簡(jiǎn)約的站立式工作臺(tái)，桌上擺著筆記本電腦、智能音箱和幾款小型AI機(jī)器人模型。背景燈光冷色調(diào)的藍(lán)色和紫色，幾何造型的LED燈飾進(jìn)一步增強(qiáng)了科技氛圍，紅色寬松短袖在冷色調(diào)環(huán)境中形成鮮明對(duì)比。場(chǎng)景中沒有任何椅子，體現(xiàn)博主站立直播的風(fēng)格。
動(dòng)作與姿態(tài)：博主站在工作臺(tái)旁，面向鏡頭保持專業(yè)站姿，神情嚴(yán)肅但不過分緊繃。雙手自然下垂，在講解AI技術(shù)時(shí)配合精準(zhǔn)的手勢(shì)強(qiáng)調(diào)重點(diǎn)，動(dòng)作幅度克制有力。眼神專注直視鏡頭，眉宇間略微收緊傳遞思考狀態(tài)，身體保持直立微向前傾，肩部放松避免僵硬感。通過沉穩(wěn)的語(yǔ)速和停頓節(jié)奏，搭配簡(jiǎn)潔明確的手部動(dòng)作，營(yíng)造出嚴(yán)謹(jǐn)?shù)募夹g(shù)探討氛圍，同時(shí)維持適度的觀眾交流感。
燈光與氛圍：冷色調(diào)的燈光效果突顯科技氛圍，聚光燈照亮博主的面部和手勢(shì)，電腦和設(shè)備上的光芒映在他的臉上，營(yíng)造出互動(dòng)科技的未來(lái)感。燈光巧妙打在紅色寬松短袖上，使其在畫面中形成視覺焦點(diǎn)。
技術(shù)規(guī)格：超高清8K分辨率，寫實(shí)風(fēng)格，中景構(gòu)圖平衡展示博主與環(huán)境的關(guān)系，聚焦博主的表情和手勢(shì)，呈現(xiàn)一種兼具科技感和互動(dòng)感的畫面。通過景深控制使博主成為視覺中心，同時(shí)保持周圍環(huán)境的清晰可辨。

點(diǎn)擊立即生成，大約等20分鐘，AI視頻就生成好了。

?? 提示詞應(yīng)該如何寫呢？可借助 DeepSeek 等AI工具生成結(jié)構(gòu)化提示詞，提升視頻生成質(zhì)量。

主體特征：一位約30歲的男性科技博主，短發(fā)，穿著科技風(fēng)衛(wèi)衣，表情自信且親切，眼神專注又友好，充滿對(duì)科技的熱情。場(chǎng)景設(shè)置：直播間背景是現(xiàn)代科技風(fēng)格，墻上有各種電子設(shè)備、科技書籍，桌上擺著筆記本電腦、智能音箱和幾款小型AI機(jī)器人模型。背景燈光冷色調(diào)的藍(lán)色和紫色，幾何造型的LED燈飾進(jìn)一步增強(qiáng)了科技氛圍。動(dòng)作與姿態(tài)：博主站在桌旁，面向鏡頭微笑，雙手自然擺動(dòng)，邊說(shuō)話邊用手勢(shì)表達(dá)，姿態(tài)輕松親切，帶有很強(qiáng)的親和力，仿佛在向觀眾介紹有趣的AI技術(shù)。燈光與氛圍：冷色調(diào)的燈光效果突顯科技氛圍，聚光燈照亮博主的面部和手勢(shì)，電腦和設(shè)備上的光芒映在他的臉上，營(yíng)造出互動(dòng)科技的未來(lái)感。技術(shù)規(guī)格：超高清8K分辨率，寫實(shí)風(fēng)格，聚焦博主的表情和手勢(shì)，呈現(xiàn)一種兼具科技感和互動(dòng)感的畫面。

--- 幫我根據(jù)上面的提示詞框架，寫一個(gè)新的場(chǎng)景：一個(gè)人騎著老虎在大街上閑逛

第3步：視頻下載與質(zhì)量檢查

對(duì)已經(jīng)生成好的數(shù)字人視頻下載（可下載有水印或無(wú)水?。?，這里下載的是無(wú)水印。如遇手部變形或動(dòng)作呆板問題，可嘗試更換提示詞或重新訓(xùn)練人臉模型。

下面是兩個(gè)數(shù)字人視頻效果視頻。

視頻案例（9:16比例）

常見問題

★
問題：可靈文生視頻，手變形了，動(dòng)作呆板
回答：有兩個(gè)層面，
換提示詞，可能這個(gè)提示詞出的就是有問題，覺得不行就換
所有提示詞都有問題，那就證明你訓(xùn)練人臉模型的時(shí)候，真人錄制的素材就不好，可以重新錄重新訓(xùn)練

三、場(chǎng)景二創(chuàng)：數(shù)字人的無(wú)限可能

場(chǎng)景復(fù)刻技術(shù)：

借助Kimi等AI工具，我們可以實(shí)現(xiàn)對(duì)任意場(chǎng)景的 70% 相似度復(fù)刻，讓你的數(shù)字人置身任何想要的環(huán)境中。操作步驟：

截取目標(biāo)場(chǎng)景圖片
將圖片上傳至Kimi并使用特定提示詞模板
根據(jù)需求調(diào)整生成的提示詞
將提示詞導(dǎo)入可靈文生視頻，選擇已訓(xùn)練的人臉模型

由于文章篇幅限制，點(diǎn)擊上方卡片關(guān)注“林月半子”公眾號(hào)，發(fā)送“全能數(shù)字人場(chǎng)景二創(chuàng)模版”，即可獲取場(chǎng)景二創(chuàng)完整提示詞。

目標(biāo)樣本

四、數(shù)字人訓(xùn)練：讓靜態(tài)形象開口說(shuō)話

大家有沒有發(fā)現(xiàn)，可靈直接出來(lái)的視頻形象場(chǎng)景已經(jīng)很Nice了，但人物是沒有開口講話的，下一步我們就可以通過數(shù)字人軟件，讓“活”起來(lái)，開始講話。

用到的數(shù)字人軟件是 必火AI 數(shù)字人

★
必火AI 數(shù)字人

通過我的邀請(qǐng)鏈接購(gòu)買有優(yōu)惠：https://www./login/SKolpV，可以添加林月半子微信，cloud-native-101，備注：必火AI，領(lǐng)取折扣碼，折上加折。

訓(xùn)練流程詳解

第1步：形象克隆

將可靈生成的數(shù)字人視頻上傳至數(shù)字人平臺(tái)，進(jìn)行形象分析與克隆。

上傳的視頻要求

第2步：聲音克隆

點(diǎn)擊聲音克隆，選擇克隆聲音模式（基礎(chǔ)版免費(fèi)，高保真付費(fèi)）：

基礎(chǔ)版聲音克隆流程：

音頻要求；文件格式：mp3、m4a、wav，音頻時(shí)長(zhǎng)：5秒～3分鐘基礎(chǔ)版聲音克隆限時(shí)免費(fèi)的，消耗的積分也少，但聲音的質(zhì)量相對(duì)高保真效果會(huì)差一點(diǎn)。

高保真聲音克隆流程：

音頻格式；支持mp3、m4a、wav文件格式，音頻文件大小不超過20M。高保真消耗積分很大，但音質(zhì)比基礎(chǔ)版好。因此再克隆高保真聲音時(shí)，確保原音頻無(wú)損壞。

第3步：數(shù)字人口播視頻制作

生成數(shù)字人口播有兩種驅(qū)動(dòng)方式：

①文本驅(qū)動(dòng)（可輸入臺(tái)詞，數(shù)字人根據(jù)提供的臺(tái)詞進(jìn)行匹配口型）

②音頻驅(qū)動(dòng)（上傳已準(zhǔn)備好的音頻，數(shù)字人會(huì)通過音頻內(nèi)容進(jìn)行匹配口型）。

選擇剛剛克隆好的形象，點(diǎn)擊【去創(chuàng)作】

文本驅(qū)動(dòng)

輸入臺(tái)詞，選擇已訓(xùn)練克隆好的聲音，可鼠標(biāo)滑動(dòng)選取文本內(nèi)容, 進(jìn)行逐句試聽, 最多選取300字，點(diǎn)擊插入停頓在光標(biāo)處調(diào)整文字之間的停頓時(shí)長(zhǎng)。

★
AI is truly amazing! What you are watching right now is my very first video created using my AI digital human.
你現(xiàn)在看到的視頻完全是由我的AI數(shù)字人生成，以后有了它，我再也不用反復(fù)拍視頻了，輸入文案就能生成新的視頻！你覺得我這個(gè)數(shù)字人視頻如何？歡迎留言告訴我哦！

音頻驅(qū)動(dòng)

如果覺得AI聲音不夠生動(dòng)，可以直接錄音，然后上傳 mp3 音頻文件，這樣出來(lái)的視頻聲音會(huì)完全還原自己的聲音。

第4步：視頻生成與下載

點(diǎn)擊提交，等待幾分鐘之后，數(shù)字人視頻就制作好了。然后我們下載之后來(lái)看看效果。

五、成品優(yōu)化：剪輯升華數(shù)字人視頻

剪輯工具：剪映

第1步：這里用剪映剪輯

打開剪映點(diǎn)擊首頁(yè)，在點(diǎn)開始創(chuàng)作，進(jìn)入剪輯界面。

第2步：視頻剪輯

導(dǎo)入數(shù)字人視頻之后進(jìn)行剪輯，添加字幕，標(biāo)題，背景音樂等。

第3步：對(duì)剪輯好的數(shù)字人進(jìn)行保存

OK，以上就是完整的制作一個(gè)全能數(shù)字人視頻的整體過程。

結(jié)語(yǔ)

搞定了！是不是比想象中簡(jiǎn)單多了？有了這套流程，你隨時(shí)隨地都能讓你的數(shù)字分身出場(chǎng)，再也不用擔(dān)心'露臉焦慮'啦！你想過嗎？以后可能大家看的視頻都是AI合成的，都分不清哪個(gè)是真人哪個(gè)是數(shù)字人了...有點(diǎn)可怕又有點(diǎn)酷，對(duì)吧？

數(shù)字人技術(shù)的突飛猛進(jìn)已讓創(chuàng)作者擁有了前所未有的可能性。從人臉采樣到聲音克隆，從場(chǎng)景構(gòu)建到最終剪輯，每一步都在不斷拓展著我們對(duì)'自我'的數(shù)字化延伸。當(dāng)你熟練掌握這套全能數(shù)字人工作流，你的數(shù)字分身將在各種平臺(tái)上自由表達(dá)，為你開啟內(nèi)容創(chuàng)作的全新維度。

對(duì)了，你做出的第一個(gè)數(shù)字人視頻是什么場(chǎng)景？評(píng)論區(qū)告訴我吧！我超好奇的～如果遇到問題也歡迎提問，咱們一起研究！

福利來(lái)了！??

如果你也想打造自己的全能數(shù)字人分身，現(xiàn)在就行動(dòng)吧！想試試 必火數(shù)字人 的超值套餐嗎？去官網(wǎng)看看，性價(jià)比感人！??

★
林月半子粉絲福利
?? 訂購(gòu)數(shù)字人專屬鏈接：https://www./login/SKolpV
?? 專屬福利：用我的專屬鏈接 + 折扣碼，即可享受 10% 優(yōu)惠！
?? 折扣碼：541072

★

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：徐徐見之 > 《待分類》

舉報(bào)/認(rèn)領(lǐng)