【原】這個(gè)今天剛上線的神器被大家玩瘋了！

網(wǎng)羅燈下黑 2024-07-26 發(fā)布于河南

展開全文

自從 Sora 畫了個(gè)大餅之后，似乎就再?zèng)]聽到什么新動(dòng)靜，就像那個(gè)在朋友圈曬了張健身卡照片后，就再也沒見他去過健身房的哥們。

可別人都沒閑著，繼快手可靈前陣子發(fā)布之后，就在今天，智譜 AI 突然來了個(gè)大招——發(fā)布了文生視頻大模型 CogVideoX ，以及基于這一模型推出了 AI 視頻應(yīng)用清影，這消息就像突然在朋友圈冒出的健身成果照，讓人眼前一亮。

Sora 的套路，就像是那個(gè)只會(huì)說“下次請你吃飯”但從沒兌現(xiàn)的朋友，而智譜這次可是來真的，上線就是全量開放，所有用戶都能用，同時(shí)支持網(wǎng)頁版和手機(jī)端，只要你把智譜清言更新到最新版本，人人開箱即可使用。

你所需要做的，就只是提供一個(gè)畫面描述，最快 30 秒，就能得到一個(gè) 6 秒的視頻，這操作，簡直就是請全城的人吃飯，你說誰受得了？

立馬翻身下床來玩一波，看看到底是個(gè)什么水平。

玩法主要分兩種，一種是就是圖生視頻，在圖片基礎(chǔ)上生成連貫的畫面。

還有一種文生視頻，這個(gè)玩法就是純念咒語，玩過 AI 繪圖的都知道。

圖生視頻

先說圖生視頻吧，這個(gè)功能最開始網(wǎng)友們就用來修復(fù)老照片，用 AI 技術(shù)把靜止的瞬間變得生動(dòng)起來。

這個(gè)功能估計(jì)很多人都會(huì)感興趣，畢竟這類視頻在短視頻平臺上出了太多爆款，本來只是親人的一張靜止的老照片，可照片上的人突然沖你微微一笑，這回憶更加動(dòng)感真切。

對了，這個(gè)讓老照片動(dòng)起來的功能還有微信小程序版，只要你有手機(jī)，就能 0 門檻體驗(yàn)這個(gè)玩法。

在微信里面搜索小程序：智譜清言，或者直接點(diǎn)右邊的鏈接智譜清言上傳老照片就能直接生成視頻。

來看看這些效果吧：

提示詞：圖中男子站起來，風(fēng)吹起他的頭發(fā)

原本靜止的人，突然就緩緩站了起來，頭發(fā)被吹起來的細(xì)節(jié)也很精致。

提示詞：圖中的老奶奶戴起了耳機(jī)

奶奶戴耳機(jī)后還添加了搖頭晃腦的動(dòng)作，莫名有一種喜感。

提示詞：老人掏出一個(gè)蘋果手機(jī)拍照。

這個(gè)手看著有一點(diǎn)瑕疵，不過大家注意人物的眼球，本來是看著畫面正前方，手機(jī)掏出來后，明顯把目光轉(zhuǎn)向了手機(jī)攝像頭，這細(xì)節(jié)就很合理。

提示詞：男人轉(zhuǎn)身離開

這個(gè)轉(zhuǎn)身還應(yīng)該配上一句：男人轉(zhuǎn)身，消失在黑暗之中，是不是有點(diǎn)諜戰(zhàn)大片的意思了。

除了老照片，還有更多腦洞大開的玩法，最近很火的容嬤嬤喂紫薇吃東西、爾康戴墨鏡就是這么玩的。

提示詞：唐僧戴墨鏡

提示詞：爾康喝咖啡

提示詞：兩個(gè)女人跨屏擁抱

提示詞：女人戴墨鏡

玩了一番下來，我給大家總結(jié)了 2 個(gè)技巧。

1.選用盡可能清晰的圖片，如果原圖不夠清晰，會(huì)影響模型對圖片中角色的識別。

2.提示詞要簡單清晰，比如按照模板來寫：「主體」+「主題運(yùn)動(dòng)」+「背景」+「背景運(yùn)動(dòng)」。

這個(gè)主體就是你想動(dòng)起來的人物，如果沒有主體，就會(huì)出現(xiàn)崩壞的景象。

如果你不明確大模型如何理解你的圖片，你可以將照片發(fā)送到清言對話框進(jìn)行識圖，明確你的【主體】該如何描述。

如果實(shí)在不知道在提示詞上怎么發(fā)揮，沒關(guān)系，智譜還有專門幫寫圖生視頻提示詞的智能體，把你的圖像主體甩給它，就能幫你寫出一個(gè)詳細(xì)的提示詞。

文生視頻

相比于圖生視頻來說，文生視頻的提示詞更加重要，玩過 AI 繪圖的都知道，這就是純念咒語，你只需要提供一些創(chuàng)意性的提示詞，清影就能根據(jù)這些詞生成視頻。

提示詞：末日來臨，穿著宇航服的航天員緩緩朝著飛船走去，眼神中透露著對地球的不舍，注意細(xì)節(jié)刻畫，廢土風(fēng)

提示詞：低角度向上推進(jìn)，緩緩抬頭，冰山上突然出現(xiàn)一條惡龍，然后惡龍發(fā)現(xiàn)你，沖向你。好萊塢電影風(fēng)

提示詞：蘑菇變成小熊

提示詞：兩只小熊貓坐在竹林里吃蘋果，超近景，紀(jì)實(shí)風(fēng)格

提示詞：兩只猴子在電腦前打工

提示詞：由移動(dòng)的七彩魚。

發(fā)現(xiàn)了嗎，文生視頻咒語要比圖生視頻多了很多描述，這個(gè)不難理解，簡單的提示詞雖然也能生成視頻，但未必是你想要的效果。

比如你可以用這樣的提示詞：小男孩喝咖啡。

如果你對這個(gè)畫面的效果不滿意，那么就需要進(jìn)階版的提示詞來約束 AI 往哪方面去使勁。

比如，來看看白金段位的高級提示詞：[鏡頭語言]+[光影]+[主體(主體描述)]+[主體運(yùn)動(dòng)]+[場景(場景描述)] +[情緒/氛圍風(fēng)格]

還是小男孩喝咖啡這個(gè)例子，但是提示詞就要詳細(xì)多了：

攝影機(jī)平移(鏡頭移動(dòng))，一個(gè)小男孩坐在公園的長椅上(主體描述)，手里拿著一杯熱氣騰騰的咖啡(主體動(dòng)作)。他穿著一件藍(lán)色的襯衫，看起來很愉快(主體細(xì)節(jié)描述)，背景是綠樹成蔭的公園，陽光透過樹葉灑在男孩身上(所處環(huán)境描述)。

最后的視頻場景也更加真實(shí)，細(xì)節(jié)也更加豐富，不管是冒著熱氣的咖啡和還是斑駁的陽光，和實(shí)拍也沒什么差別。

最重要的是，這樣生成的視頻是最符合你要求的，也就是說，想要生成高質(zhì)量的視頻，你得需要一個(gè)足夠詳細(xì)的分鏡腳本。

說到這里，你可能會(huì)覺得門檻太高，大可不必，說好的“人人都能用”，那就必須安排。

這次智譜還配套發(fā)布了清影智能體，你只需要一句話，就會(huì)給你一段細(xì)節(jié)豐富到極致的視覺大片腳本。

比如我就直接只輸入鋼鐵俠和天空兩個(gè)詞。

就能給你生成3個(gè)不同風(fēng)格的提示詞。

所以說，有了這個(gè)智能體的加持，高級提示詞也沒有什么門檻，有手你就會(huì)。

玩了半天，總的感受是，清影在風(fēng)景、動(dòng)物、科幻、人文歷史等類型的視頻內(nèi)容上生成的表現(xiàn)較好；

擅長生成的視頻風(fēng)格包括皮克斯風(fēng)格、卡通風(fēng)格、攝影風(fēng)格、動(dòng)漫風(fēng)格等；

鏡頭畫面實(shí)現(xiàn)效果最好的是近景，也就是特寫鏡頭。

實(shí)體類型呈現(xiàn)效果上看，動(dòng)物 > 植物 > 物品 > 建筑 > 人物。

當(dāng)然，現(xiàn)階段 AI 生成視頻都是需要多次抽卡的，如果生成的視頻不夠理想，那就從上面的這些小建議里去修改提示詞，多次調(diào)教后就會(huì)得到你滿意的效果。