自從 Sora 畫了個(gè)大餅之后,似乎就再?zèng)]聽到什么新動(dòng)靜,就像那個(gè)在朋友圈曬了張健身卡照片后,就再也沒見他去過健身房的哥們。 可別人都沒閑著,繼快手可靈前陣子發(fā)布之后,就在今天,智譜 AI 突然來了個(gè)大招——發(fā)布了文生視頻大模型 CogVideoX ,以及基于這一模型推出了 AI 視頻應(yīng)用清影,這消息就像突然在朋友圈冒出的健身成果照,讓人眼前一亮。 Sora 的套路,就像是那個(gè)只會(huì)說“下次請你吃飯”但從沒兌現(xiàn)的朋友,而智譜這次可是來真的,上線就是全量開放,所有用戶都能用,同時(shí)支持網(wǎng)頁版和手機(jī)端,只要你把智譜清言更新到最新版本,人人開箱即可使用。 你所需要做的,就只是提供一個(gè)畫面描述,最快 30 秒,就能得到一個(gè) 6 秒的視頻,這操作,簡直就是請全城的人吃飯,你說誰受得了? 立馬翻身下床來玩一波,看看到底是個(gè)什么水平。 玩法主要分兩種,一種是就是圖生視頻,在圖片基礎(chǔ)上生成連貫的畫面。 還有一種文生視頻,這個(gè)玩法就是純念咒語,玩過 AI 繪圖的都知道。 圖生視頻 先說圖生視頻吧,這個(gè)功能最開始網(wǎng)友們就用來修復(fù)老照片,用 AI 技術(shù)把靜止的瞬間變得生動(dòng)起來。 這個(gè)功能估計(jì)很多人都會(huì)感興趣,畢竟這類視頻在短視頻平臺上出了太多爆款,本來只是親人的一張靜止的老照片,可照片上的人突然沖你微微一笑,這回憶更加動(dòng)感真切。 對了,這個(gè)讓老照片動(dòng)起來的功能還有微信小程序版,只要你有手機(jī),就能 0 門檻體驗(yàn)這個(gè)玩法。 在微信里面搜索小程序:智譜清言,或者直接點(diǎn)右邊的鏈接智譜清言上傳老照片就能直接生成視頻。 來看看這些效果吧: 提示詞:圖中男子站起來,風(fēng)吹起他的頭發(fā) 原本靜止的人,突然就緩緩站了起來,頭發(fā)被吹起來的細(xì)節(jié)也很精致。 提示詞:圖中的老奶奶戴起了耳機(jī) 奶奶戴耳機(jī)后還添加了搖頭晃腦的動(dòng)作,莫名有一種喜感。 提示詞:老人掏出一個(gè)蘋果手機(jī)拍照。 這個(gè)手看著有一點(diǎn)瑕疵,不過大家注意人物的眼球,本來是看著畫面正前方,手機(jī)掏出來后,明顯把目光轉(zhuǎn)向了手機(jī)攝像頭,這細(xì)節(jié)就很合理。 提示詞:男人轉(zhuǎn)身離開 這個(gè)轉(zhuǎn)身還應(yīng)該配上一句:男人轉(zhuǎn)身,消失在黑暗之中,是不是有點(diǎn)諜戰(zhàn)大片的意思了。 除了老照片,還有更多腦洞大開的玩法,最近很火的容嬤嬤喂紫薇吃東西、爾康戴墨鏡就是這么玩的。 提示詞:唐僧戴墨鏡 提示詞:爾康喝咖啡 提示詞:兩個(gè)女人跨屏擁抱 提示詞:女人戴墨鏡 玩了一番下來,我給大家總結(jié)了 2 個(gè)技巧。 1.選用盡可能清晰的圖片,如果原圖不夠清晰,會(huì)影響模型對圖片中角色的識別。 2.提示詞要簡單清晰,比如按照模板來寫:「主體」+「主題運(yùn)動(dòng)」+「背景」+「背景運(yùn)動(dòng)」。 這個(gè)主體就是你想動(dòng)起來的人物,如果沒有主體, 就會(huì)出現(xiàn)崩壞的景象。 如果你不明確大模型如何理解你的圖片,你可以將照片發(fā)送到清言對話框進(jìn)行識圖,明確你的【主體】該如何描述。 如果實(shí)在不知道在提示詞上怎么發(fā)揮,沒關(guān)系,智譜還有專門幫寫圖生視頻提示詞的智能體,把你的圖像主體甩給它,就能幫你寫出一個(gè)詳細(xì)的提示詞。 文生視頻 相比于圖生視頻來說,文生視頻的提示詞更加重要,玩過 AI 繪圖的都知道,這就是純念咒語,你只需要提供一些創(chuàng)意性的提示詞,清影就能根據(jù)這些詞生成視頻。 提示詞:末日來臨,穿著宇航服的航天員緩緩朝著飛船走去,眼神中透露著對地球的不舍,注意細(xì)節(jié)刻畫,廢土風(fēng) 提示詞:低角度向上推進(jìn),緩緩抬頭,冰山上突然出現(xiàn)一條惡龍,然后惡龍發(fā)現(xiàn)你,沖向你。好萊塢電影風(fēng) 提示詞:蘑菇變成小熊 提示詞:兩只小熊貓坐在竹林里吃蘋果,超近景,紀(jì)實(shí)風(fēng)格 提示詞:兩只猴子在電腦前打工 提示詞:由移動(dòng)的七彩魚。 發(fā)現(xiàn)了嗎,文生視頻咒語要比圖生視頻多了很多描述,這個(gè)不難理解,簡單的提示詞雖然也能生成視頻,但未必是你想要的效果。 比如你可以用這樣的提示詞:小男孩喝咖啡。 如果你對這個(gè)畫面的效果不滿意,那么就需要進(jìn)階版的提示詞來約束 AI 往哪方面去使勁。 比如,來看看白金段位的高級提示詞:[鏡頭語言]+[光影]+[主體(主體描述)]+[主體運(yùn)動(dòng)]+[場景(場景描述)] +[情緒/氛圍風(fēng)格] 還是小男孩喝咖啡這個(gè)例子,但是提示詞就要詳細(xì)多了: 攝影機(jī)平移(鏡頭移動(dòng)),一個(gè)小男孩坐在公園的長椅上(主體描述),手里拿著一杯熱氣騰騰的咖啡(主體動(dòng)作)。他穿著一件藍(lán)色的襯衫,看起來很愉快(主體細(xì)節(jié)描述),背景是綠樹成蔭的公園,陽光透過樹葉灑在男孩身上(所處環(huán)境描述)。 最后的視頻場景也更加真實(shí),細(xì)節(jié)也更加豐富,不管是冒著熱氣的咖啡和還是斑駁的陽光,和實(shí)拍也沒什么差別。 最重要的是,這樣生成的視頻是最符合你要求的,也就是說,想要生成高質(zhì)量的視頻,你得需要一個(gè)足夠詳細(xì)的分鏡腳本。 說到這里,你可能會(huì)覺得門檻太高,大可不必,說好的“人人都能用”,那就必須安排。 這次智譜還配套發(fā)布了清影智能體,你只需要一句話,就會(huì)給你一段細(xì)節(jié)豐富到極致的視覺大片腳本。 比如我就直接只輸入鋼鐵俠和天空兩個(gè)詞。 就能給你生成3個(gè)不同風(fēng)格的提示詞。 所以說,有了這個(gè)智能體的加持,高級提示詞也沒有什么門檻,有手你就會(huì)。 玩了半天,總的感受是,清影在風(fēng)景、動(dòng)物、科幻、人文歷史等類型的視頻內(nèi)容上生成的表現(xiàn)較好; 擅長生成的視頻風(fēng)格包括皮克斯風(fēng)格、卡通風(fēng)格、攝影風(fēng)格、動(dòng)漫風(fēng)格等; 鏡頭畫面實(shí)現(xiàn)效果最好的是近景,也就是特寫鏡頭。 實(shí)體類型呈現(xiàn)效果上看,動(dòng)物 > 植物 > 物品 > 建筑 > 人物。 當(dāng)然,現(xiàn)階段 AI 生成視頻都是需要多次抽卡的,如果生成的視頻不夠理想,那就從上面的這些小建議里去修改提示詞,多次調(diào)教后就會(huì)得到你滿意的效果。 畢竟這是發(fā)布的第一版產(chǎn)品,按照目前的進(jìn)度,相信后續(xù)優(yōu)化已經(jīng)在路上了。 對了,都知道,沒有 BGM 的視頻是沒有靈魂的,單純的視頻無疑會(huì)少了很多氛圍感,清影生成視頻后還配有曲庫,你可以直接從中挑選適合的配樂和視頻一起導(dǎo)出,這個(gè)功能對于短視頻創(chuàng)作者相當(dāng)友好。 結(jié)語 隨著「清影」的上線,視頻生成賽道又加入了智譜 AI 這位重磅玩家。 總體用下來,給我的感覺是,國產(chǎn) AI 的追趕在加速,不管是在文字生成、圖像生成還是視頻生成上,這個(gè)差距是肉眼可見在縮小。 當(dāng)然,這個(gè)清影也會(huì)存在視頻生成模型中普遍的瑕疵,但是比起其他還在畫餅的大模型來說,上線就能用,而且免費(fèi)不限量,就沖這種誠意,不點(diǎn)贊說不過去。 在我測試的這段時(shí)間內(nèi),明顯感覺到服務(wù)器壓力在增大,從一開始的等待1分鐘左右,到下午的4分鐘左右,說明涌來的用戶越來越多,所以趁內(nèi)測免費(fèi)階段,大家多上手玩玩吧。 PC 端訪問鏈接:https:/// 移動(dòng)端訪問鏈接: https:///download?fr=web_home |
|