1. Sora的視頻效果是真不錯,一分鐘長度夠,畫質(zhì)和投資很多的科幻大片一樣。之前是用生成圖片的辦法去湊成4秒的視頻,視角單一。這次生成的視頻是有“世界模型”的,所以有看電影的感覺。 2. 這波AIGC(人工智能內(nèi)容生成)的熱潮,先是圖片生成,stable diffusion這些技術(shù),midjourney還賺了不少錢。2022年初GPT-3出來了,已經(jīng)有重大技術(shù)突破了,LLM(大語言模型)讓人覺得挺有意思了,展現(xiàn)了不一般的邏輯能力。但I(xiàn)T界以外的還不太關(guān)注,知道的人也沒看出來LLM能這么火。 3. 直到2022年底ChatGPT能說“人話”了,才引爆了關(guān)注。說實(shí)在的IT界的人反而有些意外,原來讓機(jī)器說人話影響這么大。技術(shù)底子還是GPT-3,加上了一個RLHF(人類反饋強(qiáng)化學(xué)習(xí))讓機(jī)器說的話符合人類習(xí)慣。然后是GPT-4,AI的邏輯能力又大幅提升了。加上全球?qū)Υ竽P偷目駸?,人工智能業(yè)界產(chǎn)生了一個瘋狂的想法:AGI(通用人工智能)這次就能做出來!各家大公司都瘋了,3000美元成本的英偉達(dá)H100,3萬美元也買,還一下就幾十萬個。 4. 接下來就是“多模態(tài)”,大語言模型結(jié)合多媒體內(nèi)容,直接就是圖片與視頻生成。到Sora,等于是把diffusion和LLM成功結(jié)合了,做出來了符合人類階段目標(biāo)的文生視頻。在AIGC這個賽道上,技術(shù)想象力就這樣了。接下來無非是視頻越做越長,場景越來越復(fù)雜,低成本生成小電影,不會再有新的驚艷了。 5. 在文本內(nèi)容生成方面,其實(shí)也就這樣了。GPT-4的后續(xù)GPT-5,應(yīng)該不會有本質(zhì)突破。參數(shù)多到萬億級別,能力也還是這樣。GPT的固有缺陷“幻覺”,還是會有,對于世界并沒有符合人類預(yù)期的深層邏輯理解。現(xiàn)在怕文本生成的幻覺,不敢放心大膽用。視頻生成需要邏輯能力,所以不太可能一個視頻生成能直接就成了電影,還是需要人類來主導(dǎo)。 6. 下一個驚艷突破,就是AGI。如果機(jī)器真有了人類研發(fā)者認(rèn)可的邏輯能力,文本生成質(zhì)量會突飛猛進(jìn),會有創(chuàng)意,能搞研發(fā)。但是,基于目前的神經(jīng)網(wǎng)絡(luò)Transformer架構(gòu),應(yīng)該是做不出AGI?,F(xiàn)在還是用機(jī)器算法模擬智能,模擬得挺象,但不是智能。 7. 模擬出來的智能,和真正的智能,還是有很大區(qū)別的。前者是工具,在人類歷史上并不罕見,AIGC并不算是特別突出的工具,經(jīng)濟(jì)影響力可以評估。AGI如果出來了,就是人類創(chuàng)造的最偉大產(chǎn)品,意義大到?jīng)]法評估。有的人認(rèn)為,人類的意義,就是機(jī)器智能的“引導(dǎo)程序”,把高階智能引導(dǎo)出來了,就沒人類啥事了。 免責(zé)聲明 以上內(nèi)容為用戶在觀察者網(wǎng)風(fēng)聞社區(qū)上傳并發(fā)布,僅代表發(fā)帖用戶觀點(diǎn)。發(fā)表于廣東省
|
|