作為一款上過2024年央視春晚的國民級內(nèi)容社交平臺,小紅書在AI上的動作一直不大。與之有關(guān)的最新消息是,今年4月,小紅書內(nèi)測了自研大模型“小地瓜”。 小紅書AI走到哪兒了?我對這個問題很好奇。要知道,小紅書擁有著國內(nèi)僅次于微信的高質(zhì)量內(nèi)容生態(tài)。公眾號內(nèi)容對元寶的加持顯而易見,小紅書又是否會給姍姍來遲的達芬奇帶來一些不同的體驗?zāi)兀?/p> / 01 / 生活經(jīng)驗更具體,匹配度有待加強 “文藝復(fù)興時期最完美的代表”達·芬奇思想深邃、學(xué)識淵博,對什么都有興趣,他精通繪畫、建筑、發(fā)明、人體解剖等領(lǐng)域,小紅書的這位達芬奇同樣思維活躍、涉獵廣泛,它依靠小紅書的強大語料和知識庫來回答。 種種跡象表明,官方對待達芬奇非常謹(jǐn)慎。達芬奇(Davinci)早在去年7月就已經(jīng)有了,當(dāng)時只有少部分人被內(nèi)測到了。在今(21)日之前,達芬奇都隱藏得很深,需要在名為“達芬奇”的用戶中尋找,現(xiàn)在你可以在檢索的置頂推薦里找到了。 ▲達芬奇入口前后區(qū)別 從功能上來看,達芬奇與“對家”知乎-知海圖等AI并沒有什么區(qū)別,依然是對話界面+各種智能體,并推送相關(guān)筆記提供延展閱讀,在安卓or蘋果上的使用效果基本沒差。 簡單測試了下,有一定實用價值,特別是攻略類的回答,獨一份的事無巨細(xì)。就“北京一日游”這樣的旅游攻略類問題,達芬奇的回答是不是還挺地道的?對比其他AI助手,具體又貼地氣。 ▲提問“暑假去北京旅游,幫我安排一天行程,一定要地道”,達芬奇/元寶/豆包作答 小紅書的筆記從購物/旅游/美食/學(xué)習(xí)/考試/求職攻略等,到使用體驗、硬核干貨、軟件教程、讀書筆記、職場心得,甚至到求醫(yī)問藥,應(yīng)有盡有,所以達芬奇對于攻略類的問題算是手到擒來。 不過,引導(dǎo)問題做得不太仔細(xì),“推薦約會餐廳”是推薦全國范圍的,“Citywalk路線”默認(rèn)回答上海的位置。達芬奇也還不能識別提問者的IP地址,以此作為回答前提。 但如果是面對“茶百道的哪一款奶茶最好”這樣的產(chǎn)品細(xì)化問題,在一眾AI助手中,小紅書-達芬奇就沒有明顯優(yōu)勢了,而抖音-豆包的回答看上去最為專業(yè)。 ▲提問“茶百道的哪一款奶茶最好”,達芬奇/豆包/Kimi作答 另外,達芬奇對“最好的***”等問題比較謹(jǐn)慎,引用筆記偏向于“端水”,無一例外是多個產(chǎn)品/店家的合集筆記,沒有單條贊助內(nèi)容,似乎是為了避免明顯地引流。有時回答不會按照指令來,比如推薦靜音鍵盤時,達芬奇跟我嘮起了小紅書上討論度更高的靜音軸體類別。可能是因為達芬奇照搬了下方推薦筆記的文案,而沒有很好地理解提問的語義。 ▲提問“2024最好看的一部電影”、“最好用的一把靜音鍵盤”、“家用3D打印機可以買嗎”等問題 我又突發(fā)奇想,想考驗一下小達如何處理“人情世故”。我問“花西子眉筆貴嗎”,達芬奇的回答出現(xiàn)了明顯錯誤和偏向?;ㄎ髯用脊P的淘寶價格是40~100元/支,但達芬奇回答是6.9元/支,這出入太大了,達芬奇還引用了冷門并答非所問的筆記。重新生成之后,才給出沒有錯誤的答案。 小紅書是花西子近年重點合作營銷的平臺,看來達芬奇對小紅書合作品牌是開了后門的,回答有偏向。達芬奇自述是“內(nèi)容偏向正面”,也有可能是這方面原因。 ▲達芬奇對于“花西子眉筆貴嗎”的回答,引用筆記中的7.5元/支眉筆是花西子山寨品牌,某一篇提到所購眉筆“可能不是正品”;還有一篇沒有提到該眉筆的價格? 當(dāng)然,我不能老是問達芬奇一些它本來就很擅長的領(lǐng)域,當(dāng)我問“歷史上有沒有完美犯罪”時,達芬奇的回答就比較潦草、空泛,沒有舉例。對于“姜萍事件”的問題,達芬奇沒有簡述新聞并明晰觀點。而微信-元寶對于上面兩個問題的回答會系統(tǒng)很多,也有對“完美犯罪”進行多個舉例。 ▲提問“如何評價姜萍事件”,達芬奇和元寶分別作答 最最翻車的是,對于“給我一首**的德國詩歌”這樣小紅書上存在大量優(yōu)質(zhì)筆記的問題,我分別提問了優(yōu)美/悲傷/快樂的風(fēng)格,達芬奇給我的3個回答都是同一首詩?!達芬奇太偷懶了! ▲提問給“我一首優(yōu)美/悲傷/快樂的德國詩歌” 總體來說,小紅書AI的最大優(yōu)勢就在于它的經(jīng)驗是具體的,這在眾多AI助手中是獨一份的,但回答匹配度不太穩(wěn)定。 / 02 / 內(nèi)容沉淀好≠AI助手好,模型能力待提高 AI大模型的競爭打到了互聯(lián)網(wǎng)的各個角落,與別家做AI不同,小紅書做AI一直是“淡淡的”。其實小紅書還是暗暗下功夫,其AI功能除了大模型“小地瓜”,以及這幾天新上線的達芬奇,還有AI寵物、群聊AI智能體、AI生圖,搜搜薯(AI搜索)。 擁有好的內(nèi)容沉淀永遠(yuǎn)是王道,它可以為社區(qū)內(nèi)容平臺的AI帶來強大的語料庫和知識庫。小紅書的模式類似于騰訊元寶和知乎知海圖,充分在整合站內(nèi)UGC(用戶生成內(nèi)容)的基礎(chǔ)上,生成提煉答案。 遺憾的是,小紅書的好內(nèi)容卻沒有能賦能給達芬奇。達芬奇有時回答能力比較差,似乎是只做了RAG(檢索增強生成)且做得不太好,沒有做Agent(智能體)。 很多人沒意識到的是,小紅書也已經(jīng)是一個非常深入的搜索引擎,無論關(guān)鍵詞多爛都能匹配到正確的內(nèi)容,但這依舊沒能在達芬奇身上得到體現(xiàn)。無論你關(guān)鍵詞描述的多精準(zhǔn),達芬奇時常找到不匹配的筆記。達芬奇自述是通過學(xué)習(xí)權(quán)重高的帖子生成回答,實際體驗時,低贊藏筆記也能進入推薦位。 此外,從目前來看,類似違禁詞替代詞、奇怪的縮寫……這樣的垃圾數(shù)據(jù)問題也是達芬奇需要擔(dān)心的。由于回答不準(zhǔn)確,達芬奇的生成結(jié)果還不能直接被復(fù)制形成筆記,甚至進行二創(chuàng)。另外,由于小紅書的內(nèi)容本身夾雜著許多軟廣,達芬奇的數(shù)據(jù)還可能面臨著被稀釋的問題,可能有更多商家為了筆記推薦位而在小紅書上打廣告。 / 03 / 結(jié)語:小紅書做AI,潛力很大 與其他大模型相比,達芬奇在小紅書原生用戶中更具優(yōu)勢。而如何能結(jié)合AI賦能內(nèi)容社區(qū),而不會破壞社區(qū)本身現(xiàn)有的內(nèi)容生態(tài),是擺在小紅書面前的一道難題。 小紅書上的圖片和視頻內(nèi)容,都可以作為很好的數(shù)據(jù)融入AI大模型。 目前,小紅書是以美圖和視頻為主的內(nèi)容平臺,而達芬奇僅能識別筆記文案,對于攜帶大量信息的圖片和視頻內(nèi)容還不能理解,沒有能開發(fā)完全圖片與視頻內(nèi)容產(chǎn)品的潛力,可能是因為地瓜大模型還沒有加入OCR(光學(xué)字符識別)、ACR (自動內(nèi)容識別)技術(shù)。 有了公眾號內(nèi)容的加持,騰訊元寶成了很多用戶的心頭好。小紅書坐擁小紅書大量優(yōu)質(zhì)短筆記內(nèi)容,我們也期待隨著地瓜大模型進一步升級,能帶來體驗更成熟的達芬奇。 |
|