阿里云Qwen3系列模型,早在圈子里傳得沸沸揚揚。 昨天晚上,身邊好幾個朋友在等發(fā)布,我邊追劇邊等,結(jié)果實在困得不行,凌晨1點就睡了。 今天早上起得比較早,看到了官宣內(nèi)容,內(nèi)部同學(xué)說,模型是在昨天凌晨4點上線的,官方正式消息是,今天早上6點多發(fā)出。 這幫人太肝了,憋到五一前也要弄出來,熬夜不睡覺。 官方說:這次Qwen3在自然語言處理、多模態(tài)能力上都有了非常大的提升,是阿里云在人工智能領(lǐng)域的一次全新升級。 它的火爆程度幾乎不用多說,發(fā)布兩個小時,GitHub上的Star數(shù)就已經(jīng)超過了16.9k;整個系列包括2個MoE模型和6個稠密模型,可以說是陣容強(qiáng)大。 什么是MoE模型?什么稠密模型呢? 你可以把 MoE 模型想象成多個“專家”組成的智囊團(tuán),每個專家都負(fù)責(zé)自己的一攤事,當(dāng)你有一個復(fù)雜的問題需要解決時,它會判斷哪個專家最擅長處理這個問題,然后只調(diào)用那個專家來幫你解決。 稠密模型,就簡單了,一個全能型選手,不管什么任務(wù),它都自己搞定;優(yōu)勢是不考慮分工,直接上,對于不太復(fù)雜的問題,表現(xiàn)很不錯。 但問題是,如果太復(fù)雜,或者特別細(xì),它可能就沒那么專業(yè)了,畢竟不是為專業(yè)領(lǐng)域設(shè)計的。 這次發(fā)布的幾個模型,如果你搞開發(fā),基本上去模型市場、阿里云官方、huggingface、或魔搭社區(qū)都能體驗到,詳細(xì)參數(shù)這里不贅述,外面一搜就有。 普通用戶,想自己玩一玩,手機(jī)端用通義APP就行了。 我今天早上打開時發(fā)現(xiàn),APP 里已經(jīng)上線了三個模型:一個是 A22B,一個叫 32B,還有一個是高性能深度思考版的 32B。 這里的B指「Billion」,也就是“十億”,表示模型參數(shù)。 比如: 32B 就是 320 億參數(shù),A22B 可以理解為 220 億左右的參數(shù)規(guī)模。所以你看,當(dāng)一個模型后面跟著多少 B 的時候,其實是在告訴我們它有多“大”。參數(shù)越多,一般意味著模型的能力越強(qiáng)。 寫到這,問題來了:日常用到底該選哪個呢? Qwen3-235B-A22B,這個模型太大了,適合開發(fā)者和企業(yè)用,我覺得把它裝在手機(jī)上玩,完全屈才了。 Qwen3-32B 更適合日常使用,可以把它當(dāng)成一個助手,處理文檔、聊天、寫個簡單的報告都沒問題,屬于中等規(guī)模模型。 QwQ-32B 則是一個“思考型”模型,適合一團(tuán)亂麻、不想自己動腦的問題。比如:讓你做個 PPT,你可以讓它先幫你列個框架,再慢慢完善。 所以,我覺得,Qwen3-32B和QwQ-32B就夠了。 我用 iPhone 14 Pro Max,在手機(jī)上試了一下這兩個模型,運行速度真的很快,完全不卡頓,而且手機(jī)也不發(fā)熱,文字生成速度明顯比我講話還快。 不過說實話,我在手機(jī)上用 AI 模型的情況還是挺少的,因為大多數(shù)時間我都在 PC 端工作。 那說到PC端,網(wǎng)頁地址是:https://chat. ![]() 我數(shù)了下,這里面有10多個模型。 這些模型是阿里云旗下比較常用、也比較大的模型。每個模型后面延伸出來的一些小模型,基本在 GitHub 上被很多開發(fā)者用。 所以,要和這些模型直接對話,在PC端豈不是一件很爽的事情? 以前我經(jīng)常用 Qwen 2.5 Max 模型,它在內(nèi)容處理上特別靈敏,能準(zhǔn)確理解我的意思;這次更新后,我先試了一下它的 A22B 版本,讓它處理文本感覺沒什么意思,于是就讓它生成一張圖片。 我讓 Kimi 幫我寫了一個有意境的提示詞,然后,把提示詞復(fù)制給 A22B,結(jié)果它反應(yīng)很快,大概三秒鐘就生成了一張圖片,大小是 1.5 兆。你覺得怎么樣? ![]() 圖解:QWEN3-235B-A22B直接生成 這個模型支持連續(xù)對話,不過連續(xù)對話能力好像有點問題:它只能生成新的圖片,而不會在原來的圖片基礎(chǔ)上進(jìn)行優(yōu)化。 這可能因為它的模型本身沒有針對聊天框進(jìn)行上下文進(jìn)行連續(xù)推理的優(yōu)化。不過,不重要。 我又把前天拍的視頻,關(guān)于夸克AI超級搜索框的那個上傳給了它,大概210MB,2分鐘;然后用了30B-A3B這個模型來處理。 我就跟它說:你幫我把視頻里的文字提取出來,再優(yōu)化一下,我要發(fā)小紅書。 其實這個算有點復(fù)雜或者說連續(xù)步驟的任務(wù)吧,不能只做一步,得一步步來。結(jié)果,它直接就給我把文字提出來了,還順手給我起了個標(biāo)題,一看就很適合發(fā)小紅書。 整個過程挺順,效率也很高。 不是吹噓,我已經(jīng)無法用語言、案例形容它的快速和高效了。感覺它的處理能力,已經(jīng)遠(yuǎn)遠(yuǎn)超越了我日常大腦的運作能力。 我的局限就在于,已經(jīng)不知道該如何去使用它了?;蛘哒f,面對這樣一個龐大的工具,我在想: 我的思考上限在哪里?還有哪些復(fù)雜的任務(wù),它能夠幫我解決?在日常生活中,我還有什么是可以交給他去完成的? 我開始擔(dān)心,自己會不會逐漸依賴它,甚至被它引導(dǎo)? 亞里士多德(Aristotle)說:人的本性在于求知。以前思考很重要,現(xiàn)在思考似乎變得不那么「必要」了。既然這樣,什么才是最重要的呢? 或許,我們該重新審視“如何與AI共處”這一議題了。 |
|