【原】我已經(jīng)無法形容Qwen3的強(qiáng)大了

王智遠(yuǎn)同學(xué) 2025-04-29 發(fā)布于北京

展開全文

文：王智遠(yuǎn) | ID:Z201440

阿里云Qwen3系列模型，早在圈子里傳得沸沸揚揚。

昨天晚上，身邊好幾個朋友在等發(fā)布，我邊追劇邊等，結(jié)果實在困得不行，凌晨1點就睡了。

今天早上起得比較早，看到了官宣內(nèi)容，內(nèi)部同學(xué)說，模型是在昨天凌晨4點上線的，官方正式消息是，今天早上6點多發(fā)出。

這幫人太肝了，憋到五一前也要弄出來，熬夜不睡覺。

官方說：這次Qwen3在自然語言處理、多模態(tài)能力上都有了非常大的提升，是阿里云在人工智能領(lǐng)域的一次全新升級。

它的火爆程度幾乎不用多說，發(fā)布兩個小時，GitHub上的Star數(shù)就已經(jīng)超過了16.9k；整個系列包括2個MoE模型和6個稠密模型，可以說是陣容強(qiáng)大。

什么是MoE模型？什么稠密模型呢？

你可以把 MoE 模型想象成多個“專家”組成的智囊團(tuán)，每個專家都負(fù)責(zé)自己的一攤事，當(dāng)你有一個復(fù)雜的問題需要解決時，它會判斷哪個專家最擅長處理這個問題，然后只調(diào)用那個專家來幫你解決。

稠密模型，就簡單了，一個全能型選手，不管什么任務(wù)，它都自己搞定；優(yōu)勢是不考慮分工，直接上，對于不太復(fù)雜的問題，表現(xiàn)很不錯。

但問題是，如果太復(fù)雜，或者特別細(xì)，它可能就沒那么專業(yè)了，畢竟不是為專業(yè)領(lǐng)域設(shè)計的。

這次發(fā)布的幾個模型，如果你搞開發(fā)，基本上去模型市場、阿里云官方、huggingface、或魔搭社區(qū)都能體驗到，詳細(xì)參數(shù)這里不贅述，外面一搜就有。

普通用戶，想自己玩一玩，手機(jī)端用通義APP就行了。

我今天早上打開時發(fā)現(xiàn)，APP 里已經(jīng)上線了三個模型：一個是 A22B，一個叫 32B，還有一個是高性能深度思考版的 32B。

這里的B指「Billion」，也就是“十億”，表示模型參數(shù)。

比如：

32B 就是 320 億參數(shù)，A22B 可以理解為 220 億左右的參數(shù)規(guī)模。所以你看，當(dāng)一個模型后面跟著多少 B 的時候，其實是在告訴我們它有多“大”。參數(shù)越多，一般意味著模型的能力越強(qiáng)。

寫到這，問題來了：日常用到底該選哪個呢？

Qwen3-235B-A22B，這個模型太大了，適合開發(fā)者和企業(yè)用，我覺得把它裝在手機(jī)上玩，完全屈才了。

Qwen3-32B 更適合日常使用，可以把它當(dāng)成一個助手，處理文檔、聊天、寫個簡單的報告都沒問題，屬于中等規(guī)模模型。

QwQ-32B 則是一個“思考型”模型，適合一團(tuán)亂麻、不想自己動腦的問題。比如：讓你做個 PPT，你可以讓它先幫你列個框架，再慢慢完善。

所以，我覺得，Qwen3-32B和QwQ-32B就夠了。

我用 iPhone 14 Pro Max，在手機(jī)上試了一下這兩個模型，運行速度真的很快，完全不卡頓，而且手機(jī)也不發(fā)熱，文字生成速度明顯比我講話還快。

不過說實話，我在手機(jī)上用 AI 模型的情況還是挺少的，因為大多數(shù)時間我都在 PC 端工作。

那說到PC端，網(wǎng)頁地址是：https://chat.

圖解：QWEN模型官方對話頁面

我數(shù)了下，這里面有10多個模型。

這些模型是阿里云旗下比較常用、也比較大的模型。每個模型后面延伸出來的一些小模型，基本在 GitHub 上被很多開發(fā)者用。

所以，要和這些模型直接對話，在PC端豈不是一件很爽的事情？

以前我經(jīng)常用 Qwen 2.5 Max 模型，它在內(nèi)容處理上特別靈敏，能準(zhǔn)確理解我的意思；這次更新后，我先試了一下它的 A22B 版本，讓它處理文本感覺沒什么意思，于是就讓它生成一張圖片。

我讓 Kimi 幫我寫了一個有意境的提示詞，然后，把提示詞復(fù)制給 A22B，結(jié)果它反應(yīng)很快，大概三秒鐘就生成了一張圖片，大小是 1.5 兆。你覺得怎么樣？

圖解：QWEN3-235B-A22B直接生成

這個模型支持連續(xù)對話，不過連續(xù)對話能力好像有點問題：它只能生成新的圖片，而不會在原來的圖片基礎(chǔ)上進(jìn)行優(yōu)化。

這可能因為它的模型本身沒有針對聊天框進(jìn)行上下文進(jìn)行連續(xù)推理的優(yōu)化。不過，不重要。

我又把前天拍的視頻，關(guān)于夸克AI超級搜索框的那個上傳給了它，大概210MB，2分鐘；然后用了30B-A3B這個模型來處理。

我就跟它說：你幫我把視頻里的文字提取出來，再優(yōu)化一下，我要發(fā)小紅書。

其實這個算有點復(fù)雜或者說連續(xù)步驟的任務(wù)吧，不能只做一步，得一步步來。結(jié)果，它直接就給我把文字提出來了，還順手給我起了個標(biāo)題，一看就很適合發(fā)小紅書。

整個過程挺順，效率也很高。

不是吹噓，我已經(jīng)無法用語言、案例形容它的快速和高效了。感覺它的處理能力，已經(jīng)遠(yuǎn)遠(yuǎn)超越了我日常大腦的運作能力。

我的局限就在于，已經(jīng)不知道該如何去使用它了?；蛘哒f，面對這樣一個龐大的工具，我在想：

我的思考上限在哪里？還有哪些復(fù)雜的任務(wù)，它能夠幫我解決？在日常生活中，我還有什么是可以交給他去完成的？

我開始擔(dān)心，自己會不會逐漸依賴它，甚至被它引導(dǎo)？

亞里士多德（Aristotle）說：人的本性在于求知。以前思考很重要，現(xiàn)在思考似乎變得不那么「必要」了。既然這樣，什么才是最重要的呢？

或許，我們該重新審視“如何與AI共處”這一議題了。

————

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：王智遠(yuǎn)同學(xué) > 《待分類》

舉報/認(rèn)領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

王智遠(yuǎn)同學(xué)

關(guān)注對話

TA的最新館藏

饑渴的大廠，面對大模型還需新招
我已經(jīng)無法形容Qwen3的強(qiáng)大了
如何看待百度Create AI 這輪傳播？
夸克用AI相機(jī)改變「拍照問」習(xí)慣
作秀式公關(guān)值得借鑒嗎？
不讀書，去哪里尋找書里的東西？

喜歡該文的人也喜歡更多

熱門閱讀換一換

日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

【原】我已經(jīng)無法形容Qwen3的強(qiáng)大了