阿里云大模型空前降價(jià)，開(kāi)始超摩爾定律的狂奔

天承辦公室 2024-05-22 發(fā)布于北京

展開(kāi)全文

讓更便宜的大模型，成為全社會(huì)創(chuàng)新加速的基礎(chǔ)設(shè)施。

作者 | ray

編輯 | 靖宇

5 月 21 日，武漢光谷萬(wàn)豪，阿里云「AI 智領(lǐng)者峰會(huì)」。

抵達(dá)現(xiàn)場(chǎng)后，與會(huì)嘉賓發(fā)現(xiàn)一絲不同尋常，一個(gè)已經(jīng)在一個(gè)月時(shí)間里相繼在杭州、北京、西安舉辦過(guò)的系列峰會(huì)，這次阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光親自來(lái)了——阿里云這次，可能要搞個(gè)大的。

果不其然，發(fā)布會(huì)開(kāi)始十多分鐘，劉偉光便聊起了一個(gè)硬件領(lǐng)域老生常談的話題「摩爾定律」。

極客最高級(jí)的致敬是「show me code」；商業(yè)教父最高級(jí)的致敬，是把他的觀點(diǎn)，變成行業(yè)定律，摩爾定律就是其一。

1965 年，這位英特爾聯(lián)合創(chuàng)始人的一句話，「單位面積上，晶體管的密度，每隔 18 個(gè)月就翻一番」，主導(dǎo)了迄今半導(dǎo)體行業(yè) 60 多年的發(fā)展。

然而，伴隨摩爾故去，摩爾定律在微觀晶體管領(lǐng)域，也逐漸褪色。馮諾依曼架構(gòu)的原始限制、量子隧穿成為擺在眼前的攔路虎。

那將觀察角度轉(zhuǎn)為宏觀，或者轉(zhuǎn)為用戶導(dǎo)向呢？這是阿里云思考了很多年的問(wèn)題。

從用戶角度出發(fā)，晶體管密度只是其次，摩爾定律最根本的意義是在于每過(guò) 18 個(gè)月，用戶就能以相同價(jià)格買到翻倍的算力。

但很顯然，實(shí)現(xiàn)越來(lái)越便宜的算力，不止有晶體管密度這一條路。

而公共云與 AI，或許就是阿里云超越摩爾定律的嘗試。

AI 推理成本，

開(kāi)始指數(shù)級(jí)下降

「我覺(jué)得 AI 推理成本只有每年有十倍甚至百倍的降低，才能真正推動(dòng)行業(yè)各行各業(yè)的 AI 應(yīng)用的爆發(fā)?！?/span>

劉偉光話一出口，臺(tái)下的人面面相覷：目前中國(guó) 80% 的科技企業(yè)，一半大模型公司都跑在阿里云之上。每年百倍，也就意味著，阿里云要一步將國(guó)產(chǎn)大模型的使用成本打到地板價(jià)。

緊隨其后，阿里云官宣，旗下 9 款核心商業(yè)化及開(kāi)源系列模型將全數(shù)降價(jià)，且都已經(jīng)可以通過(guò)阿里云百煉官網(wǎng)開(kāi)通使用。其中，阿里云對(duì)標(biāo) GPT-4 級(jí)別的長(zhǎng)文本模型 Qwen-Long，降價(jià)至 GPT-4 價(jià)格的 1/400，全球最低。

Qwen-Long 是通義千問(wèn)的長(zhǎng)文本增強(qiáng)版模型，主要適用最消耗 token 的長(zhǎng)文本場(chǎng)景，上下文長(zhǎng)度最高達(dá) 1 千萬(wàn)，可處理約 1500 萬(wàn)字或 1.5 萬(wàn)頁(yè)的文檔。

此次官宣后，其 API 輸入價(jià)格從 0.02 元/千 tokens 降至 0.0005 元/千 tokens，直降 97%。這意味著，1 塊錢可以買 200 萬(wàn) tokens，相當(dāng)于 5 本《新華字典》的文字量。相比之下，國(guó)內(nèi)外廠商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 輸入價(jià)格分別為 0.22 元、0.025 元、0.022 元及 0.12 元，均遠(yuǎn)高于 Qwen-long。同時(shí)，Qwen-Long 輸出價(jià)格也從 0.02 元/千 tokens 降至 0.002 元/千 tokens，降幅 90%。

不久前發(fā)布的通義千問(wèn)旗艦款大模型，權(quán)威基準(zhǔn) OpenCompass 上性能追平 GPT-4-Turbo 的 Qwen-Max，同樣參與此次降價(jià)，API 輸入價(jià)格降至 0.04 元/千 tokens，降幅達(dá) 67％。

其他開(kāi)源模型上，Qwen1.5-72B、Qwen1.5-110B 等 5 款開(kāi)源模型的輸入價(jià)格也分別直降 75% 以上。

從應(yīng)用范圍最廣，到性能最佳，阿里云拿出的，都是最重磅的產(chǎn)品，決心可見(jiàn)一斑。

阿里云的決心：成為大模型

爆發(fā)的基礎(chǔ)設(shè)施

為什么降價(jià)？

答案就寫在這次活動(dòng)的主題中：「讓天下沒(méi)有難做的 AI 應(yīng)用」，成為大模型時(shí)代的基礎(chǔ)設(shè)施。

據(jù)多位內(nèi)部人士表示，AI 的定位在阿里云已經(jīng)上升到前所未有的戰(zhàn)略高度。在多次內(nèi)部會(huì)上，阿里云高管都將 2024 的 AI 類比 2017 年的短視頻與 2012 年的移動(dòng)支付。2012 年到 2013 年，3G 過(guò)渡到 4G 過(guò)程當(dāng)中，中國(guó)的移動(dòng)支付兩年增長(zhǎng)了 800%；在 2017 到 2018，多家短視頻的爆發(fā)，實(shí)現(xiàn)了整個(gè)中國(guó)短視頻呈現(xiàn) 8.5 倍的增長(zhǎng)。

未來(lái) AI 的爆發(fā)速度，也將遠(yuǎn)遠(yuǎn)超出所有人的想象——現(xiàn)在，中國(guó)所有大模型公司 API 的日調(diào)用量不超過(guò)一個(gè)億，年底這一數(shù)據(jù)量將達(dá) 100 億次，增長(zhǎng)百倍。

為達(dá)成「AI 基礎(chǔ)設(shè)施」這一目標(biāo)，阿里云給自身的定位是做到四有：

一有，有實(shí)力提供全球領(lǐng)先的模型服務(wù)。不久前，OpenAI 的 Sam Altman 轉(zhuǎn)發(fā)了 Chatbot Arena 榜單來(lái)印證 GPT-4o 的能力，其中全球排名前 20 的模型中，三款通義千問(wèn)代表中國(guó)模型實(shí)力躋身世界前列。

Sam Altman 在 X 上轉(zhuǎn)發(fā) GPT-4o 測(cè)試成績(jī)｜X

二有，有能力建設(shè)國(guó)內(nèi)最大的推理集群。全球三十處公共云地域分布、共計(jì) 89 個(gè)可用區(qū)，可做到 4X 推理吞吐提升，8X 計(jì)算資源節(jié)省，以及分鐘級(jí)快速動(dòng)態(tài)擴(kuò)容。

三有，有態(tài)度堅(jiān)持開(kāi)放、持續(xù)開(kāi)源。作為首個(gè)提出 MaaS（模型即服務(wù)）理念的云廠商，目前，瞄著讓模型更好的服務(wù)的目標(biāo)，阿里云百煉模型服務(wù)平臺(tái)已可以調(diào)用眾多三方及垂直領(lǐng)域大模型、魔塔社區(qū)則是中國(guó)最大的模型社區(qū)，擁有 4500+模型總數(shù)以及 500 萬(wàn)+用戶數(shù)；通義持續(xù)開(kāi)源全模態(tài)全尺寸模型家族，共計(jì) 700 萬(wàn)開(kāi)源模型下載量。

四有，有信心，迎接 AI 應(yīng)用的爆發(fā)。財(cái)報(bào)數(shù)據(jù)顯示，同比去年，阿里云的 AI 相關(guān)收入同比三位數(shù)增長(zhǎng)。

而與阿里云的「四有」，形成對(duì)比的，則是行業(yè)內(nèi)的「兩貴」。

一方面是開(kāi)發(fā)以及微調(diào)的人力成本貴。大模型人才稀缺已是業(yè)內(nèi)共識(shí)，某家消費(fèi)電子巨頭曾算了一筆賬，大模型研發(fā)方向，公司平均平均稅后人才成本為 100 萬(wàn)元。而對(duì)普通企業(yè)來(lái)說(shuō)，即便跳過(guò)基模這一步，采用開(kāi)源大模型微調(diào)，成本同樣高企。

另一方面則是硬件成本「硅谷卡貴」。一個(gè)創(chuàng)業(yè)公司，擁抱大模型，起步價(jià)實(shí)買 50 臺(tái) GPU 服務(wù)器，甚至 100 臺(tái)、200 臺(tái)乃至更大尺寸的集群。如果對(duì)標(biāo)全球頂級(jí)水平，訓(xùn)練一個(gè) 100B 規(guī)模的 LLM，以 Falcon 系列模型為例，其資源消耗量 3.5 萬(wàn)億 token，約 4096 個(gè) A100 組成的集群，訓(xùn)練時(shí)長(zhǎng)約 70 天。其中，一張 A100 的價(jià)格，通常在一萬(wàn)美金乃至更多。而構(gòu)建集群，除了 GPU 的采購(gòu)，還有包括軟件部署、網(wǎng)絡(luò)費(fèi)用、電費(fèi)、運(yùn)維成本，以及不斷投入的試錯(cuò)成本，成本遠(yuǎn)非普通企業(yè)可以承受。

那么，對(duì)阿里云來(lái)說(shuō)，接下來(lái)的核心目標(biāo)，就是如何用阿里云的「四有」，解決 AI 爆發(fā)遇到的「兩貴」。

決定 API 價(jià)值的要素：

技術(shù)高度+普惠能力

不難發(fā)現(xiàn)，本次活動(dòng)，阿里云的重點(diǎn)有二，其一是強(qiáng)調(diào) API 價(jià)值，其二是降價(jià)普惠的能力。

API 很好理解，互聯(lián)網(wǎng)發(fā)展沒(méi)必要重復(fù)造輪子，大模型發(fā)展，也不是人人都需要從基模開(kāi)始。通過(guò) API 與公共云相組合，不僅可以降低大模型開(kāi)發(fā)的人力成本，更是通往大模型普惠的必經(jīng)之路。

一方面，云廠商天然的開(kāi)放性，能為開(kāi)發(fā)者提供私有部署所不具備的豐富模型和工具鏈。阿里云百煉平臺(tái)上匯聚通義、百川、ChatGLM、Llama 系列等上百款國(guó)內(nèi)外優(yōu)質(zhì)模型，內(nèi)置大模型定制與應(yīng)用開(kāi)發(fā)工具鏈，開(kāi)發(fā)者可以便捷地測(cè)試比較不同模型，開(kāi)發(fā)專屬大模型，并輕松搭建 RAG 等應(yīng)用。從選模型、調(diào)模型、搭應(yīng)用到對(duì)外服務(wù)，一站式搞定。

另一方面，云上更方便進(jìn)行多模型調(diào)用，并提供企業(yè)級(jí)的數(shù)據(jù)安全保障。阿里云可以為每個(gè)企業(yè)提供專屬 VPC 環(huán)境，做到計(jì)算隔離、存儲(chǔ)隔離、網(wǎng)絡(luò)隔離、數(shù)據(jù)加密，充分保障數(shù)據(jù)安全。目前，阿里云已主導(dǎo)或深度參與 10 多項(xiàng)大模型安全相關(guān)國(guó)際國(guó)內(nèi)技術(shù)標(biāo)準(zhǔn)的制定。

降價(jià)背后的邏輯，則是具備普惠的能力。

在 PC 時(shí)代，主導(dǎo)行業(yè)不斷發(fā)展的是安迪-比爾定律。其中，安迪代表的是英特爾賣 CPU 的，比爾則是微軟，做 Windows 操作系統(tǒng)的。兩者組合，隨著操作系統(tǒng)為代表的軟件的體量日益龐大，用戶必須定期更新迭代新的硬件。

換到 AI 時(shí)代同理，大模型發(fā)展越好，云計(jì)算等算力的需求越高?！干墒?AI 所依賴的算力不僅僅是 CPU 和簡(jiǎn)單的技術(shù)帶來(lái)的策略，更多是一個(gè)大規(guī)模集群，大規(guī)模 GPU 集群帶來(lái)算力的基礎(chǔ)，包括網(wǎng)絡(luò)存儲(chǔ)背后能力的提升。所以生成式 AI，無(wú)論是推理和訓(xùn)練，逐漸更多的走向云端，再一次的點(diǎn)燃了公共云的爆發(fā)」劉偉光直言。

而這次空前降價(jià)的底氣，則是云計(jì)算本身超越摩爾定律的特性。

過(guò)去，摩爾定律主導(dǎo)單位面積下，芯片晶體管的密度 18 個(gè)月翻番。相同算力，用戶的使用成本 18 個(gè)月降一半。

現(xiàn)如今，晶體管的摩爾定律失效，但公共云的技術(shù)紅利和規(guī)模效應(yīng)，依然能帶來(lái)算力成本的繼續(xù)優(yōu)化。一個(gè)例證是，阿里云過(guò)去十年，算力成本降低 80%，存儲(chǔ)成本降低 90%。

具體到 AI 方向，阿里云基于自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò) HPN7.0、高性能存儲(chǔ) CPFS、人工智能平臺(tái) PAI 等核心技術(shù)和產(chǎn)品，構(gòu)建了極致彈性的 AI 算力調(diào)度系統(tǒng)，結(jié)合百煉分布式推理加速引擎，大幅壓縮了模型推理成本，并加快模型推理速度。

也是因此，即便同樣的開(kāi)源模型，在公共云上的調(diào)用價(jià)格也遠(yuǎn)遠(yuǎn)低于私有化部署。以使用 Qwen-72B 開(kāi)源模型、每月 1 億 tokens 用量為例，在阿里云百煉上直接調(diào)用 API 每月僅需 600 元，私有化部署的成本平均每月超 1 萬(wàn)元。

至此，大模型的爆發(fā)才剛剛開(kāi)始，但如何打好這場(chǎng)持久戰(zhàn)，阿里云的基礎(chǔ)設(shè)施的鋪墊，已然悄然醞釀完成。

阿里云開(kāi)啟的連鎖反應(yīng)

事實(shí)上，阿里云開(kāi)始幅度如此激進(jìn)的降價(jià)，不會(huì)是故事的結(jié)尾。

就在今天，上午阿里云大模型大幅降價(jià)后，下午隨即百度兩款輕量型主力大模型宣布免費(fèi)。雖然這和阿里云降價(jià)的模型能力并不完全匹配，看起來(lái)是一種聲勢(shì)上的快速應(yīng)對(duì)，但毫無(wú)疑問(wèn)，阿里云開(kāi)啟的這一波大模型能力普惠將引發(fā)進(jìn)一步的業(yè)界連鎖反應(yīng)。

對(duì)于應(yīng)用創(chuàng)新，大模型 API 成本的下降，甚至開(kāi)始可以接近免費(fèi)試用，真正跑起來(lái)再算錢，對(duì)激發(fā)應(yīng)用創(chuàng)新是一件好事。過(guò)去，中國(guó)在實(shí)體經(jīng)濟(jì)，有基建狂魔稱號(hào)，「要致富先修路」也成為家喻戶曉的常識(shí)。其背后的底層經(jīng)濟(jì)規(guī)律是，基礎(chǔ)設(shè)施的價(jià)格與社會(huì)的創(chuàng)新總量，之間是一個(gè)微妙的蹺蹺板結(jié)構(gòu)：

只有基礎(chǔ)設(shè)施的價(jià)格下降，創(chuàng)新才會(huì)如成熟的蒲公英，借助風(fēng)口，把種子播撒向遠(yuǎn)方。過(guò)去實(shí)體經(jīng)濟(jì)如此，期待 AI 時(shí)代亦如此。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：天承辦公室 > 《004博弈思維》

舉報(bào)/認(rèn)領(lǐng)