日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

阿里云大模型空前降價(jià),開(kāi)始超摩爾定律的狂奔

 天承辦公室 2024-05-22 發(fā)布于北京


讓更便宜的大模型,成為全社會(huì)創(chuàng)新加速的基礎(chǔ)設(shè)施。


作者 | ray

編輯 | 靖宇

5 月 21 日,武漢光谷萬(wàn)豪,阿里云「AI 智領(lǐng)者峰會(huì)」。

抵達(dá)現(xiàn)場(chǎng)后,與會(huì)嘉賓發(fā)現(xiàn)一絲不同尋常,一個(gè)已經(jīng)在一個(gè)月時(shí)間里相繼在杭州、北京、西安舉辦過(guò)的系列峰會(huì),這次阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光親自來(lái)了——阿里云這次,可能要搞個(gè)大的。

果不其然,發(fā)布會(huì)開(kāi)始十多分鐘,劉偉光便聊起了一個(gè)硬件領(lǐng)域老生常談的話題「摩爾定律」。

極客最高級(jí)的致敬是「show me code」;商業(yè)教父最高級(jí)的致敬,是把他的觀點(diǎn),變成行業(yè)定律,摩爾定律就是其一。

1965 年,這位英特爾聯(lián)合創(chuàng)始人的一句話,「單位面積上,晶體管的密度,每隔 18 個(gè)月就翻一番」,主導(dǎo)了迄今半導(dǎo)體行業(yè) 60 多年的發(fā)展。

然而,伴隨摩爾故去,摩爾定律在微觀晶體管領(lǐng)域,也逐漸褪色。馮諾依曼架構(gòu)的原始限制、量子隧穿成為擺在眼前的攔路虎。

那將觀察角度轉(zhuǎn)為宏觀,或者轉(zhuǎn)為用戶導(dǎo)向呢?這是阿里云思考了很多年的問(wèn)題。

從用戶角度出發(fā),晶體管密度只是其次,摩爾定律最根本的意義是在于每過(guò) 18 個(gè)月,用戶就能以相同價(jià)格買到翻倍的算力。

但很顯然,實(shí)現(xiàn)越來(lái)越便宜的算力,不止有晶體管密度這一條路。

而公共云與 AI,或許就是阿里云超越摩爾定律的嘗試。

01

AI 推理成本,

開(kāi)始指數(shù)級(jí)下降 


「我覺(jué)得 AI 推理成本只有每年有十倍甚至百倍的降低,才能真正推動(dòng)行業(yè)各行各業(yè)的 AI 應(yīng)用的爆發(fā)?!?/span>
劉偉光話一出口,臺(tái)下的人面面相覷:目前中國(guó) 80% 的科技企業(yè),一半大模型公司都跑在阿里云之上。每年百倍,也就意味著,阿里云要一步將國(guó)產(chǎn)大模型的使用成本打到地板價(jià)。
緊隨其后,阿里云官宣,旗下 9 款核心商業(yè)化及開(kāi)源系列模型將全數(shù)降價(jià),且都已經(jīng)可以通過(guò)阿里云百煉官網(wǎng)開(kāi)通使用。其中,阿里云對(duì)標(biāo) GPT-4 級(jí)別的長(zhǎng)文本模型 Qwen-Long,降價(jià)至 GPT-4 價(jià)格的 1/400,全球最低。
Qwen-Long 是通義千問(wèn)的長(zhǎng)文本增強(qiáng)版模型,主要適用最消耗 token 的長(zhǎng)文本場(chǎng)景,上下文長(zhǎng)度最高達(dá) 1 千萬(wàn),可處理約 1500 萬(wàn)字或 1.5 萬(wàn)頁(yè)的文檔。
此次官宣后,其 API 輸入價(jià)格從 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。這意味著,1 塊錢可以買 200 萬(wàn) tokens,相當(dāng)于 5 本《新華字典》的文字量。相比之下,國(guó)內(nèi)外廠商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 輸入價(jià)格分別為 0.22 元、0.025 元、0.022 元及 0.12 元,均遠(yuǎn)高于 Qwen-long。同時(shí),Qwen-Long 輸出價(jià)格也從 0.02 元/千 tokens 降至 0.002 元/千 tokens,降幅 90%。
不久前發(fā)布的通義千問(wèn)旗艦款大模型,權(quán)威基準(zhǔn) OpenCompass 上性能追平 GPT-4-Turbo 的 Qwen-Max,同樣參與此次降價(jià),API 輸入價(jià)格降至 0.04 元/千 tokens,降幅達(dá) 67%。
其他開(kāi)源模型上,Qwen1.5-72B、Qwen1.5-110B 等 5 款開(kāi)源模型的輸入價(jià)格也分別直降 75% 以上。
從應(yīng)用范圍最廣,到性能最佳,阿里云拿出的,都是最重磅的產(chǎn)品,決心可見(jiàn)一斑。

02

阿里云的決心:成為大模型

爆發(fā)的基礎(chǔ)設(shè)施 


為什么降價(jià)?
答案就寫在這次活動(dòng)的主題中:「讓天下沒(méi)有難做的 AI 應(yīng)用」,成為大模型時(shí)代的基礎(chǔ)設(shè)施。
據(jù)多位內(nèi)部人士表示,AI 的定位在阿里云已經(jīng)上升到前所未有的戰(zhàn)略高度。在多次內(nèi)部會(huì)上,阿里云高管都將 2024 的 AI 類比 2017 年的短視頻與 2012 年的移動(dòng)支付。2012 年到 2013 年,3G 過(guò)渡到 4G 過(guò)程當(dāng)中,中國(guó)的移動(dòng)支付兩年增長(zhǎng)了 800%;在 2017 到 2018,多家短視頻的爆發(fā),實(shí)現(xiàn)了整個(gè)中國(guó)短視頻呈現(xiàn) 8.5 倍的增長(zhǎng)。
未來(lái) AI 的爆發(fā)速度,也將遠(yuǎn)遠(yuǎn)超出所有人的想象——現(xiàn)在,中國(guó)所有大模型公司 API 的日調(diào)用量不超過(guò)一個(gè)億,年底這一數(shù)據(jù)量將達(dá) 100 億次,增長(zhǎng)百倍。
為達(dá)成「AI 基礎(chǔ)設(shè)施」這一目標(biāo),阿里云給自身的定位是做到四有
一有,有實(shí)力提供全球領(lǐng)先的模型服務(wù)。不久前,OpenAI 的 Sam Altman 轉(zhuǎn)發(fā)了 Chatbot Arena 榜單來(lái)印證 GPT-4o 的能力,其中全球排名前 20 的模型中,三款通義千問(wèn)代表中國(guó)模型實(shí)力躋身世界前列。
圖片Sam Altman 在 X 上轉(zhuǎn)發(fā) GPT-4o 測(cè)試成績(jī)|X
二有,有能力建設(shè)國(guó)內(nèi)最大的推理集群。全球三十處公共云地域分布、共計(jì) 89 個(gè)可用區(qū),可做到 4X 推理吞吐提升,8X 計(jì)算資源節(jié)省,以及分鐘級(jí)快速動(dòng)態(tài)擴(kuò)容。
三有,有態(tài)度堅(jiān)持開(kāi)放、持續(xù)開(kāi)源。作為首個(gè)提出 MaaS(模型即服務(wù))理念的云廠商,目前,瞄著讓模型更好的服務(wù)的目標(biāo),阿里云百煉模型服務(wù)平臺(tái)已可以調(diào)用眾多三方及垂直領(lǐng)域大模型、魔塔社區(qū)則是中國(guó)最大的模型社區(qū),擁有 4500+模型總數(shù)以及 500 萬(wàn)+用戶數(shù);通義持續(xù)開(kāi)源全模態(tài)全尺寸模型家族,共計(jì) 700 萬(wàn)開(kāi)源模型下載量。
四有,有信心,迎接 AI 應(yīng)用的爆發(fā)。財(cái)報(bào)數(shù)據(jù)顯示,同比去年,阿里云的 AI 相關(guān)收入同比三位數(shù)增長(zhǎng)。
而與阿里云的「四有」,形成對(duì)比的,則是行業(yè)內(nèi)的「兩貴」。
一方面是開(kāi)發(fā)以及微調(diào)的人力成本貴。大模型人才稀缺已是業(yè)內(nèi)共識(shí),某家消費(fèi)電子巨頭曾算了一筆賬,大模型研發(fā)方向,公司平均平均稅后人才成本為 100 萬(wàn)元。而對(duì)普通企業(yè)來(lái)說(shuō),即便跳過(guò)基模這一步,采用開(kāi)源大模型微調(diào),成本同樣高企。
另一方面則是硬件成本「硅谷卡貴」。一個(gè)創(chuàng)業(yè)公司,擁抱大模型,起步價(jià)實(shí)買 50 臺(tái) GPU 服務(wù)器,甚至 100 臺(tái)、200 臺(tái)乃至更大尺寸的集群。如果對(duì)標(biāo)全球頂級(jí)水平,訓(xùn)練一個(gè) 100B 規(guī)模的 LLM,以 Falcon 系列模型為例,其資源消耗量 3.5 萬(wàn)億 token,約 4096 個(gè) A100 組成的集群,訓(xùn)練時(shí)長(zhǎng)約 70 天。其中,一張 A100 的價(jià)格,通常在一萬(wàn)美金乃至更多。而構(gòu)建集群,除了 GPU 的采購(gòu),還有包括軟件部署、網(wǎng)絡(luò)費(fèi)用、電費(fèi)、運(yùn)維成本,以及不斷投入的試錯(cuò)成本,成本遠(yuǎn)非普通企業(yè)可以承受。
那么,對(duì)阿里云來(lái)說(shuō),接下來(lái)的核心目標(biāo),就是如何用阿里云的「四有」,解決 AI 爆發(fā)遇到的「兩貴」。

03

決定 API 價(jià)值的要素:

技術(shù)高度+普惠能力 


不難發(fā)現(xiàn),本次活動(dòng),阿里云的重點(diǎn)有二,其一是強(qiáng)調(diào) API 價(jià)值,其二是降價(jià)普惠的能力。
API 很好理解,互聯(lián)網(wǎng)發(fā)展沒(méi)必要重復(fù)造輪子,大模型發(fā)展,也不是人人都需要從基模開(kāi)始。通過(guò) API 與公共云相組合,不僅可以降低大模型開(kāi)發(fā)的人力成本,更是通往大模型普惠的必經(jīng)之路。
一方面,云廠商天然的開(kāi)放性,能為開(kāi)發(fā)者提供私有部署所不具備的豐富模型和工具鏈。阿里云百煉平臺(tái)上匯聚通義、百川、ChatGLM、Llama 系列等上百款國(guó)內(nèi)外優(yōu)質(zhì)模型,內(nèi)置大模型定制與應(yīng)用開(kāi)發(fā)工具鏈,開(kāi)發(fā)者可以便捷地測(cè)試比較不同模型,開(kāi)發(fā)專屬大模型,并輕松搭建 RAG 等應(yīng)用。從選模型、調(diào)模型、搭應(yīng)用到對(duì)外服務(wù),一站式搞定。
另一方面,云上更方便進(jìn)行多模型調(diào)用,并提供企業(yè)級(jí)的數(shù)據(jù)安全保障。阿里云可以為每個(gè)企業(yè)提供專屬 VPC 環(huán)境,做到計(jì)算隔離、存儲(chǔ)隔離、網(wǎng)絡(luò)隔離、數(shù)據(jù)加密,充分保障數(shù)據(jù)安全。目前,阿里云已主導(dǎo)或深度參與 10 多項(xiàng)大模型安全相關(guān)國(guó)際國(guó)內(nèi)技術(shù)標(biāo)準(zhǔn)的制定。
降價(jià)背后的邏輯,則是具備普惠的能力。
在 PC 時(shí)代,主導(dǎo)行業(yè)不斷發(fā)展的是安迪-比爾定律。其中,安迪代表的是英特爾賣 CPU 的,比爾則是微軟,做 Windows 操作系統(tǒng)的。兩者組合,隨著操作系統(tǒng)為代表的軟件的體量日益龐大,用戶必須定期更新迭代新的硬件。
換到 AI 時(shí)代同理,大模型發(fā)展越好,云計(jì)算等算力的需求越高?!干墒?AI 所依賴的算力不僅僅是 CPU 和簡(jiǎn)單的技術(shù)帶來(lái)的策略,更多是一個(gè)大規(guī)模集群,大規(guī)模 GPU 集群帶來(lái)算力的基礎(chǔ),包括網(wǎng)絡(luò)存儲(chǔ)背后能力的提升。所以生成式 AI,無(wú)論是推理和訓(xùn)練,逐漸更多的走向云端,再一次的點(diǎn)燃了公共云的爆發(fā)」劉偉光直言。
而這次空前降價(jià)的底氣,則是云計(jì)算本身超越摩爾定律的特性。
過(guò)去,摩爾定律主導(dǎo)單位面積下,芯片晶體管的密度 18 個(gè)月翻番。相同算力,用戶的使用成本 18 個(gè)月降一半。
現(xiàn)如今,晶體管的摩爾定律失效,但公共云的技術(shù)紅利和規(guī)模效應(yīng),依然能帶來(lái)算力成本的繼續(xù)優(yōu)化。一個(gè)例證是,阿里云過(guò)去十年,算力成本降低 80%,存儲(chǔ)成本降低 90%。
具體到 AI 方向,阿里云基于自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò) HPN7.0、高性能存儲(chǔ) CPFS、人工智能平臺(tái) PAI 等核心技術(shù)和產(chǎn)品,構(gòu)建了極致彈性的 AI 算力調(diào)度系統(tǒng),結(jié)合百煉分布式推理加速引擎,大幅壓縮了模型推理成本,并加快模型推理速度。
也是因此,即便同樣的開(kāi)源模型,在公共云上的調(diào)用價(jià)格也遠(yuǎn)遠(yuǎn)低于私有化部署。以使用 Qwen-72B 開(kāi)源模型、每月 1 億 tokens 用量為例,在阿里云百煉上直接調(diào)用 API 每月僅需 600 元,私有化部署的成本平均每月超 1 萬(wàn)元。
至此,大模型的爆發(fā)才剛剛開(kāi)始,但如何打好這場(chǎng)持久戰(zhàn),阿里云的基礎(chǔ)設(shè)施的鋪墊,已然悄然醞釀完成。

阿里云開(kāi)啟的連鎖反應(yīng)

事實(shí)上,阿里云開(kāi)始幅度如此激進(jìn)的降價(jià),不會(huì)是故事的結(jié)尾。
就在今天,上午阿里云大模型大幅降價(jià)后,下午隨即百度兩款輕量型主力大模型宣布免費(fèi)。雖然這和阿里云降價(jià)的模型能力并不完全匹配,看起來(lái)是一種聲勢(shì)上的快速應(yīng)對(duì),但毫無(wú)疑問(wèn),阿里云開(kāi)啟的這一波大模型能力普惠將引發(fā)進(jìn)一步的業(yè)界連鎖反應(yīng)。
對(duì)于應(yīng)用創(chuàng)新,大模型 API 成本的下降,甚至開(kāi)始可以接近免費(fèi)試用,真正跑起來(lái)再算錢,對(duì)激發(fā)應(yīng)用創(chuàng)新是一件好事。過(guò)去,中國(guó)在實(shí)體經(jīng)濟(jì),有基建狂魔稱號(hào),「要致富先修路」也成為家喻戶曉的常識(shí)。其背后的底層經(jīng)濟(jì)規(guī)律是,基礎(chǔ)設(shè)施的價(jià)格與社會(huì)的創(chuàng)新總量,之間是一個(gè)微妙的蹺蹺板結(jié)構(gòu):
只有基礎(chǔ)設(shè)施的價(jià)格下降,創(chuàng)新才會(huì)如成熟的蒲公英,借助風(fēng)口,把種子播撒向遠(yuǎn)方。過(guò)去實(shí)體經(jīng)濟(jì)如此,期待 AI 時(shí)代亦如此。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多