日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

智源最新模型評測發(fā)布:豆包大模型“客觀評測”排名國產(chǎn)第一

 江海博覽 2024-06-21 發(fā)布于浙江
圖片

近日,智源研究院旗下的 FlagEval 大模型評測平臺發(fā)布最新評測榜單。

榜單顯示,在閉源大模型的“客觀評測”中,豆包大模型(Doubao-Pro-4k)以綜合評分75.96分排名第二,僅次于 GPT-4,是得分最高的國產(chǎn)大模型。在“主觀評測”中,豆包大模型同樣排名第二。

圖片

FlagEval 大模型評測能力榜單(客觀評測)

FlagEval 大模型評測平臺由智源研究院與多個高校團(tuán)隊(duì)共建,以人類認(rèn)知能力的發(fā)展階梯為基準(zhǔn),對齊大模型所能達(dá)到的認(rèn)知水平。FlagEval 構(gòu)建了大量原創(chuàng)的非公開評測集,確保評測質(zhì)量和公正性。自2023年6月上線以來,F(xiàn)lagEval 已完成了1,000多次覆蓋全球大模型的評測。

評測成績顯示,豆包大模型(Doubao-Pro-4k)的數(shù)學(xué)能力、知識運(yùn)用、任務(wù)解決等多項(xiàng)能力在客觀評測和主觀評測中都有著出色表現(xiàn)。其中,知識運(yùn)用和數(shù)學(xué)能力得分排名客觀評測第一、主觀評測前三,任務(wù)解決測試得分在主客觀評測中均排名前三。

豆包大模型由字節(jié)跳動自主研發(fā),通過火山引擎正式對外提供服務(wù)。今年5月15日,火山引擎正式發(fā)布了包含豆包通用模型pro、豆包通用模型lite、豆包·角色扮演模型、豆包·語音合成模型、豆包·聲音復(fù)刻模型、豆包·語音識別模型、豆包·文生圖模型、豆包·Function Call模型、豆包·向量化模型等9款大模型在內(nèi)的豆包大模型家族,企業(yè)可以根據(jù)自身業(yè)務(wù)場景需求,靈活選擇并快速落地。

圖片

豆包大模型家族

火山引擎希望以豆包大模型更強(qiáng)模型、更低價格、更易落地的優(yōu)勢特點(diǎn),幫助企業(yè)輕松構(gòu)建高質(zhì)量 AI 應(yīng)用,在帶來創(chuàng)新業(yè)務(wù)體驗(yàn)的同時,驅(qū)動業(yè)務(wù)增長。

更強(qiáng)模型:大使用量才能打磨出更好模型。豆包大模型目前已經(jīng)在字節(jié)跳動內(nèi)部50多個業(yè)務(wù)、多場景應(yīng)用中落地,經(jīng)過千億級日 tokens 的持續(xù)打磨,模型能力和推理效果得到市場的廣泛認(rèn)可。

更低價格:為了讓每一家企業(yè)都能用得起大模型,火山引擎大幅度降低大模型應(yīng)用推理成本。例如本次登榜的豆包通用模型pro,其 32k 版模型推理輸入價格僅為0.0008元/千 tokens。

更易落地:火山引擎去年發(fā)布了一站式大模型服務(wù)平臺火山方舟,通過模型即服務(wù)的理念,幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。近期,火山引擎對方舟平臺進(jìn)行了全面升級,升級后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺體驗(yàn),幫助企業(yè)推進(jìn)大模型的價值創(chuàng)造。

目前,豆包大模型已在金融、汽車、智能終端、電商零售、教育科研等多個行業(yè)實(shí)踐落地。未來,火山引擎將持續(xù)探索大模型在千行百業(yè)里的實(shí)踐應(yīng)用,繼續(xù)沉淀字節(jié)跳動內(nèi)部和外部客戶的實(shí)踐經(jīng)驗(yàn),通過豆包大模型、火山方舟的全棧 AI 服務(wù),幫助企業(yè) AI 轉(zhuǎn)型落地,釋放增長潛能,實(shí)現(xiàn)商業(yè)價值。

圖片

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多