日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

OpenAI 宣布推出 GPT

 燕山茶社 2024-07-23
OpenAI 宣布推出 GPT-4o mini,這是OpenAI最具成本效益的小型模型。預(yù)計(jì) GPT-4o mini 將讓AI領(lǐng)域的成本更降一個(gè)臺(tái)階。

GPT-4o mini 在 MMLU 上的得分為 82%,目前在 LMSYS 排行榜,聊天方面優(yōu)于 GPT-4。它的定價(jià)為每百萬(wàn)輸入token 15 美分,每百萬(wàn)輸出token 60 美分,比之前的前沿模型便宜一個(gè)數(shù)量級(jí),比 GPT-3.5 Turbo 便宜 60% 以上。

GPT-4o mini 以其低成本和低延遲實(shí)現(xiàn)了廣泛的任務(wù),例如鏈接或并行化多個(gè)模型調(diào)用的應(yīng)用程序、將大量上下文傳遞模型的應(yīng)用程序,或通過(guò)快速、實(shí)時(shí)的文本響應(yīng)與客戶互動(dòng)(例如聊天機(jī)器人等)。 

GPT-4o mini 在 API 中支持文本和視覺(jué),未來(lái)將支持文本、圖像、視頻和音頻輸入和輸出。該模型具有 128K 個(gè) token 的上下文窗口,每個(gè)請(qǐng)求最多支持 16K 個(gè)輸出 token,并且擁有截至 2023 年 10 月的知識(shí)。得益于與 GPT-4o 共享的改進(jìn)的 tokenizer,處理非英語(yǔ)文本現(xiàn)在更加經(jīng)濟(jì)高效。

GPT-4o mini 已經(jīng)在幾個(gè)關(guān)鍵基準(zhǔn)上進(jìn)行了評(píng)估。

推理任務(wù): GPT-4o mini 在涉及文本和視覺(jué)的推理任務(wù)上優(yōu)于其他小型模型,在文本智能和推理基準(zhǔn) MMLU 上的得分為 82.0%,而 Gemini Flash 為 77.9%,Claude Haiku 為 73.8%。

數(shù)學(xué)和編碼能力: GPT-4o mini 在數(shù)學(xué)推理和編碼任務(wù)中表現(xiàn)出色,優(yōu)于之前的小型模型。在測(cè)量數(shù)學(xué)推理的 MGSM 上,GPT-4o mini 得分為 87.0%,而 Gemini Flash 得分為 75.5%,Claude Haiku 得分為 71.7%。在測(cè)量編碼性能的 HumanEval 上,GPT-4o mini 得分為 87.2%,而 Gemini Flash 得分為 71.5%,Claude Haiku 得分為 75.9%。

多模態(tài)推理: GPT-4o mini 在多模態(tài)推理評(píng)估 MMMU 上也表現(xiàn)出色,得分為 59.4%,而 Gemini Flash 為 56.1%,Claude Haiku 為 50.2%。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多