OpenAI 宣布推出 GPT-4o mini,這是OpenAI最具成本效益的小型模型。預(yù)計(jì) GPT-4o mini 將讓AI領(lǐng)域的成本更降一個(gè)臺(tái)階。 GPT-4o mini 在 MMLU 上的得分為 82%,目前在 LMSYS 排行榜,聊天方面優(yōu)于 GPT-4。它的定價(jià)為每百萬(wàn)輸入token 15 美分,每百萬(wàn)輸出token 60 美分,比之前的前沿模型便宜一個(gè)數(shù)量級(jí),比 GPT-3.5 Turbo 便宜 60% 以上。 GPT-4o mini 以其低成本和低延遲實(shí)現(xiàn)了廣泛的任務(wù),例如鏈接或并行化多個(gè)模型調(diào)用的應(yīng)用程序、將大量上下文傳遞模型的應(yīng)用程序,或通過(guò)快速、實(shí)時(shí)的文本響應(yīng)與客戶互動(dòng)(例如聊天機(jī)器人等)。 GPT-4o mini 在 API 中支持文本和視覺(jué),未來(lái)將支持文本、圖像、視頻和音頻輸入和輸出。該模型具有 128K 個(gè) token 的上下文窗口,每個(gè)請(qǐng)求最多支持 16K 個(gè)輸出 token,并且擁有截至 2023 年 10 月的知識(shí)。得益于與 GPT-4o 共享的改進(jìn)的 tokenizer,處理非英語(yǔ)文本現(xiàn)在更加經(jīng)濟(jì)高效。 GPT-4o mini 已經(jīng)在幾個(gè)關(guān)鍵基準(zhǔn)上進(jìn)行了評(píng)估。 推理任務(wù): GPT-4o mini 在涉及文本和視覺(jué)的推理任務(wù)上優(yōu)于其他小型模型,在文本智能和推理基準(zhǔn) MMLU 上的得分為 82.0%,而 Gemini Flash 為 77.9%,Claude Haiku 為 73.8%。 數(shù)學(xué)和編碼能力: GPT-4o mini 在數(shù)學(xué)推理和編碼任務(wù)中表現(xiàn)出色,優(yōu)于之前的小型模型。在測(cè)量數(shù)學(xué)推理的 MGSM 上,GPT-4o mini 得分為 87.0%,而 Gemini Flash 得分為 75.5%,Claude Haiku 得分為 71.7%。在測(cè)量編碼性能的 HumanEval 上,GPT-4o mini 得分為 87.2%,而 Gemini Flash 得分為 71.5%,Claude Haiku 得分為 75.9%。 多模態(tài)推理: GPT-4o mini 在多模態(tài)推理評(píng)估 MMMU 上也表現(xiàn)出色,得分為 59.4%,而 Gemini Flash 為 56.1%,Claude Haiku 為 50.2%。 ![]() ![]() |
|
來(lái)自: 燕山茶社 > 《電腦網(wǎng)絡(luò)家電》