OpenAI 宣布推出 GPT

燕山茶社 2024-07-23

展開全文

OpenAI 宣布推出 GPT-4o mini，這是OpenAI最具成本效益的小型模型。預(yù)計(jì) GPT-4o mini 將讓AI領(lǐng)域的成本更降一個(gè)臺(tái)階。

GPT-4o mini 在 MMLU 上的得分為 82%，目前在 LMSYS 排行榜，聊天方面優(yōu)于 GPT-4。它的定價(jià)為每百萬(wàn)輸入token 15 美分，每百萬(wàn)輸出token 60 美分，比之前的前沿模型便宜一個(gè)數(shù)量級(jí)，比 GPT-3.5 Turbo 便宜 60% 以上。

GPT-4o mini 以其低成本和低延遲實(shí)現(xiàn)了廣泛的任務(wù)，例如鏈接或并行化多個(gè)模型調(diào)用的應(yīng)用程序、將大量上下文傳遞模型的應(yīng)用程序，或通過(guò)快速、實(shí)時(shí)的文本響應(yīng)與客戶互動(dòng)（例如聊天機(jī)器人等）。

GPT-4o mini 在 API 中支持文本和視覺(jué)，未來(lái)將支持文本、圖像、視頻和音頻輸入和輸出。該模型具有 128K 個(gè) token 的上下文窗口，每個(gè)請(qǐng)求最多支持 16K 個(gè)輸出 token，并且擁有截至 2023 年 10 月的知識(shí)。得益于與 GPT-4o 共享的改進(jìn)的 tokenizer，處理非英語(yǔ)文本現(xiàn)在更加經(jīng)濟(jì)高效。

GPT-4o mini 已經(jīng)在幾個(gè)關(guān)鍵基準(zhǔn)上進(jìn)行了評(píng)估。

推理任務(wù)： GPT-4o mini 在涉及文本和視覺(jué)的推理任務(wù)上優(yōu)于其他小型模型，在文本智能和推理基準(zhǔn) MMLU 上的得分為 82.0%，而 Gemini Flash 為 77.9%，Claude Haiku 為 73.8%。

數(shù)學(xué)和編碼能力： GPT-4o mini 在數(shù)學(xué)推理和編碼任務(wù)中表現(xiàn)出色，優(yōu)于之前的小型模型。在測(cè)量數(shù)學(xué)推理的 MGSM 上，GPT-4o mini 得分為 87.0%，而 Gemini Flash 得分為 75.5%，Claude Haiku 得分為 71.7%。在測(cè)量編碼性能的 HumanEval 上，GPT-4o mini 得分為 87.2%，而 Gemini Flash 得分為 71.5%，Claude Haiku 得分為 75.9%。

多模態(tài)推理： GPT-4o mini 在多模態(tài)推理評(píng)估 MMMU 上也表現(xiàn)出色，得分為 59.4%，而 Gemini Flash 為 56.1%，Claude Haiku 為 50.2%。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：燕山茶社 > 《電腦網(wǎng)絡(luò)家電》

舉報(bào)/認(rèn)領(lǐng)