LLMs之OpenAI o1:OpenAI o1的簡介、安裝和使用方法、案例應用之詳細攻略
概述2024年9月12日,OpenAI正式推出流傳已久的OpenAI o1-preview,這是一個全新的推理模型系列,用于解決復雜問題。9月12日起正式上線。 我們開發(fā)了一系列新的AI模型,旨在在回答問題之前花費更多時間進行思考。這些模型能夠推理復雜任務,并解決科學、編碼和數(shù)學領域中比以往模型更難的問題。 今天,我們在ChatGPT和我們的API中發(fā)布了這一系列的首款模型。這是一個預覽版,我們預計會定期更新和改進。與此次發(fā)布同時推出的,還有正在開發(fā)中的下一次更新的評估。 官網地址:https:///index/introducing-openai-o1-preview/ 工作原理我們訓練這些模型在回答問題之前花費更多時間思考,類似于人類的思考過程。通過訓練,它們學會了改進思維過程,嘗試不同的策略,并能夠識別錯誤。 在我們的測試中,下一次模型更新在物理、化學和生物等高難度基準任務中表現(xiàn)與博士生相當。我們還發(fā)現(xiàn)它在數(shù)學和編碼方面表現(xiàn)出色。在國際數(shù)學奧林匹克(IMO)預選考試中,GPT-4o僅正確解決了13%的問題,而推理模型的正確率達到了83%。在編程能力測試中,該模型在Codeforces競賽中達到了89百分位。你可以在我們的技術研究文章中了解更多。 作為早期模型,它目前還沒有許多使ChatGPT更實用的功能,例如瀏覽網絡獲取信息和上傳文件及圖像。在許多常見場景中,GPT-4o將在短期內表現(xiàn)得更為強大。 但對于復雜推理任務而言,這是一次重大突破,代表了AI能力的新水平。鑒于此,我們將計數(shù)重置為1,并將這一系列命名為OpenAI o1。 安全性在開發(fā)這些新模型的過程中,我們采用了一種新的安全訓練方法,利用其推理能力,使其遵循安全性和對齊性指南。通過能夠在上下文中推理安全規(guī)則,它可以更有效地應用這些規(guī)則。 我們通過測試模型在用戶試圖繞過其安全規(guī)則時能否繼續(xù)遵守安全規(guī)則(稱為“越獄”)來衡量其安全性。在我們最難的越獄測試中,GPT-4o得分為22(滿分為100),而我們的o1-preview模型得分為84。你可以在系統(tǒng)卡片和我們的研究文章中了解更多。 為了與這些模型的新能力相匹配,我們加強了我們的安全工作、內部治理以及與聯(lián)邦政府的合作。這包括使用我們的準備框架(新窗口打開)、一流的紅隊測試以及董事會層面的審查流程,包括安全與安保委員會的審查。 為了推動我們對AI安全的承諾,我們最近與美國和英國的AI安全機構正式簽署了協(xié)議。我們已經開始落實這些協(xié)議,包括為這些機構提供研究版本的早期訪問權限。這是我們合作中的重要第一步,幫助建立研究、評估和測試未來模型的流程,以確保在公開發(fā)布之前和之后都能進行審查。 適用對象這些增強的推理能力在解決科學、編程、數(shù)學等領域的復雜問題時可能特別有用。例如,o1可以被醫(yī)療研究人員用來標注細胞測序數(shù)據(jù),物理學家可以使用它生成量子光學所需的復雜數(shù)學公式,開發(fā)者可以用它來構建和執(zhí)行多步驟的工作流程。 OpenAI o1-minio1系列擅長準確生成和調試復雜代碼。為了為開發(fā)者提供更高效的解決方案,我們還推出了OpenAI o1-mini,這是一個更快速、更廉價的推理模型,特別擅長編碼。作為一個更小的模型,o1-mini的成本比o1-preview低80%,對于需要推理但不需要廣泛世界知識的應用來說,它是一個強大且具有成本效益的模型。 如何使用OpenAI o1測試地址:https:///?model=o1-preview 從今天開始,ChatGPT Plus和團隊用戶可以在ChatGPT中訪問o1模型。o1-preview和o1-mini可以手動在模型選擇器中選擇。上線時,每周的消息限額分別為30條(o1-preview)和50條(o1-mini)。我們正在努力提高這些限額,并使ChatGPT能夠自動為給定提示選擇合適的模型。 一個新的ChatGPT下拉菜單的圖片,顯示了新的“o1-preview”模型選項,背景為亮黃色和藍色的抽象圖案 ChatGPT企業(yè)版和教育版用戶將在下周獲得對這兩個模型的訪問權限。 符合API使用等級5的開發(fā)者(新窗口打開)今天可以在API中開始使用這兩個模型進行原型開發(fā),每分鐘限額為20次請求。我們將在進一步測試后提高這些限額。當前這些模型的API不包括函數(shù)調用、流式傳輸、系統(tǒng)消息支持等功能。要開始使用,請查看API文檔(新窗口打開)。 我們還計劃向所有ChatGPT免費用戶開放o1-mini的使用權限。 未來計劃這是這些推理模型在ChatGPT和API中的早期預覽。除了模型更新,我們預計還將增加瀏覽、文件和圖像上傳等功能,使其對所有用戶更加實用。 我們還計劃繼續(xù)開發(fā)和發(fā)布GPT系列的模型,以及新的OpenAI o1系列模型。 |
|