傳說中的“草莓”現身,9月12日晚間,OpenAI正式對外發布一款名為o1的新模型,這款模型為該公司下一代 “推理” 模型中的第一個,o為“Orion(獵戶座)”,這款模型可以比人類更快地回答更復雜的問題。
與以前的模型相比,在編寫代碼和解決多步驟問題方面做得更好。但它也比此前發布的GPT-4o更貴,回答問題也更慢。OpenAI強調o1的這次發布為 “預覽版”,還只是初始狀態。此次同時發布的還有更小、更便宜的版本o1-mini 。對OpenAI來說,o1 代表著向其更廣泛的類人人工智能目標邁出的一步。
ChatGPT Plus和團隊用戶即日起便可以訪問o1預覽版和o1-mini,而企業和教育用戶將在下周初獲得訪問權限。OpenAI表示,它計劃讓ChatGPT的所有免費用戶都能訪問o1-mini,但尚未確定發布日期。
對開發者來說,訪問o1的成本比之前要高出很多:通過API使用o1預覽版,輸入每百萬token要收費15美元,輸出每百萬收費60美元。相比之下,GPT-4o的百萬token輸入收費只有5美元,輸出為15美元。
OpenAI 的研究負責人杰里?特沃雷克(Jerry Tworek)向媒體透露,o1 “是使用一種全新的優化算法和專門為其定制的新訓練數據集進行訓練的”,它使用 “思維鏈” 來處理查詢,類似于人類通過逐步解決問題的方式處理問題。這種新的訓練方法,使得模型更加準確。“我們注意到這個模型的幻覺更少了,” 特沃雷克說,但這個問題仍然存在,“我們不能說我們解決了幻覺問題。”
根據OpenAI的說法,這個新模型與GPT-4o的主要區別在于它能夠比其前身更好地解決復雜問題,如編碼和數學,同時還能解釋其推理過程。OpenAI還對o1進行了國際數學奧林匹克資格考試的測試,雖然 GPT-4o只正確解決了13%的問題,但o1得分達到了83%。
在被稱為Codeforces競賽的在線編程比賽中,這個新模型達到了參與者的89%的百分位,OpenAI聲稱這個模型的下一次更新將在具有挑戰性的物理、化學和生物學基準任務中表現得 “類似于博士生”。
(原題:OpenAI 發布“ o1”新一代大模型,更擅長推理也更貴)
特別聲明
近日,賽默飛世爾科技公司宣布與OpenAI達成戰略合作,借助其先進的人工智能技術,推動科學創新和藥物開發的進程。此次合作將OpenAI的應用程序編程接口(API)整合到賽默飛世爾的核心業務領域,包括產......
近日,賽默飛世爾科技公司宣布與OpenAI達成戰略合作,借助其先進的人工智能技術,推動科學創新和藥物開發的進程。此次合作將OpenAI的應用程序編程接口(API)整合到賽默飛世爾的核心業務領域,包括產......
8月28日,美國人工智能公司OpenAI發布了其所謂“最先進的語音到語音模型”GPT-realtime,以及配套的Realtime API(實時應用程序接口)。據OpenAI公司介紹,該模型......
8月28日,美國人工智能公司OpenAI發布了其所謂“最先進的語音到語音模型”GPT-realtime,以及配套的Realtime API(實時應用程序接口)。據OpenAI公司介紹,該模型......
7月29日,第三屆海岸帶大會在山東煙臺召開。中國科學院地理科學與資源研究所研究員、“坤元”大模型首席科學家蘇奮振發布了兩款自主研發的大模型——“坤元·感東南”與“坤元·擬千海”。兩款大模型分別針對陸和......
美國開放人工智能研究中心(OpenAI)7日發布其最新人工智能模型GPT-5。據OpenAI官網介紹,這是迄今為止該機構推出的最強大的人工智能系統,在各類基準測試中超越了先前的模型,在編程、數學、寫作......
美國開放人工智能研究中心(OpenAI)7日發布其最新人工智能模型GPT-5。據OpenAI官網介紹,這是迄今為止該機構推出的最強大的人工智能系統,在各類基準測試中超越了先前的模型,在編程、數學、寫作......
近日,由哈爾濱工程大學研發的國內首個船海學科教育專有大模型——“興海”大模型,在國家高教智慧教育平臺正式上線。“興海”教育專有大模型以DeepSeek、文心一言、Kimi三大模型作為支撐。大模型由哈工......
5月18日,由國家腎臟病臨床醫學研究中心(南方醫科大學南方醫院)牽頭研發的“慢性腎臟病綜合管理大模型——智腎”在南方醫科大學南方醫院正式發布。同時宣布將贈送“智腎”大模型給貴州省人民醫院、新疆醫科大學......
近日,中醫藥交叉學科和智能科學大會在中國中醫科學院舉辦,大會主題為“AI創新中醫發展、數智均衡醫療資源”。國家中醫藥管理局副局長、中國中醫科學院院長、中國工程院院士黃璐琦表示,中醫藥傳承數千年,積累了......