-
OpenAI新推理模型價(jià)格驟降,總體性價(jià)比未能超越DeepSeek R1
最后更新: 2025-02-05 09:55:31當(dāng)?shù)貢r(shí)間1月31日,美國OpenAI公司正式上線推理模型o3-mini,并首次向免費(fèi)用戶開放推理模型,一同亮相的還有“滿血版”的o3模型。
來源:OpenAI
OpenAI表示,o3具備更先進(jìn)、近似人類的推理能力,在解決編程、數(shù)學(xué)、科學(xué)等理工科問題方面均超越現(xiàn)役的o1模型。該公司曾表示,o3-mini會(huì)在1月底先上架,o3則“會(huì)在不久之后推出”。
根據(jù)介紹,o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”的選項(xiàng)——分為低、中、高三個(gè)級(jí)別。這種靈活性使得o3-mini可以在面對(duì)難題時(shí)“更努力思考”,而需要效率時(shí)優(yōu)先考慮回應(yīng)速度。開發(fā)者可根據(jù)需求選擇推理強(qiáng)度,平衡思考深度和響應(yīng)速度,但不支持視覺任務(wù),視覺推理仍需使用o1。
在新聞稿中,OpenAI披露,在2024年美國數(shù)學(xué)邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準(zhǔn)確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準(zhǔn)確率能夠提升到79.6%,與o1模型相當(dāng)。在最高努力水平時(shí),o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。
在博士級(jí)科學(xué)問題(GPQA Diamond)方面,三種努力程度模型的準(zhǔn)確率分別為70.6%、76.8%和79.7%,該測試主要用于衡量模型在博士級(jí)別物理、生物和化學(xué)問題上的表現(xiàn)。
有外媒還將o3-mini和DeepSeek的R1模型進(jìn)行了對(duì)比。
在AIME 2024測試中,o3-mini僅在高推理強(qiáng)度下表現(xiàn)優(yōu)于R1(79.8%)。在以編程為重點(diǎn)的SWE-bench Verified基準(zhǔn)測試中,o3-mini同樣僅在高推理強(qiáng)度下以微弱優(yōu)勢(0.1 分)領(lǐng)先R1。在低推理強(qiáng)度下,o3-mini在GPQA Diamond基準(zhǔn)測試中落后于R1(71.5%)。
OpenAI宣布,從當(dāng)天開始,免費(fèi)ChatGPT用戶也能通過在編輯器中選擇“推理”來嘗試o3-mini模型,這也是公司的推理模型首次向免費(fèi)用戶開放。
對(duì)于付費(fèi)用戶,o3-mini將在模型選擇器中替代o1-mini。作為升級(jí)的一部分,每月花費(fèi)20美元左右的ChatGPT Plus和Team用戶,速率限制也從o1-mini的每天50條,提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶,能無限制地訪問o3-mini。
近期,爆火的DeepSeek-R1模型對(duì)OpenAI構(gòu)成了競爭壓力,尤其在成本方面呈現(xiàn)出顯著差異。
OpenAI 的推理模型o1系列相對(duì)成本較高,o1模型的API定價(jià)為每百萬輸入tokens 15美元,每百萬輸出tokens 60美元,而DeepSeek R1的API定價(jià)為每百萬輸入tokens 0.14美元(緩存命中)/0.55美元(緩存未命中),每百萬輸出tokens 2.19美元。
這次發(fā)布中,OpenAI強(qiáng)調(diào)了成本問題。與OpenAI的o1-mini相比,o3-mini的價(jià)格降低了63%。o3-mini定價(jià)為每百萬輸入tokens 1.10美元,每百萬輸出tokens 4.40美元,。不過,相比DeepSeek-R1,o3-mini的價(jià)格依然高出了不少。
o3-mini與DeepSeek-R1價(jià)格對(duì)比
安全方面,OpenAI表示,在訓(xùn)練o3-mini以實(shí)現(xiàn)安全響應(yīng)的過程中,采用了一種關(guān)鍵技術(shù)--“深思熟慮的對(duì)齊(deliberative alignment)”。
通過這種方法,OpenAI訓(xùn)練模型在回答用戶提示之前,先對(duì)人類編寫的安全規(guī)范進(jìn)行推理??梢岳斫鉃?,OpenAI希望確保o3-mini生成的內(nèi)容更加安全、符合道德,并降低了模型生成不良或有害響應(yīng)的風(fēng)險(xiǎn)。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 林鈴錦 
-
“硅谷有種常見病,認(rèn)為圈外所有創(chuàng)新都是作弊得來的”
2025-02-02 21:01 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
華為和DeepSeek聯(lián)手,硅基流動(dòng)首發(fā)被擠爆
2025-02-01 18:23 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
英特爾也加入了:針對(duì)DeepSeek進(jìn)行深度優(yōu)化
2025-02-01 15:21 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
韓國股市補(bǔ)跌:內(nèi)存芯片巨頭暴跌10%
2025-02-01 14:28 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
2024年末銀行理財(cái)支持實(shí)體經(jīng)濟(jì)資金規(guī)模超20萬億元
2025-02-01 13:27 金融觀察 -
蘋果最賺錢的一個(gè)季度,在華收入?yún)s遭滑鐵盧
2025-01-31 10:56 -
星巴克第一財(cái)季同店銷售下滑4%,中國同店銷售下降6%
2025-01-29 13:40 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
英國監(jiān)管機(jī)構(gòu)考慮調(diào)查亞馬遜和微軟云服務(wù)
2025-01-29 13:34 觀網(wǎng)財(cái)經(jīng)-海外 -
高盛警告:避險(xiǎn)基金已開始撤離對(duì)美國科技股的押注
2025-01-29 12:43 觀網(wǎng)財(cái)經(jīng)-海外 -
阿里云發(fā)布通義千問旗艦版模型Qwen2.5-Max
2025-01-29 10:54 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
美國科技股收復(fù)部分失地,昨夜中國資產(chǎn)大漲
2025-01-29 10:53 觀網(wǎng)財(cái)經(jīng)-海外 -
去年凈虧118億美元,波音放棄制定2025年財(cái)務(wù)目標(biāo)
2025-01-29 10:44 -
DeepSeek掀翻美股,憑什么?
2025-01-28 18:44 -
雷軍、余承東開車時(shí)直播被封,抖音回應(yīng)
2025-01-28 18:19 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
傳蘋果尋找董事會(huì)新成員,庫克有望接任董事長
2025-01-28 18:16 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
迅雷斥資5億元收購虎撲
2025-01-28 18:13 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
榮耀中國區(qū)總裁換人
2025-01-28 17:51 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
馬斯克靠這6張娃娃臉發(fā)動(dòng)“閃電戰(zhàn)”,美國嘩然 評(píng)論 180特朗普拋出震撼發(fā)言:美國將接管加沙 評(píng)論 439這時(shí)候,她對(duì)華態(tài)度“軟”了 評(píng)論 190“中方反擊較為克制,留了余地” 評(píng)論 1882月10日起,對(duì)原產(chǎn)于美國的部分進(jìn)口商品加征關(guān)稅 評(píng)論 295最新聞 Hot
-
“中方反擊較為克制,留了余地”
-
“反美聯(lián)盟正在形成!他拔槍就射,極其危險(xiǎn)”
-
要起訴DeepSeek?他回應(yīng)了
-
賬對(duì)不上了…
-
普京:要不了多久,歐洲會(huì)繼續(xù)對(duì)特朗普“搖尾巴”
-
墜毀“黑鷹”女飛行員曾任拜登軍事社交助理,飛行時(shí)長450小時(shí)
-
特朗普承認(rèn):關(guān)稅也許會(huì)讓美國人“痛苦”
-
“史上最愚蠢的貿(mào)易戰(zhàn)!”
-
加拿大群情激奮:報(bào)復(fù)紅州,報(bào)復(fù)特斯拉!
-
美國一客機(jī)發(fā)動(dòng)機(jī)起火,乘客被緊急疏散
-
要被特朗普關(guān)稅大棒掄到,歐盟這時(shí)候想到中國了?
-
“霸榜全球140個(gè)市場”,拉新最多的是…
-
他罕見“認(rèn)錯(cuò)”:在這方面,我們一直站在歷史錯(cuò)誤一邊
-
“政治清洗”?數(shù)千名FBI特工被“拉清單”
-
他寫的這篇小作文,竟是英偉達(dá)市值蒸發(fā)6000億美元的重要催化劑
-
他倆首會(huì)面,“談了DeepSeek和AI芯片出口”
-