巨爆乳肉感一区二区三区视频动漫-67194线路一直接进入骚逼-亚洲精品无码一区二区三区四虎-亚洲国产精品有码-国产精品99无码一区二区视频-免费观看A黄色

首個OpenAI免費推理模型o3-mini發(fā)布 DeepSeek讓奧特曼反思:不開源我們錯了

訪客 11個月前 (02-02) 閱讀數(shù) 9321 #區(qū)塊鏈
文章標簽 前沿文章

DeepSeek真算是給大模型圈提了個速——

就在剛剛,OpenAI深夜緊急發(fā)布了最新推理模型,o3-mini系列。

一共包含三個版本:low、medium和high。

其中o3-mini和o3-mini-high已經(jīng)上線:

根據(jù)官方口徑,o3系列模型,目標是推動低成本推理的邊界。

ChatGPT Plus、團隊和Pro用戶從今天起可以訪問OpenAI o3-mini,企業(yè)級訪問將在一周后開放。

免費用戶也可以通過選擇“Search+Reason”來使用o3-mini來體驗搜索。

或許是被DeepSeek逼急了,這是OpenAI首次向用戶免費推出的推理模型。

甚至在隨后的Reddit“有問必答”活動中,CEO奧特曼也罕見公開反思:

在開源權重AI模型這個問題上,(個人認為)我們站在了歷史錯誤的一邊。

與此同時,短短數(shù)小時內(nèi),網(wǎng)友們已經(jīng)開始瘋狂實測ing……

針對STEM推理優(yōu)化,但價格相較DeepSeek-R1依舊貴出天際

還是先來看看技術報告都寫了啥。

去年年底,OpenAI上線了o3-mini預覽版,再次刷新小模型能力邊界。(在成本和低延遲上與o1-mini相當)

當時CEO奧特曼預告稱,正式版將在今年1月發(fā)布。而卡在ddl的最后時刻,正式版o3-mini終于上桌。

整體而言,和前一代o1-mini類似,它也針對STEM(Science、Technology、Engineering、Mathematics)進行了優(yōu)化,延續(xù)了mini系列小而美的風格。

僅o3-mini(medium),不但在數(shù)學編碼上的表現(xiàn)與o1系列相當,而且響應更快。

人類專家測評顯示,大多數(shù)情況下o3-mini比o1-mini產(chǎn)生更準確、更清晰的答案,獲得了56%的偏好度,同時在處理復雜現(xiàn)實問題時的重大錯誤率更是降低了39%。

數(shù)學能力上,低推理強度下的o3-mini(low)達到了與o1-mini相當?shù)乃?;中等推理強度下能力媲美滿血版o1;而一旦推理強度拉滿(high),其表現(xiàn)直接超越o1系列一眾模型。

在由60多位頂尖數(shù)學家準備的FrontierMath難題測試中,高推理強度下的o3-mini相較o1系列也有了大幅提升。

官方甚至特意注明,如果搭配Python工具使用,o3-mini(high)在第一次嘗試時就解決了超過32%的問題,其中包括28%以上的T3級問題。

科學能力方面,在PhD水平的物化生問題上,低推理強度下的o3-mini就已經(jīng)和o1-mini拉開了層級。

當然,在編碼這項重要能力上,o3-mini更是在各層級上領先o1系列。

根據(jù)它們在LiveBench的表現(xiàn)可以看出,隨著推理強度升級,o3-mini的優(yōu)勢還在不斷擴大。

而且需要提醒,o3-mini在取得上述領先的同時響應更快,其平均響應時間為7.7秒,較o1-mini的10.16秒提升了24%。

最后在安全評估方面,o3-mini在多項安全評估中明顯超過了GPT-4o。

價格方面,相比于輸入/輸出分別為0.14/0.55美元的DeepSeek-R1,o3-mini依舊貴出天際。

根據(jù)網(wǎng)友辣評,DeepSeek-R1目前還是性價比之王:更快、更好、更便宜。

BTW,OpenAI此次照例公布了o3-mini背后團隊。可以看出,這一次是由奧特曼本人親自帶隊,研究項目主管分別為Carpus Chang和Kristen Ying(名單中也有很多我們熟悉的老朋友如任鴻宇、趙盛佳等)。

網(wǎng)友瘋狂實測中

正如我們剛才所提到的,目前網(wǎng)友們已經(jīng)開始瘋狂實測中。

不過從評價上來看,大伙兒對o3-mini的表現(xiàn)褒貶不一。

例如在用Python實現(xiàn)“球在四維體內(nèi)部彈跳”的任務上,有人認為o3-mini是最好的LLM:

效果是這樣的:

然后有網(wǎng)友嘗試用DeepSeek來做同樣的任務,從效果上來看,認為o3-mini稍微勝出一些:

更直接的對比,讓一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳,球應受到重力和摩擦力的影響,o3-mini和DeepSeek R1的效果差距就比較明顯了:

包括更復雜的一些的任務,在球體內(nèi)創(chuàng)建100個彈跳的黃色球,o3-mini現(xiàn)在也是可以做到:

再如讓o3-mini設計兩個貪吃蛇互相競爭的游戲:

除了DeepSeek之外,網(wǎng)友也用o1和o3-mini的效果做了對比,例如生成一座龐大、驚人的史詩級漂浮城市。

還有一位網(wǎng)友提出了令幾乎所有大模型都會出錯的迷惑性題目,但讓他較為震驚的是,o3-mini竟然答對了:

不過知名播客博主Lex Fridman對o3-mini的評價卻是:

OpenAI o3-mini是一個好模型,但DeepSeek R1性能相似,價格更低,并揭示了其推理過程。

更好的模型將會出現(xiàn)(迫不及待想要 o3-pro),但“DeepSeek 時刻”是真實的。我認為五年后它仍會被記住,作為科技歷史上的一個轉(zhuǎn)折點。

One More Thing

就在o3-mini上線幾小時后,奧特曼本人也攜團隊參與了Reddit的“有問必答”活動。

考慮到開源DeepSeek最近攪動了AI圈,奧特曼罕見公開反思:

在開源權重AI模型這個問題上,(個人認為)我們站在了歷史錯誤的一邊。

甚至也承認,OpenAI的領先優(yōu)勢不會像以前那么大了。

DeepSeek的確很優(yōu)秀,我們也會繼續(xù)研發(fā)更好的模型,但領先優(yōu)勢將更小。

與此同時,OpenAI的一些未來計劃也曝光了。

比如高級語音模式即將迎來更新,OpenAI會直接稱它為GPT-5,而不是GPT-5o,不過目前還沒有具體時間表。

另外,推理模型也將支持調(diào)用更多工具。

最后,滿血版o3也被提及,不過看起來距離還相當遙遠……

熱門
亚洲www啪成人一区二区| 午夜久久tv| 日韩精品免费一区二区夜夜嗨| 日韩欧美中文字幕在线视频| 亚洲啊v在线观看| 老鸭窝毛片一区二区三区| 亚洲涩涩在线| 亚洲欧美久久精品| 久久密一区二区三区| 中文在线免费二区三区| 欧美日本一区| 精品一区二区男人吃奶| 免费不卡在线视频| 亚洲情侣在线| 激情综合亚洲| 亚洲www.| 久久国产精品美女| 噜噜噜久久亚洲精品国产品小说| 久久精品国产福利| jizz久久精品永久免费| 三级欧美在线一区| 国产精品免费大片| 最新亚洲一区| 三级成人在线视频| 激情久久综合| 羞羞视频在线观看一区二区| 日韩精品1区2区3区| 模特精品在线| 伊人久久大香线蕉综合影院首页| 欧美精品一区二区三区精品| 久久精品国产免费看久久精品| 超碰在线一区| 水蜜桃在线视频| 蜜桃精品视频| 欧美成人a交片免费看| 日韩三级网址| 成人日韩在线| 精品久久成人| 国产成人精品一区二区三区视频| 一区二区网站| 亚洲va中文在线播放免费| 日韩一级淫片| 手机看片久久| 久久综合88| 日韩精品乱码av一区二区| 加勒比久久综合| 欧美黄色精品| 视频在线观看91| 精品国产欧美| 久久99国产精品二区高清软件| 国产综合欧美| 国产精品成人一区二区网站软件| 欧美成人国产| 亚洲综合伊人| 欧美www视频在线观看| 秋霞一区二区| 欧美日韩精品免费观看视欧美高清免费大片 | 日本欧美视频| 66精品视频在线观看| 婷婷综合六月| 精品一区免费| 国产精品久一| 国产粉嫩在线观看| 鲁大师精品99久久久| 日韩国产精品久久久久久亚洲| 尤物精品在线| 日韩在线观看中文字幕| 高清亚洲高清| 国产精品视频| 亚洲国产中文在线| 亚洲区国产区| 欧美独立站高清久久| 青青草91久久久久久久久| 日韩精品高清不卡| 蜜臀av一区二区在线观看| 国产成人精品亚洲线观看| 国产日韩视频| 蜜臀av性久久久久av蜜臀妖精| 精品九九在线| 国产精品一区二区美女视频免费看| 高清不卡亚洲| 天天射天天综合网| 视频精品一区| 欧美激情视频一区二区三区免费| 人人草在线视频| 蜜桃精品噜噜噜成人av| 国产伦精品一区二区三区千人斩| 欧美三级网站| 91久久黄色| 色综合www| 日韩有码一区| 欧美黄色一区二区| 深夜福利亚洲| 国产777精品精品热热热一区二区| 久久精品国产清高在天天线| 亚洲动漫精品| 国产精品久久国产愉拍| 黑人巨大精品欧美一区二区桃花岛 | 亚洲黑人在线| 成人在线丰满少妇av| 国产真实久久| 成人av地址| 亚洲人成伊人成综合图片| 麻豆成人久久精品二区三区红| 中文字幕在线官网| av不卡在线看| 国产一区视频在线观看免费| 国产精品调教| 精品国产一区二| 国模大尺度视频一区二区| 日本怡春院一区二区| 免费污视频在线一区| 蜜桃91丨九色丨蝌蚪91桃色 | 日韩中文字幕在线一区| av在线国产精品| 日本不卡一区二区| 久久精品999| 成人精品国产亚洲| 成人午夜精品| 阿v视频在线观看| 美美哒免费高清在线观看视频一区二区| 91高清一区| 欧美99在线视频观看| 欧美中文字幕一区二区| 欧美xxxx在线| 国产精品色在线网站| 亚洲国产中文在线| 亚洲精品在线a| 一区二区在线视频观看| 日韩视频在线直播| heyzo欧美激情| 国产精品毛片久久久| 中文字幕视频精品一区二区三区| 日韩黄色免费网站| 久久久国产精品入口麻豆| 日韩电影在线观看一区| 日韩视频一二区| 国产精品毛片久久久| 欧美一级全黄| 亚洲天堂久久| 激情91久久| 丝袜脚交一区二区| 四虎8848精品成人免费网站| av在线中出| 深夜成人福利| 欧美影视一区| 国内精品美女在线观看| 亚洲一区二区三区久久久| 国产麻豆一区二区三区精品视频| 国产亚洲电影| 成人av婷婷| 欧美一级精品片在线看| 欧美体内she精视频在线观看| 中日韩视频在线观看| sm捆绑调教国产免费网站在线观看 | 日韩经典一区二区| 精品视频亚洲| 欧美在线资源| 欧美在线综合| 精精国产xxxx视频在线野外| 日韩精品国产欧美| 亚洲第一论坛sis| 国产精品极品| 欧美在线亚洲| 国产精品粉嫩| 麻豆视频一区二区| 日韩二区三区四区| 激情欧美一区| av中文字幕在线观看第一页| 国产91在线播放精品| 亚洲午夜国产成人| 国产无遮挡裸体免费久久| 伊人青青综合网| 日韩成人影院| 欧美精品1区| 欧美久久精品| 久久亚洲风情| 成人国产精品一区二区免费麻豆| 综合久久伊人| 久久久噜噜噜久久狠狠50岁| 亚洲一区日本| 国产精品麻豆成人av电影艾秋| 国产精品免费精品自在线观看| 好吊妞视频这里有精品| 中文精品在线| 日本在线一区二区| 亚洲女娇小黑人粗硬| 在线看片不卡| 日韩欧美一区二区三区在线观看| 国产成人1区| 国产一区二区三区四区三区四| 91中文字幕精品永久在线| 国内精品久久久久久久影视蜜臀| 国产日本亚洲| 免费欧美日韩| 六月婷婷色综合| 精品一区av| 极品美女一区| 96视频在线观看欧美| 欧美天天综合|