o3-pro正式推出!說聲“嗨”就花了80美元 思考1+1用時16分鐘
OpenAI深夜放大招,正式推出“最新最强版”推理模型o3-pro!
而且同一时间,o3模型降价80%不降智。
官方测评结果显示,在专家评估中,所有人一致更偏爱o3-pro而非o3的回答。
此外,o3-pro也一举超越o3、o1-pro,成为当前最擅长数学、科学和编程的OpenAI模型。
OpenAI CEO奥特曼也第一时间激动表示:
这真是太聪明了!我第一次看到它相对于o3的胜率时,简直不敢相信。
目前o3-pro已取代o1-pro,面向ChatGPT的Pro和Team用户开放,Enterprise和Edu用户将在下周获得使用权限。
而对开发者来说,o3-pro已经可以通过API接入:
每百万输入tokens收费20美元(约合人民币143元),每百万输出tokens收费80美元(约合人民币574元)。
有多贵呢?
温馨提醒,据称一句简单的“嗨”就花了网友80美元(doge)。
或许OpenAI也意识到这个价格确实有点贵,所以另一边赶紧宣布o3降价80%。
o3降价80%不降智
官网显示,o3的最新API价格如下:
每百万输入tokens收费2美元,每百万输出tokens收费8美元。
对比o1-pro下降了80%以上,不仅是o3-pro的1/10,而且和GPT-4o(每百万输入/输出分别为2.5美元和10美元)基本持平。
至于降价原因,明面上的说法是OpenAI对推理服务架构进行了全面优化。
就是说,虽然o3和o3-pro底层模型相同,但由于推理更高效,所以价格自然就下调了。
不过,就在奥特曼对这一价格“沾沾自喜”时,关于o3“是否真的没有降智”却陷入了争议。
网友们也是相当直白,在奥特曼这条推文底下直接表达了怀疑:
甚至有博主以亲身经历(暂无法确定真实性)出来发声,认为o3在实测中变笨了。
OpenAI降价并非出于慈善……
然而这一说法也遭到了其他网友的反驳,总体来看目前对峙双方并未就这一争议拿出实质性证据。
虽然争议尚未讨论出具体结果,但一些关于o3-pro的测试结果已经新鲜出炉。
和开头所提一致,官方在更严格的“4/4可靠性”评估中也验证了o3-pro尤为擅长数学、科学和编程。
p.s. 这项评估需要o3-pro在四次尝试中(而不仅仅是一次,pass@1)正确回答问题~
不过官方也多次提醒,由于o3-pro可以使用工具,因此响应时间通常比o1-pro更长。
我们建议将其用于对可靠性要求更高的棘手问题,等待几分钟是值得的。
这也和一众网友实测下来的感受相符,o3-pro确实变强了,能够解决一些其他模型无法答对的问题,不过由于响应变慢,价格也是真贵。
HyperWriteAI CEO让它思考“1+1=?”,结果往往需要耗时1分钟以上(第一次问甚至用时16分钟)。
当然,这也恰好代表了o3-pro的错误打开方式。
不论是官方建议还是一些好的网友实测结果,都说明o3-pro更适合挑战一些有难度、有价值的问题。
宾大教授Ethan Mollick分享了一个其他模型都曾铩羽而归的问题:从“SPACE”到“EARTH”制作一个单词阶梯。
这个游戏需要模型从“SPACE”到“EARTH”,每次只改变一个字母,单词真实有效且长度不变(右侧为解释“为什么这是一个合法的英语单词”)。
而o3-pro成功完成了挑战,并且这不是模型通过联网搜索得到的答案(即通过推理得到)。
另一位生物医学科学家也分享了与o3-pro合作开发免疫系统的例子。
作为对比,他也向o3提出了同一任务(要求先识别出人类天然免疫系统的关键局限性),结果表明o3-pro更胜一筹。
o3列出的前五个问题虽然强调了类似的重要问题,但后两个问题无需彻底重构免疫系统即可解决。
相比之下,o3-pro不仅提出了更多限制,而且它所指出的每一个限制都是极其关键、内在的问题,需要彻底重构。
整体而言,通过ARC-AGI测试结果可以看到,o3-pro在高难任务上表现略好,但提升幅度不大,且成本随难度上升。
p.s. 这项测试主要考验AI在面对新问题时的抽象推理和问题解决能力~
奥特曼发小作文
这是我最后一次在没有任何人工智能帮助的情况下写这样的文章了。
有意思的是,同一时间奥特曼也火速发了一篇小作文——
题目为《The Gentle Singularity(温和的奇点)》,来探讨AI发展对人类社会的影响。
其主要观点包括下面这些:
1、2025年,我们迎来了能够真正进行认知工作的智能Agent,编写计算机代码的方式将彻底改变。2026年,我们很可能会看到能产生原创见解的系统;2027年,或许会出现能在现实世界中执行任务的机器人。
2、到了2030年代,智慧和能源——即想法及实现想法的能力——将变得极其丰富。这两者长期以来一直是人类进步的基本限制;如果智慧和能源变得充足(加上良好的治理),理论上我们可以实现一切。
3、随着数据中心的生产逐渐自动化,智能的成本最终应该会接近电力成本。(很多人关心ChatGPT每次查询用多少能量;平均每次查询大约耗电0.34瓦时,大概相当于烤箱运行一秒多一点,或高效灯泡使用几分钟。此外,每次查询大约用水0.000085加仑,约等于十五分之一茶匙。)
4、相比AI,人类有一个长期且重要的优势:我们天生在意他人,以及他人怎么想、怎么做,而对机器却没什么感情。
5、从相对论的角度看,奇点是一点点发生的,融合是逐步进行的。我们正攀登那条技术指数增长的长弧线;向前看总觉得是陡峭的垂直,向后看则像是平缓的线,但其实它是一条平滑的曲线。(回想2020 年,如果那时我们说2025年会接近 AGI,听起来会很疯狂,但对比过去五年所发生的一切,也许现在的预测不那么疯狂了。)
6、我们(整个行业,不只是OpenAI)正在为世界构建一个大脑,它的极限将取决于我们的好点子。
7、OpenAI如今做的事情很多,但最根本的身份仍是一个超级智能研究公司。
BTW,奥特曼最新推文有透露,原计划中的公开权重模型要推迟了。
嗯,又一个期货(doge)~
完整小作文地址如下:https://blog.samaltman.com/the-gentle-singularity
参考链接:
[1]https://x.com/OpenAI/status/1932530409684005048
[2]https://x.com/OpenAIDevs/status/1932532777565446348
[3]https://x.com/aidan_mclau/status/1932507602216497608[4]https://x.com/sama/status/1932547247243505924
推薦系統(tǒng)
雨林木風(fēng) winxp下載 純凈版 永久激活 winxp ghost系統(tǒng) sp3 系統(tǒng)下載
系統(tǒng)大小:0MB系統(tǒng)類型:WinXP雨林木風(fēng)在系統(tǒng)方面技術(shù)積累雄厚深耕多年,打造了國內(nèi)重裝系統(tǒng)行業(yè)知名品牌,雨林木風(fēng)WindowsXP其系統(tǒng)口碑得到許多人認(rèn)可,積累了廣大的用戶群體,是一款穩(wěn)定流暢的系統(tǒng),雨林木風(fēng) winxp下載 純凈版 永久激活 winxp ghost系統(tǒng) sp3 系統(tǒng)下載,有需要的朋友速度下載吧。
系統(tǒng)等級:進(jìn)入下載 >蘿卜家園win7純凈版 ghost系統(tǒng)下載 x64 聯(lián)想電腦專用
系統(tǒng)大小:0MB系統(tǒng)類型:Win7蘿卜家園win7純凈版是款非常純凈的win7系統(tǒng),此版本優(yōu)化更新了大量的驅(qū)動,幫助用戶們進(jìn)行舒適的使用,更加的適合家庭辦公的使用,方便用戶,有需要的用戶們快來下載安裝吧。
系統(tǒng)等級:進(jìn)入下載 >雨林木風(fēng)xp系統(tǒng) xp系統(tǒng)純凈版 winXP ghost xp sp3 純凈版系統(tǒng)下載
系統(tǒng)大小:1.01GB系統(tǒng)類型:WinXP雨林木風(fēng)xp系統(tǒng) xp系統(tǒng)純凈版 winXP ghost xp sp3 純凈版系統(tǒng)下載,雨林木風(fēng)WinXP系統(tǒng)技術(shù)積累雄厚深耕多年,采用了新的系統(tǒng)功能和硬件驅(qū)動,可以更好的發(fā)揮系統(tǒng)的性能,優(yōu)化了系統(tǒng)、驅(qū)動對硬件的加速,加固了系統(tǒng)安全策略,運(yùn)行環(huán)境安全可靠穩(wěn)定。
系統(tǒng)等級:進(jìn)入下載 >蘿卜家園win10企業(yè)版 免激活密鑰 激活工具 V2023 X64位系統(tǒng)下載
系統(tǒng)大小:0MB系統(tǒng)類型:Win10蘿卜家園在系統(tǒng)方面技術(shù)積累雄厚深耕多年,打造了國內(nèi)重裝系統(tǒng)行業(yè)的蘿卜家園品牌,(win10企業(yè)版,win10 ghost,win10鏡像),蘿卜家園win10企業(yè)版 免激活密鑰 激活工具 ghost鏡像 X64位系統(tǒng)下載,其系統(tǒng)口碑得到許多人認(rèn)可,積累了廣大的用戶群體,蘿卜家園win10純凈版是一款穩(wěn)定流暢的系統(tǒng),一直以來都以用戶為中心,是由蘿卜家園win10團(tuán)隊推出的蘿卜家園
系統(tǒng)等級:進(jìn)入下載 >蘿卜家園windows10游戲版 win10游戲?qū)I(yè)版 V2023 X64位系統(tǒng)下載
系統(tǒng)大?。?/em>0MB系統(tǒng)類型:Win10蘿卜家園windows10游戲版 win10游戲?qū)I(yè)版 ghost X64位 系統(tǒng)下載,蘿卜家園在系統(tǒng)方面技術(shù)積累雄厚深耕多年,打造了國內(nèi)重裝系統(tǒng)行業(yè)的蘿卜家園品牌,其系統(tǒng)口碑得到許多人認(rèn)可,積累了廣大的用戶群體,蘿卜家園win10純凈版是一款穩(wěn)定流暢的系統(tǒng),一直以來都以用戶為中心,是由蘿卜家園win10團(tuán)隊推出的蘿卜家園win10國內(nèi)鏡像版,基于國內(nèi)用戶的習(xí)慣,做
系統(tǒng)等級:進(jìn)入下載 >windows11下載 蘿卜家園win11專業(yè)版 X64位 V2023官網(wǎng)下載
系統(tǒng)大小:0MB系統(tǒng)類型:Win11蘿卜家園在系統(tǒng)方面技術(shù)積累雄厚深耕多年,windows11下載 蘿卜家園win11專業(yè)版 X64位 官網(wǎng)正式版可以更好的發(fā)揮系統(tǒng)的性能,優(yōu)化了系統(tǒng)、驅(qū)動對硬件的加速,使得軟件在WINDOWS11系統(tǒng)中運(yùn)行得更加流暢,加固了系統(tǒng)安全策略,WINDOWS11系統(tǒng)在家用辦公上跑分表現(xiàn)都是非常優(yōu)秀,完美的兼容各種硬件和軟件,運(yùn)行環(huán)境安全可靠穩(wěn)定。
系統(tǒng)等級:進(jìn)入下載 >
相關(guān)文章
- Win10支持倒計時 微軟還在添堵!最新補(bǔ)丁偷偷捆綁Bing和Edge
- 微軟首次!Win11六月更新緊急叫停:出現(xiàn)兼容性問題、修復(fù)版正在路上
- 注意了!微軟Outlook收緊安全網(wǎng):默認(rèn)攔截更多附件
- 華為新品震撼發(fā)布 鴻蒙5全面覆蓋手機(jī)、平板、電腦、穿戴等全場景多終端
- 科技春晚落幕:蘋果又一次擠牙膏
- 去年大肆宣傳的AI功能沒有兌現(xiàn):蘋果今年不敢畫餅了
- 除夕億級微信紅包零誤差 背后技術(shù)獲中國專利金獎
- 體驗了一天iOS 26后 我勸安卓們這回別學(xué)了
- 銀河麒麟系統(tǒng)最新升級:跨架構(gòu)、換設(shè)備都不限制激活!
- 廠商實現(xiàn)iOS 26的設(shè)計并不難:困難的是功耗流暢度能不能做好
- 個性化Siri跳票!蘋果高管解釋原因
- iOS 26被低估了!ColorOS陳希:設(shè)計引領(lǐng)行業(yè)
- iOS 26上手:第一眼就不一樣 但AI缺席
- 大模型讓P圖師也失業(yè)了 留給人類的職業(yè)真不多了
熱門系統(tǒng)
推薦軟件
推薦應(yīng)用
推薦游戲
熱門文章
常用系統(tǒng)
- 1【CAD/動畫/媒體制作】Windows10 64位 專業(yè)工作站版
- 2雨林木風(fēng)64位穩(wěn)定版 win7改良版下載 ghost鏡像 免激活工具下載
- 3深度技術(shù)WINDOWS10游戲版 GHOST X64位 V2022.04下載
- 4系統(tǒng)之家win10企業(yè)版 x64位簡體中文版 ghost鏡像下載 v2023
- 5【安全無廣告】Win11 23H2 64位 專業(yè)增強(qiáng)版純凈定制系統(tǒng)鏡像下載
- 6【老機(jī)首選】超流暢 Win7 64位 旗艦精簡版
- 7青蘋果系統(tǒng)win7經(jīng)典版 x64位家庭版下載 GHOST鏡像 筆記本專用下載
- 8風(fēng)林火山win10家庭裝機(jī)版 x64位系統(tǒng)下載 永久免費 中文版免激活下載
- 9Windows7典藏版下載 雨林木風(fēng)64位娛樂版 ghost鏡像下載 免激活工具