主页 > 快资讯 > 正文

OpenAI最强AI智能体编程模型:GPT-5.3-Codex登场,基准测试全面霸榜

2026-05-31 22:26来源:Techweb编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。

  附上相关基准测试结果如下:

  在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%;

  在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%;

  最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中,得分从 38.2% 飙升至 64.7%,表明其在复杂环境下的操作能力实现了质的飞跃。

  官方数据显示,该模型不仅在多项编程基准测试中创下新高,运行速度也比前代 GPT-5.2-Codex 提升了 25%。

  OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。

  在 Codex 应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex 正从单一的编程智能体演变为更通用的计算机协作者,大幅降低了构建应用的门槛。

  GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放,涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问,API 版本也将在近期上线。(故渊)

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
猛士M817全球首秀预售开启!美学动力安全智能全 猛士M817全球首秀预售开启!美学动力安全智能全

5月29日,猛士汽车与华为乾崑联合打造的“智能越野第一车”全新猛士M817完成

快资讯2026-05-31

黄仁勋达沃斯实录:几千亿只是开胃菜,AI基建还 黄仁勋达沃斯实录:几千亿只是开胃菜,AI基建还

“我们已经投进去的几千亿美元,只是道开胃菜。要把这套架构真正搭起来,后

快资讯2026-05-31

搭载HarmonyOS 6,华为MatePad Pro 12.2 英寸与华为Mat 搭载HarmonyOS 6,华为MatePad Pro 12.2 英寸与华为Mat

2026年3月23日,在华为春季全场景新品发布会上,华为MatePad Pro 12.2 英寸与华为

快资讯2026-05-31

零跑首款MPV车型D99亮相:定位30万元级旗舰产品 零跑首款MPV车型D99亮相:定位30万元级旗舰产品

12月28日消息,在今日举行的零跑汽车十周年发布会上,旗下首款MPV车型零跑D

快资讯2026-05-31

贾跃亭为还债回北京发布人形机器人:高点晒单 贾跃亭为还债回北京发布人形机器人:高点晒单

2月6日消息,昨天贾跃亭宣布正式进入机器人赛道,作为当下资本市场最关注的

快资讯2026-05-31

黄仁勋达沃斯实录:几千亿只是开胃菜,AI基建还 黄仁勋达沃斯实录:几千亿只是开胃菜,AI基建还

“我们已经投进去的几千亿美元,只是道开胃菜。要把这套架构真正搭起来,后

快资讯2026-05-31

2026科大讯飞学习机怎么选?三款高性价比机型评 2026科大讯飞学习机怎么选?三款高性价比机型评

随着教育科技不断进步,学习机已成为现代家庭辅助孩子学习的重要工具。科大

快资讯2026-05-31

搭载HarmonyOS 6,华为MatePad Pro 12.2 英寸与华为Mat 搭载HarmonyOS 6,华为MatePad Pro 12.2 英寸与华为Mat

2026年3月23日,在华为春季全场景新品发布会上,华为MatePad Pro 12.2 英寸与华为

快资讯2026-05-31

零跑首款MPV车型D99亮相:定位30万元级旗舰产品 零跑首款MPV车型D99亮相:定位30万元级旗舰产品

12月28日消息,在今日举行的零跑汽车十周年发布会上,旗下首款MPV车型零跑D

快资讯2026-05-31

李想:全新理想L9是具身智能机器人的开山之作 李想:全新理想L9是具身智能机器人的开山之作

2月6日消息,日前,理想汽车CEO李想微博发文表示,这两年有很多人问他,是不

快资讯2026-05-31