主页 > 快资讯 > 正文

OpenAI再推GPT-5.2-Codex:AI编程与网络安全双提升,挑战谷歌优势

2025-12-19 10:27来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  OpenAI在AI编程领域再掀波澜,正式推出基于GPT-5.2架构优化的新一代智能体编码模型GPT-5.2-Codex。这款被定位为"最先进专业编码助手"的模型,不仅在编码性能上实现突破性提升,更将防御性网络安全能力作为核心发展方向,标志着AI在软件工程领域的应用进入新阶段。据官方披露,该模型已在付费ChatGPT用户端全面上线,API接口开放工作正在稳步推进。

  在权威基准测试中,GPT-5.2-Codex展现出显著优势:SWE-Bench Pro测试准确率达56.4%,Terminal-Bench 2.0测试准确率达64.0%,两项指标均刷新行业纪录。相较于前代GPT-5.1-Codex的50.8%和58.1%,以及基础版GPT-5.2的55.6%和62.2%,新模型在解决实际软件工程任务和真实终端环境操作方面实现质的飞跃。测试场景涵盖代码补丁生成、编译调试、模型训练、服务器配置等复杂工程任务,充分验证其大规模实战能力。

  针对专业软件工程需求,研发团队着重强化三大核心能力:通过上下文压缩技术提升长周期工作稳定性,在代码重构与迁移等项目级任务中表现更优;优化Windows环境适配性,显著改善跨平台开发体验;增强视觉理解能力,可精准解析屏幕截图、技术图表和用户界面,实现设计稿到功能原型的快速转化。这些改进使模型能够持续跟踪大型代码库中的复杂任务,即使面对计划变更或尝试失败仍能保持上下文完整性。

  网络安全能力的跃升成为最大亮点。OpenAI安全评估显示,从GPT-5-Codex到GPT-5.2-Codex经历三次能力飞跃,当前模型已具备解决专业级多步骤安全挑战的能力。在近期真实案例中,安全研究人员使用前代模型GPT-5.1-Codex-Max进行防御性研究时,意外发现React框架中三个未知安全漏洞,其中涉及源代码暴露风险的高危漏洞已及时向开发团队披露。这一发现印证了AI在主动防御领域的巨大潜力。

  为应对能力提升带来的安全挑战,OpenAI同步推出多重防护机制。模型层面实施专项安全训练,重点防范有害任务执行和提示注入攻击;产品层面构建智能体沙箱环境,配置可定制网络访问权限。更引人注目的是"可信访问计划"试点,该计划仅向通过审查的安全专业人员开放,获准者可使用最先进模型开展授权红队测试、漏洞研究等合法双重用途工作,突破传统安全研究的限制条件。公司CEO萨姆·奥尔特曼强调:"我们正处于技术产生真实影响的阶段,这些模型将为网络安全带来净收益。"

  此次发布延续了OpenAI在AI编程领域的强势攻势。上周该机构刚宣布GPT-5.2的Thinking版本在编码能力测试中超越人类专家水平,此次针对性优化Codex系列,被视为对谷歌Gemini 3在工程应用领域取得进展的直接回应。随着API接口逐步开放,开发社区将迎来更强大的智能编程工具,而网络安全领域的攻防博弈也可能因此进入全新维度。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
12月21日“大力神杯”空降青岛!世界杯官方指定 12月21日“大力神杯”空降青岛!世界杯官方指定

球迷们集合啦,大力神杯即将空降青岛!12月21日,青岛奥帆中心将迎来一场足

快资讯2025-12-19

消息称纳德拉整顿微软管理层:不适应AI高压节奏 消息称纳德拉整顿微软管理层:不适应AI高压节奏

12 月 19 日消息,科技媒体 Business Insider 于 12 月 17 日发布博文,报道称微软首席

快资讯2025-12-19

国产GPU迎战英伟达H200 国产GPU迎战英伟达H200

2025年12月17日,沐曦股份在科创板上市,首日收盘价829.90元,较发行价104.66元上

快资讯2025-12-19

AI浪潮下蚂蚁阿福崛起,百度医疗广告基本盘或遭 AI浪潮下蚂蚁阿福崛起,百度医疗广告基本盘或遭

在AI原生应用领域,蚂蚁推出的阿福(原蚂蚁AQ)正以惊人的速度崛起。这款应

快资讯2025-12-19

24口与48口交换机怎么选?从端口到成本全方位对 24口与48口交换机怎么选?从端口到成本全方位对

在企业网络建设中,交换机作为核心设备,其端口数量直接影响设备连接规模与

快资讯2025-12-19

银河麒麟高可用集群软件V11:智能迁移多手段保 银河麒麟高可用集群软件V11:智能迁移多手段保

在企业数字化转型加速推进的背景下,核心业务系统面临高并发访问、海量数据

快资讯2025-12-19

广电192G流量卡真实测评:月租流量有玄机,哪些 广电192G流量卡真实测评:月租流量有玄机,哪些

最近,一款名为广电192G流量卡的产品在网络上引发了广泛讨论。其宣传语“月

快资讯2025-12-19

OpenAI升级ChatGPT AI助理,优先保护未成年人安全 OpenAI升级ChatGPT AI助理,优先保护未成年人安全

12 月 19 日消息,据科技媒体 The Verge 今天报道,OpenAI 正在对旗下的聊天机器人

快资讯2025-12-19

最强编程模型!OpenAI发布GPT-5.2-Codex 最强编程模型!OpenAI发布GPT-5.2-Codex

12月19日消息,OpenAI今天正式推出GPT-5.2-Codex,官方直言这是迄今最先进的智能体

快资讯2025-12-19

苹果大幅降低日本“苹果税” 中国抽成仍全球最 苹果大幅降低日本“苹果税” 中国抽成仍全球最

12月19日消息,目前中国的“苹果税”仍然是全球最高,这早已引起了国内用户

快资讯2025-12-19