OpenAI 发布了全新的 GPT-5.2 模型家族,主打专业知识工作、长程规划与智能体(agent)执行能力的全面升级。
新系列将以 GPT-5.2 Instant、GPT-5.2 Thinking 与 GPT-5.2 Pro 三种形态登陆 ChatGPT,并同步开放 API,让用户从轻量问答到深度推理再到专家级工作流程,都能找到对应的模型形态。
在能力层面,GPT-5.2 在多个核心基准上继续提升。
在经济价值评估(GDPval)上成绩领先,同样在长链条任务和职业技能类测试中表现亮眼:GPT-5.2 Thinking 在 44 个专业领域的知识工作测试中,有 70% 以上的结果达到或超越人类行业专家水平。代码能力方面,在 SWE-Bench Pro 与 SWE-Bench Verified 这类复杂度更高的基准上也取得了更高得分,尤其在大规模代码库的分析、重构与修复任务上,展现了更强的稳定性与工程实用性。
整体来看,GPT-5.2 的定位算是一次常规迭代,其往“可持续执行复杂任务”的智能体方向更加迈进一步,为企业级工作流、深度工具调用和专业内容生产提供更长程、更可靠的基础模型。

新系列将以 GPT-5.2 Instant、GPT-5.2 Thinking 与 GPT-5.2 Pro 三种形态登陆 ChatGPT,并同步开放 API,让用户从轻量问答到深度推理再到专家级工作流程,都能找到对应的模型形态。
在能力层面,GPT-5.2 在多个核心基准上继续提升。
在经济价值评估(GDPval)上成绩领先,同样在长链条任务和职业技能类测试中表现亮眼:GPT-5.2 Thinking 在 44 个专业领域的知识工作测试中,有 70% 以上的结果达到或超越人类行业专家水平。代码能力方面,在 SWE-Bench Pro 与 SWE-Bench Verified 这类复杂度更高的基准上也取得了更高得分,尤其在大规模代码库的分析、重构与修复任务上,展现了更强的稳定性与工程实用性。
整体来看,GPT-5.2 的定位算是一次常规迭代,其往“可持续执行复杂任务”的智能体方向更加迈进一步,为企业级工作流、深度工具调用和专业内容生产提供更长程、更可靠的基础模型。










