OpenAI GPT-5.5 Instant成ChatGPT默认模型：敏感领域幻觉减少，数学得分提升15.8分

2026.05.06 01:18

OpenAI近日发布GPT-5.5 Instant，替代GPT-5.3 Instant成为ChatGPT默认模型。该模型在法律、医疗等敏感领域幻觉减少，保持低延迟，AIME2025数学测试得分81.2（前代为65.4），MMMU-Pro多模态推理76.0（前代为69.2）。Plus和Pro用户可享上下文管理功能，后续扩展至其他用户。

OpenAI一直是全球人工智能研究领域的引领者，持续推动大语言模型的迭代升级。近日，该机构宣布推出GPT-5.5 Instant模型——继上月GPT-5.5系列发布后的又一重要更新，它将替代GPT-5.3 Instant成为ChatGPT的默认模型，目标是进一步优化用户体验，同时增强模型在专业领域的可靠性。

GPT-5.5 Instant在关键性能指标上有了明显提升。在AIME 2025数学测试中，它拿到81.2分，比前代的65.4分提高了15.8分；MMMU-Pro多模态推理基准测试中得分76.0，较前代的69.2分增长6.8分。值得注意的是，模型在法律、医疗、金融等敏感领域的幻觉问题显著减少，同时还保持了和前代相近的低延迟，确保用户交互的流畅度。

这款模型的核心改进主要体现在三个方向。首先，针对敏感领域的幻觉问题，OpenAI通过加强领域特定数据训练和事实核查机制，提升了模型输出的准确性；其次，在数学与多模态推理能力上，团队优化了模型架构，增强了逻辑推理和跨模态信息整合能力；最后，上下文管理功能也有了突破，GPT-5.5 Instant能通过内置搜索工具关联过往对话记录、上传文件和Gmail内容，为用户提供更个性化的回答。目前，这个上下文管理功能已经向ChatGPT Plus和Pro用户开放，计划近期扩展到移动端，未来几周内还会覆盖Free、Go Business及企业用户。

GPT-5.5 Instant的推出，不仅提升了ChatGPT的基础性能，更强化了其在专业场景的适用性，给法律从业者、医疗人员和金融分析师等提供了更可靠的辅助工具。同时，上下文管理功能的优化，进一步增强了模型的个性化交互能力，也提高了用户粘性。

从行业趋势来看，近期全球AI模型朝着专业化、低延迟的方向发展趋势很明显，企业对AI辅助工具的需求持续增长，麦肯锡最新报告指出，2024年全球AI应用市场规模预计同比增长35%。竞争对手这边，Google最近更新了Gemini Advanced模型，加强了多模态推理和企业级安全功能；Anthropic则推出了Claude 3.5 Sonnet，重点提升长文本处理能力和事实准确性，AI领域的技术竞争正在加速推动整个行业的进步。

作品声明：内容由AI生成