tmt_logo

tmt_menu

GPT-5.6位置引发热议，Claude Opus4.8在DeepSWE Bench排名第二

2026.05.31 07:15

Elvis在X平台发文询问GPT-5.6在效率前沿的位置。CHOI回复称Claude Opus4.8在DeepSWE Bench获58%Pass@1，排名第二仅次于GPT-5.5，虽分数稍低但可靠高效。推文发布于2026年5月30日。

Elvis在X平台发文问道：“效率前沿！你认为GPT-5.6会落在哪个位置？”并附上了相关链接。

用户CHOI在这条推文下回复，提到Claude Opus 4.8已在DeepSWE Bench测试中亮相，取得58%的Pass@1成绩，总排名第二，仅次于GPT-5.5。这一表现延续了Claude系列的一贯趋势——尽管原始分数略逊一筹，但它仍是近期基准测试中最可靠且高效的编码模型之一。

这条推文发布于2026年5月30日晚8点39分，截至目前已有6062次浏览。

作品声明：内容由AI生成

快报

18:46

光洋股份：与盘毂动力签署战略合作框架协议

18:46

4天3板九安医疗：拟不超过1亿元参与认购砺思星雀基金份额，基金主要投资数字科技类计算机及软件技术开发企业

18:45

宝色股份：拟投资9.7亿元建设高端超限装备智能制造项目

18:45

劲旅环境：无人驾驶业务实现营收占公司整体营收比例极小

18:41

国家网信办发布第十八批深度合成服务算法备案信息

18:37

网易灵动披露具身智能落地进展：智能座舱直连千里外高危一线

18:35

申通快递：6月快递服务业务收入54.75亿元，同比增长26.13%

18:34

5天4板信通电子：公司股价自7月以来涨幅达到35.27%，可能存在快速下跌风险

18:32

上交所本周对157起拉抬打压、虚假申报等证券异常交易行为采取自律监管措施

18:31

最大实现1024卡，壁仞科技首次推出NPO光互连、分布式解耦架构超节点方案

18:30

是石科技发布国产Token优化工厂“拓元”

18:27

中际旭创港股上市获中国证监会备案

18:26

德科立：上半年净利同比预增217%-277%，数通业务为核心增长引擎、长进光子公允价值收益提升

18:25

中金财富上半年实现净利23.87亿元，已超去年全年

18:23

袁记食品港股IPO获中国证监会备案

18:22

美格智能：端侧AI、机器人等领域是公司产品重要的应用方向，是否能取得预期效益存在不确定性

18:21

本周沪市ETF资金净流入达1068亿元

18:19

美股存储板块盘前拉升，闪迪、美光股价收复所有跌幅，SK海力士涨超5%

18:15

智能体落地要迈过三道坎，AI智能体耗电是聊天机器人136倍

18:14

TCL中环：子公司拟投资119.6亿元建设集成电路用半导体大硅片深圳项目