GPT-5.5彻底击穿300个黑客评测任务，仅需5000万Token 事件

Name: GPT-5.5彻底击穿300个黑客评测任务，仅需5000万Token
Start: 2026-05-28

REGULATION2026-05-28影响: MEDIUM

GPT-5.5彻底击穿300个黑客评测任务，仅需5000万Token 316 道进攻性网络安全任务，GPT-5.5 解出了 292 道，正确率高达 92.4%！ 5 月 27 日，澳大利亚研究机构 Lyptus Research 发布报告——GPT-5.5 让他们的整套评估体系饱和了。 https://x.com/LyptusResearch/status/2059428814103642340 7 个基准，涵盖漏洞利用、CTF 夺旗、真实 CVE 复现，每道题都有人类安全专家的完成时间作为基线。 GPT-5.5 展现出了顶级黑客团队的能力。剩下那 24 道没解的题，已经不够画出一条有统计意义的能力曲线。研究团队的判断是，这套评估方法对这类任务「不再适用」。他们 2025 年 12 月开始搭这套测试的时候，选的是全球能找到的最难的题。到 2026 年 3 月第一版报告，数据就出现了饱和苗头。到 5 月，饱和变成了事实。六个月，从「最难」到「不够用」。进步曲线在狂飙这条能力曲线的斜率才是真正吓人的地方。 Ly

人工智能

关系图谱

GPT-5.5彻底击穿300个黑客评测任务，仅需5000万Token 事件

相关公司查看全部 (6)

相关人物查看全部 (1)

相关产品查看全部 (10)

相关技术查看全部 (10)

相关报道查看全部 (1)