刚刚，中国AI闯入全球编程前二，前面只剩Claude 文章

36kr 文章2026-05-27NEWSzh作者: 新智元

摘要

就在今天，Code Arena最新榜单出炉！ Qwen3.7-Max以1541分闯入全球前四，一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。排在它前面的，只剩Claude Opus 4.7和Opus 4.6。换句话说，在全球编程模型的竞技场上，阿里是唯一杀进这张牌桌的中国厂商，仅次于Anthropic，位列第二。 Qwen3.7-Max闯入全球前五唯一非Claude模型其实在Code Arena放榜之前，Qwen3.7-Max在海外开发者圈子里已经杀出了名声。 Atomic Chat做了一场硬碰硬的对比，让Opus 4.7、GPT-5.5和Qwen3.7-Max同台竞技，任务是写一个能自我训练的俄罗斯方块AI。结果，Qwen3.7-Max不仅只用$1.32的token成本就把Opus 4.7和GPT-5.5都超越了，而且性能还提升了56%。另一位海外开发者选择让Qwen3.7-Max构建了一个宇宙的3D模型，效果足以用震撼形容。在「3D像素风微缩宝塔模型」的生成任务中，Qwen3.7-Max的输出速度和质量同样全面胜出。开发者Paul Couvert更是盛赞，Qwen3.7-Max接入Hermes Agent和OpenCode之后，基本可以替掉GPT-5.5和Opus 4.7。编程，太能打了不过跑分再高，不如真刀真枪拉出来练练。我们给Qwen3.7-Max安排了一场硬核的「赛车游戏」挑战。一段详细的Prompt丢进去，不一会儿功夫，Qwen3.7-Max直出一个可玩的HTML的文件。第一版有个小bug，A/D转向键左右搞反了。但经过第二轮简单对话微调，一个体验完整的3D赛车游戏就跑了起来。打开的瞬间，说实话，有点被惊到了。 4车同台，3圈环形赛道竞速，赛道上散落着100多枚金币，碰到障碍物会减速、失控。赛后成绩面板，排名、用时、金币数、最快单圈，一项不缺。但真正让人意外的，是两个只有Qwen3.7-Max做到的细节。一个是开始界面。四个模型横向测完，只有它给游戏做了一个正经的开始页面，点「Start」才进入比赛。

刚刚，中国AI闯入全球编程前二，前面只剩Claude 文章

摘要

相关事件

相关公司

相关人物

相关产品查看全部 (21)

相关技术查看全部 (10)