刚刚,中国AI闯入全球编程前二,前面只剩Claude 文章

36kr 文章2026-05-27NEWSzh作者: 新智元

摘要

就在今天,Code Arena最新榜单出炉! Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。 排在它前面的,只剩Claude Opus 4.7和Opus 4.6。 换句话说,在全球编程模型的竞技场上,阿里是唯一杀进这张牌桌的中国厂商,仅次于Anthropic,位列第二。 Qwen3.7-Max闯入全球前五 唯一非Claude模型 其实在Code Arena放榜之前,Qwen3.7-Max在海外开发者圈子里已经杀出了名声。 Atomic Chat做了一场硬碰硬的对比,让Opus 4.7、GPT-5.5和Qwen3.7-Max同台竞技,任务是写一个能自我训练的俄罗斯方块AI。 结果,Qwen3.7-Max不仅只用$1.32的token成本就把Opus 4.7和GPT-5.5都超越了,而且性能还提升了56%。 另一位海外开发者选择让Qwen3.7-Max构建了一个宇宙的3D模型,效果足以用震撼形容。 在「3D像素风微缩宝塔模型」的生成任务中,Qwen3.7-Max的输出速度和质量同样全面胜出。 开发者Paul Couvert更是盛赞,Qwen3.7-Max接入Hermes Agent和OpenCode之后,基本可以替掉GPT-5.5和Opus 4.7。 编程,太能打了 不过跑分再高,不如真刀真枪拉出来练练。 我们给Qwen3.7-Max安排了一场硬核的「赛车游戏」挑战。 一段详细的Prompt丢进去,不一会儿功夫,Qwen3.7-Max直出一个可玩的HTML的文件。 第一版有个小bug,A/D转向键左右搞反了。 但经过第二轮简单对话微调,一个体验完整的3D赛车游戏就跑了起来。 打开的瞬间,说实话,有点被惊到了。 4车同台,3圈环形赛道竞速,赛道上散落着100多枚金币,碰到障碍物会减速、失控。 赛后成绩面板,排名、用时、金币数、最快单圈,一项不缺。 但真正让人意外的,是两个只有Qwen3.7-Max做到的细节。 一个是开始界面。四个模型横向测完,只有它给游戏做了一个正经的开始页面,点「Start」才进入比赛。