谷歌给 Android 开发者选模型:GPT-5.5 暂时领先 文章

InfoQ 中文2026-06-18BLOGzh作者: Adrian Bridgwater

详细信息

来源站点
InfoQ 中文
作者
Adrian Bridgwater
文章类型
BLOG
语言
zh
发布日期
2026-06-18

摘要

本文最初发布于 THENEWSTACK 博客。图片来自 Unsplash+ , 由 Sara Oliveira 提供谷歌希望软件开发者在构建 Android 应用时用尽可能好的 AI 模型。因此,该公司在 3 月份推出了基准测试门户 Android Bench。该服务旨在提供一个持续更新的排行榜,供开发者和模型创建者参考。上周,排行榜进行了更新,包括 开放权重模型,并新增了延迟、令牌 和成本等列。“通过为高质量的 Android 开发设定一个清晰可靠的基准,我们正在帮助模型创建者识别差距并加速改进——这使得开发者能够更高效地工作。”——来自谷歌的 Matthew McCullough。在 3 月份的一篇博文 中,谷歌 Android 开发部门产品副总裁 Matthew McCullough 写道,谷歌对顶级的 AI LLM 进行了基准测试,旨在评估这些工具如何构建 Android 应用。McCullough 解释说,“我们的目标是为模型创建者提供一个基准,用于评估 LLM 在 Android 开发中的能力。通过为高质量的 Android 开发设定一个清晰可靠的基准,我们希望可以帮助模型创建者识别差距并加速改进,使他们能够更加高效地工作,让 AI 助手有更广泛的模型可以选择——这最终将提高 Android 生态系统中应用的质量。”GPT 5.5 是目前 Android 开发的最佳 AI 模型这项新服务似乎不提供模型排名随时间上升和下降的历史记录,但 9to5Google 报道称,最后一次 Android Bench 将 Gemini 3.1 Pro 与 OpenAI 的 GPT 5.4 并列为该领域的领导者。根据 5 月 18 日的最新消息,GPT 5.5 目前是 Android 应用开发的最佳 AI 模型。对于 Android Bench 采用的方法,谷歌做了一个 公开的说明:“该服务会向 LLM 展示来自开源软件项目的真实问题和拉取请求,从而评估它们生成代码解决问题的能力。这种方法旨在确保任务能够代表开发者每天面临的挑战。”为什么谷歌要构建 Android Bench?谷歌表示,他们之所以构建 Android Bench,是因为基于 AI 的软件工程“已经出现了几个基准”来衡量 LLM 的能力。