谷歌给 Android 开发者选模型：GPT-5.5 暂时领先文章

InfoQ 中文2026-06-18BLOGzh作者: Adrian Bridgwater

详细信息

来源站点: InfoQ 中文
作者: Adrian Bridgwater
文章类型: BLOG
语言: zh
发布日期: 2026-06-18

摘要

本文最初发布于 THENEWSTACK 博客。图片来自 Unsplash+ ，由 Sara Oliveira 提供谷歌希望软件开发者在构建 Android 应用时用尽可能好的 AI 模型。因此，该公司在 3 月份推出了基准测试门户 Android Bench。该服务旨在提供一个持续更新的排行榜，供开发者和模型创建者参考。上周，排行榜进行了更新，包括开放权重模型，并新增了延迟、令牌和成本等列。“通过为高质量的 Android 开发设定一个清晰可靠的基准，我们正在帮助模型创建者识别差距并加速改进——这使得开发者能够更高效地工作。”——来自谷歌的 Matthew McCullough。在 3 月份的一篇博文中，谷歌 Android 开发部门产品副总裁 Matthew McCullough 写道，谷歌对顶级的 AI LLM 进行了基准测试，旨在评估这些工具如何构建 Android 应用。McCullough 解释说，“我们的目标是为模型创建者提供一个基准，用于评估 LLM 在 Android 开发中的能力。通过为高质量的 Android 开发设定一个清晰可靠的基准，我们希望可以帮助模型创建者识别差距并加速改进，使他们能够更加高效地工作，让 AI 助手有更广泛的模型可以选择——这最终将提高 Android 生态系统中应用的质量。”GPT 5.5 是目前 Android 开发的最佳 AI 模型这项新服务似乎不提供模型排名随时间上升和下降的历史记录，但 9to5Google 报道称，最后一次 Android Bench 将 Gemini 3.1 Pro 与 OpenAI 的 GPT 5.4 并列为该领域的领导者。根据 5 月 18 日的最新消息，GPT 5.5 目前是 Android 应用开发的最佳 AI 模型。对于 Android Bench 采用的方法，谷歌做了一个公开的说明：“该服务会向 LLM 展示来自开源软件项目的真实问题和拉取请求，从而评估它们生成代码解决问题的能力。这种方法旨在确保任务能够代表开发者每天面临的挑战。”为什么谷歌要构建 Android Bench？谷歌表示，他们之所以构建 Android Bench，是因为基于 AI 的软件工程“已经出现了几个基准”来衡量 LLM 的能力。

谷歌给 Android 开发者选模型：GPT-5.5 暂时领先文章

详细信息

摘要

相关事件

相关公司查看全部 (4)

相关人物查看全部 (1)

相关产品查看全部 (29)

相关技术查看全部 (3)

谷歌给 Android 开发者选模型：GPT-5.5 暂时领先 文章

详细信息

摘要

相关事件

相关公司查看全部 (4)

相关人物查看全部 (1)

相关产品查看全部 (29)

相关技术查看全部 (3)

谷歌给 Android 开发者选模型：GPT-5.5 暂时领先文章