PaperBench: Evaluating AI’s Ability to Replicate AI Research 文章

OpenAI Blog2025-04-02BLOGen

查看原文 →

2

相关事件

0

相关公司

0

相关人物

1

相关产品

0

相关技术

摘要

We introduce PaperBench, a benchmark evaluating the ability of AI agents to replicate state-of-the-art AI research.

相关事件查看全部 (2)

PaperBench: Evaluating AI’s Ability to Replicate AI Research

2025-04-02BREAKTHROUGH影响: HIGH

PaperBench: Evaluating AI’s Ability to Replicate AI Research

2025-04-02PRODUCT_LAUNCH影响: MEDIUM

相关公司

暂无数据

相关人物

暂无数据

相关产品查看全部 (1)

PaperBench

OPEN_SOURCE

相关技术

暂无数据