A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
3417
Stars
252
Forks
2
技术栈
0
替代方案
3
相关事件