HugMap
人工智能
云计算
半导体
网络安全
企业软件
区块链
量子计算
生物科技
新能源与智能制造
智能穿戴
机器人
智能手机
图谱探索
趋势分析
登录
注册
The Necessity of a Unified Framework for LLM-Based Agent Evaluation
文章
ArXiv CS.AI
2026-05-27
NEWS
en
作者: Pengyu Zhu, Li Sun, Philip S. Yu, Sen Su
大语言模型
查看原文
→
关系图谱
概览
相关事件
相关公司
相关人物
相关产品
相关技术
The Necessity of a Unified Framework for LLM-Based Agent Evaluation · 相关技术
相关技术
gin
ORM
ODE
PLA
LLM
language model
研究法辛烷值
prompt engineering
eval
Unified
Tools
Straight-Through Estimator
Stan
SUL
SSE
SAGE
Prompt
Parts-of-Speech (POS) tags
LMM
large language models
LLM-based agent
HIS
Grouped Memorization Evaluation
For
FFI
DiT
AnE
ARG
ANN
Agent