Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents 事件

Name: Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents
Start: 2026-05-29

REGULATION2026-05-29影响: MEDIUM

Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents arXiv:2605.29224v1 Announce Type: new Abstract: AI agents augment large language models with external tools such as web retrieval, enabling grounded and up-to-date responses. However, incorporating external content into the generation pipeline can weaken the safety alignment mechanisms that govern model outputs. Prior work shows that enabling retrieval in agents increases compliance with harmful requests. We

人工智能

关系图谱

Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents 事件

相关公司查看全部 (10)

相关人物查看全部 (3)

相关产品查看全部 (10)

相关技术查看全部 (10)

相关报道查看全部 (1)