一句话生成完整短剧,南洋理工团队提出分层Agent框架,AI短剧生产走向标准化 文章

36kr 资讯2026-05-27NEWSzh作者: 学术头条

摘要

近年来,视频基础模型的快速发展,显著提升了自动化短片生成的能力。诸如 Sora、Kling、Seedance、Veo 等模型,已经在 one-shot 视频生成上展现出强大能力。 不过,现有短剧生产通常依靠大语言模型(LLM)的 one-shot 生成和松散耦合的工作流,依然存在三方面不足: 叙事节奏偏弱,开场不够抓人,剧情冲突张力不足; 空间一致性不足,镜头切换后场景布局与人物位置难以保持连贯; 质量控制仍不成熟,生成过程仍需大量人工审查与修正。 针对这个问题,来自南洋理工大学的研究团队及其合作者发布了分层 Agent 框架“一句话一短剧”(One Sentence, One Drama)。用户仅需提供一句创意,该 Agent 框架就能得到一部制作完整、画面精美的个性化短剧内容。 论文链接:https://arxiv.org/abs/2605.22144 为了评估短剧生成效果,研究团队在标准视频质量指标基础上加入了短剧特有标准。实验结果显示,One Sentence, One Drama在叙事质量、跨镜头一致性和整体观看体验上都显著优于现有流水线。 这也表明,随着Agent 驱动的结构化流程不断完善,短剧乃至更长视频内容正迈向质量可控的生产阶段。 图|从一句话到一部完整短剧。 一句话生成短剧,如何实现? 据论文描述,整个自动化视频生产流程分为四步:故事生成、视觉素材与提示词生成、通过 3D 场景锚定实现一致的首帧生成、后期制作。审阅环节贯穿始终,负责视频的质量控制。 图|个性化短剧生成流水线分为四个阶段。 故事生成:Agent 先通过检索和多 Agent 辩论,生成结构化故事和分镜脚本;再调用从约 300 部高质量短剧中拆解出的节奏模式库和因果逻辑库,按事实、逻辑和节奏三个维度组合叙事单元,搭建出一个可控的短剧框架。 图|基于多 Agent 辩论的故事生成框架。 视觉素材与提示词生成:Agent 先生成场景全景图和角色参考图,再为每个片段生成首帧与视频提示词。首帧提示词定义第一帧的构图与视角,视频提示词描述后续动作、人物互动和镜头推进。生成前,审阅模块会检查空间关系和道具是否连贯,有问题就重写。

相关事件

暂无数据

相关公司

暂无数据

相关人物

暂无数据