一句话生成完整短剧，南洋理工团队提出分层Agent框架，AI短剧生产走向标准化文章

36kr 资讯2026-05-27NEWSzh作者: 学术头条

摘要

近年来，视频基础模型的快速发展，显著提升了自动化短片生成的能力。诸如 Sora、Kling、Seedance、Veo 等模型，已经在 one-shot 视频生成上展现出强大能力。不过，现有短剧生产通常依靠大语言模型（LLM）的 one-shot 生成和松散耦合的工作流，依然存在三方面不足：叙事节奏偏弱，开场不够抓人，剧情冲突张力不足；空间一致性不足，镜头切换后场景布局与人物位置难以保持连贯；质量控制仍不成熟，生成过程仍需大量人工审查与修正。针对这个问题，来自南洋理工大学的研究团队及其合作者发布了分层 Agent 框架“一句话一短剧”（One Sentence, One Drama）。用户仅需提供一句创意，该 Agent 框架就能得到一部制作完整、画面精美的个性化短剧内容。论文链接：https://arxiv.org/abs/2605.22144 为了评估短剧生成效果，研究团队在标准视频质量指标基础上加入了短剧特有标准。实验结果显示，One Sentence, One Drama在叙事质量、跨镜头一致性和整体观看体验上都显著优于现有流水线。这也表明，随着Agent 驱动的结构化流程不断完善，短剧乃至更长视频内容正迈向质量可控的生产阶段。图｜从一句话到一部完整短剧。一句话生成短剧，如何实现？据论文描述，整个自动化视频生产流程分为四步：故事生成、视觉素材与提示词生成、通过 3D 场景锚定实现一致的首帧生成、后期制作。审阅环节贯穿始终，负责视频的质量控制。图｜个性化短剧生成流水线分为四个阶段。故事生成：Agent 先通过检索和多 Agent 辩论，生成结构化故事和分镜脚本；再调用从约 300 部高质量短剧中拆解出的节奏模式库和因果逻辑库，按事实、逻辑和节奏三个维度组合叙事单元，搭建出一个可控的短剧框架。图｜基于多 Agent 辩论的故事生成框架。视觉素材与提示词生成：Agent 先生成场景全景图和角色参考图，再为每个片段生成首帧与视频提示词。首帧提示词定义第一帧的构图与视角，视频提示词描述后续动作、人物互动和镜头推进。生成前，审阅模块会检查空间关系和道具是否连贯，有问题就重写。

一句话生成完整短剧，南洋理工团队提出分层Agent框架，AI短剧生产走向标准化文章

摘要

相关事件

相关公司

相关人物

相关产品查看全部 (2)

相关技术查看全部 (10)

一句话生成完整短剧，南洋理工团队提出分层Agent框架，AI短剧生产走向标准化 文章

摘要

相关事件

相关公司

相关人物

相关产品查看全部 (2)

相关技术查看全部 (10)

一句话生成完整短剧，南洋理工团队提出分层Agent框架，AI短剧生产走向标准化文章