让 LLM 在长文档写作中实现多轮可控文本编辑

最终分组勾勒出LLM在长文档多轮可控编辑领域的全景技术栈：从底层的“闭环迭代优化”与“细粒度属性控制”算法，到中层的“长文档结构化规划”架构，再到顶层的“人机协同交互”界面以及横向贯穿的“评测基准与数据集建设”。研究趋势清晰地反映出模型正从“单次文本生成器”演进为“具备规划能力、可接受精细指令、并能在交互中持续进化的智能写作合伙人”。

共 99 篇文献，5 个研究方向

迭代式自我修正与反馈强化学习机制

该组研究聚焦于通过“评价-修正”（Critique-Refine）闭环提升文本质量。研究重点包括利用LLM自我反馈、过程监督、强化学习（DPO/RLHF）以及自博弈策略，解决多轮交互中的错误累积和性能退化问题，使模型在多次迭代中逐步逼近目标要求。相关文献: Haizhou Shi et. al, 2025 等 20 篇文献

细粒度属性控制与局部文本编辑技术

此类研究侧重于对文本特定属性（如风格、语气、长度、事实一致性）的精准操纵，而非全局重写。技术手段包括潜在空间调制、能量模型定位、扩散模型应用及指令微调，旨在实现“就地编辑”（In-place editing）和意图自适应的微调。相关文献: Kexin Yang et. al, 2022 等 23 篇文献

长文档生成的结构化规划与层次化建模

针对长文档写作中的逻辑连贯性和长程依赖挑战，这些研究提出了“分而治之”的策略。包括任务分解（如从大纲到正文）、层次化递归规划、图结构内存管理以及多智能体协作流（如执行者与评审者分离），以超越单一上下文窗口的限制。相关文献: Yushi Bai et. al, 2024 等 15 篇文献

人机协同交互系统与多模态写作辅助

该方向关注写作过程中的用户体验与交互界面设计。研究涵盖了支持语音、视觉反馈及VR的编辑界面，探讨了如何通过“共享控制”增强用户的创作归属感，以及利用合成数据增强模型在实际写作场景下的交互效率。相关文献: Yong Yang et. al, 2025 等 18 篇文献

多轮编辑评测基准、数据集与度量指标

本组文献致力于构建科学的评价体系。除了开发针对长文本修订、科学写作及学生对话的高质量数据集外，还提出了如“修订距离”、组合可控性评估等新型度量指标，旨在量化模型在多轮交互中的事实性、一致性和鲁棒性。相关文献: Xiang Chen et. al, 2023 等 23 篇文献

总计99篇相关文献

EdiText: Controllable Coarse-to-Fine Text Editing with Diffusion Language Models

EdiText：基于扩散语言模型的可控粗粒度到细粒度文本编辑方法

Che Hyun Lee, Heeseung Kim, Ji-Ran Yeom 等, 2025-No journal

We propose EdiText, a controllable text editing method that modifies the reference text to desired attributes at various scales. We integrate an SDEdit-based editing technique that allows for broad adjustments in the degree of text editing. Additionally, we introduce a novel fine-level editing method based on self-conditioning, which allows subtle control of reference text. While being capable of editing on its own, this fine-grained method, integrated with the SDEdit approach, enables EdiText to make precise adjustments within the desired range. EdiText demonstrates its controllability to robustly adjust reference text at a broad range of levels across various tasks, including toxicity control and sentiment control.