STORM:是一个创新的写作系统
由斯坦福大学研究人员开发,旨在利用大语言模型自动化从头开始编写具有维基百科一样有广度和深度的长篇文章。
STORM能自动收集多角度信息并模拟像专家提问的对话过程创建大纲,最终生成带有引文的文本,并逐节撰写完整的文章。
主要挑战和解决方案:
挑战:维基百科样式的文章要求深入研究和计划,包括广泛收集参考资料和精心制作大纲。现有的生成维基百科文章的工作往往绕过了这一写作前阶段。
解决方案:STORM通过模拟人类写作过程中的预写、起草和修订阶段,特别是在预写阶段,通过有效的问题提问来自动化这一过程。
STORM的工作流程:
1、发现不同视角:STORM首先通过检索和分析与给定话题相似的维基百科文章,从多个来源和角度探索话题,以确保内容的全面性和深度,发现研究话题时的多样视角。
2、模拟对话:接着,系统模拟作家向话题专家提出问题的对话过程。这一步骤使用LLMs生成深入的问题,目的是从不同的视角深化对话题的理解。这些对话基于互联网上的可信资源。
3、创建大纲:基于收集到的信息和提出的问题,STORM自动创建文章的大纲。这个大纲旨在组织文章结构,确保内容覆盖广度和深度。
在最后的写作阶段,STORM 生成带有引文的文本,并逐节撰写完整的文章。
STORM系统旨在解决以下主要问题:
1、写作前研究的自动化:在传统的长篇文章写作过程中,写作前的研究(包括话题研究、信息收集和大纲制作)是一项耗时且复杂的任务。STORM通过自动化这一过程,帮助作者高效地收集和组织所需的信息,从而提高写作效率。
2、多视角信息的整合:对于任何给定话题,从不同的视角探索和理解信息是产生全面且深入文章的关键。STORM通过模拟对话式问题提问,自动从多个视角收集和整理话题相关信息,确保文章内容的全面性和深度。
3、生成结构化的文章大纲:一个清晰、有逻辑的文章大纲是高质量写作的基础。STORM系统创新地利用检索到的信息和提出的问题自动创建大纲,帮助作者在写作过程中保持组织性和目标明确。
4、提高文章质量:通过上述自动化的写作前研究和大纲制作过程,STORM旨在生成组织性更强、内容覆盖更广的文章,从而直接提高最终文章的质量。
评估结果:
FreshWiki数据集:为了评估STORM系统,研究团队创建了FreshWiki数据集,这是一个包含最新高质量维基百科文章的数据集,用于测试系统生成文章的质量。
大纲质量评估:通过专家评审和自动化评估方法,STORM生成的大纲在组织性和覆盖广度方面表现优异,相比于基线模型,显示出显著的改进。
写作质量提升:相比于基于大纲驱动的检索增强基线生成的文章,STORM生成的文章在组织性(绝对增加了25%)和覆盖广度(增加了10%)方面表现更佳。
专家反馈:经验丰富的维基百科编辑的反馈也证实了STORM在生成有根据的长篇文章方面的有效性,并指出了未来改进的方向,如源偏见转移和不相关事实的过度关联问题。
论文:https://t.co/g3j6FBJwnU
PDF:https://t.co/mJTYBRGOtA