MIT|基于符号引用的可验证文本生成

511次阅读
没有评论

Towards Verifiable Text Generation with Symbolic References

L T Hennigen, S Shen, A Nrusimha, B Gapp, D Sontag, Y Kim
[MIT]

基于符号引用的可验证文本生成

要点:

  • 大型语言模型(LLM)可以生成流畅和合理的文本,但容易出现幻觉,需要进行人工验证以用于高风险的应用。
  • 本文提出符号化基生成(SymGen)方法,以简化LLM输出的验证。SymGen让LLM在生成文本的同时交错生成指向条件数据(如JSON)字段的符号引用。
  • 这些符号引用可明确显示文本片段的来源,减少了人工验证的工作量,可以通过渲染来显示引用值和源的工具提示。
  • SymGen利用了LLM在预训练期间可能已经接触过包含符号引用的模板化文本这一事实。因此,LLM可以零样本地生成这类文本。
  • 在数据到文本、反事实文本生成、问答以及算术词问题等实验中,结果表明LLM可以在保持流畅性的同时生成包含符号引用的准确文本。
  • 虽然不能提供形式保证,但SymGen输出通常准确,并简化了事后验证。局限包括需要高质量的数据,以及可能的语法/排版错误。

动机:大型语言模型在生成文本方面表现出令人印象深刻的能力,但仍然容易产生错觉,因此对于高风险应用程序,通常需要人工验证其输出,这可能耗时且困难。本文提出一种符号参考的生成方法,可以更容易地验证语言模型的输出。

方法:本文提出的符号参考生成方法(SymGen)通过在常规输出文本中插入显式符号参考,来使语言模型的输出易于验证。这些符号参考可以用于显示生成文本中不同部分的来源,从而减少人工验证的工作量。

优势:通过使用符号参考,语言模型可以直接输出使用符号参考的文本,同时保持流畅和准确。

提出一种符号参考的生成方法,通过在输出文本中插入符号参考,使语言模型的输出更易于验证,从而提高生成文本的可验证性。

https://arxiv.org/abs/2311.09188 

MIT|基于符号引用的可验证文本生成

MIT|基于符号引用的可验证文本生成

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy