【推荐理由】针对当前大语言模型的生成对话虚假,产生与文档相矛盾或包含无法验证的信息等不良行为,文章提出了一种弹性权重移除的方法来解决这类问题。广泛的自动和人工评估表明,该方法增加了对话生成的信实度且成本很小。
Elastic Weight Removal for Faithful and Abstractive Dialogue Generation
Nico Daheim, Nouha Dziri, Mrinmaya Sachan, Iryna Gurevych, Edoardo M. Ponti
[Ubiquitous Knowledge Processing Lab (UKP Lab), Department of Computer Science
and Hessian Center for AI (hessian.AI), TU Darmstadt & Allen Institute for Artificial Intelligence]
【论文链接】https://arxiv.org/pdf/2303.17574.pdf
【项目链接】https://www.informatik.tu-darmstadt.de/ukp/ukp_home/index.en.jsp
【摘要】理想情况下,对话系统应该生成与相关文档中所包含的知识相符的回应。然而,许多模型生成的回应却是虚假的,与文档相矛盾或包含无法验证的信息。为了缓解这种不良行为,已经提出了在负面示例上对“负面专家”进行微调,并从预训练模型的参数中减去其参数的方法。然而,直觉上,这并没有考虑到某些参数在导致幻觉方面的影响比其他参数更大。因此,本文提出了一种方法,通过(近似)Fisher信息矩阵来衡量其个体重要性,从而对它们进行加权。作者称这种方法为弹性权重移除(EWR)。文章使用不同变体的Flan-T5作为骨干语言模型在多个信息寻求对话生成数据集上评估该方法,并将其与信实度的最新技术(如CTRL、Quark、DExperts和Noisy Channel reranking)进行比较。广泛的自动和人工评估表明,EWR系统地增加了信实度,而成本很小。然而,作者注意到只是防止幻觉可能会增加提取性,即浅层复制文档片段,这可能是不可取的。因此,作为第二个主要贡献,文章展示了我们的方法可以扩展到同时防止幻觉和提取性回应。