阿里巴巴&清华大学提出新型学习范式RRHF：对语言模型与人的反馈进行排序使其保持一致

2,107次阅读

标题：RRHF: Rank Responses to Align Language Models with Human Feedback without tears

作者：Zheng Yuan, Hongyi Yuan, Chuanqi Tan, Wei Wang, Songfang Huang, Fei Huang

[Alibaba DAMO Academy & Tsinghua University]

简介：

人类反馈强化学习 (RLHF) 促进了大型语言模型与人类偏好的对齐，显着提高了人类与这些模型之间的交互质量。InstructGPT 通过几个阶段实现 RLHF，包括监督微调 (SFT)、奖励模型训练和近端策略优化 (PPO)。然而，PPO 对超参数很敏感，并且在其标准实现中至少需要四个模型，这使得它很难训练。

相比之下，我们提出了一种称为 RRHF 的新型学习范式，它对不同采样策略生成的响应进行评分，并通过排名损失学习使它们与人类偏好保持一致。RRHF 可以像微调一样有效地将语言模型输出概率与人类偏好对齐，并且在调优期间只需要 1 到 2 个模型。此外，RRHF 可以被认为是 SFT 和奖励模型的扩展，同时在编码、模型计数和超参数方面比 PPO 更简单。整个对齐过程可以在一次 RRHF 培训课程中完成。我们使用 LLaMA 和 Alpaca 在有用和无害的数据上评估 RRHF，展示了与 PPO 相当的性能。

https://arxiv.org/pdf/2304.05302.pdf

阿里巴巴&清华大学提出新型学习范式RRHF：对语言模型与人的反馈进行排序使其保持一致

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

AI AR F1 GPT HTML RSS 大型语言模型

发表至：智源

2023年4月12日

Gemini自曝中文用百度文心一言训练，网友看呆：大公司互薅羊毛？？

聚焦AI+LNP递送，种子轮融了近2000万美元！

TinyGPT-V开源详解 | GPT-4不开源，这就是最好的替代选择

全球AI制药公司的最大金主

早报 | OpenAI 重金悬赏找漏洞/iPhone 15 全系屏幕或采用 M12 材料/阿里全系产品将接入大模型

NLP新任务：AI模型生成的文本检测及其可能性

评论（没有评论）

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

文心AIGC

人工智能ChatGPT，AIGC指利用人工智能技术来生成内容，其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向，近几年迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局

文章搜索

最新评论

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

经典留声机

经典流行从来都不冲突

在这里，听见你曾经的故事

新浪微博：主播小D

小红书：小D就是我

抖音号：52915017

Search Episodes

薛之谦：从“人歌分离”到“深情解构者”的音乐涅槃之路（上）

2025年6月30日

主播小D

你一定听过这些经典合唱–第一篇

2025年1月20日

主播小D

缅怀一代歌王罗文的经典之声–第二篇

2024年12月30日

主播小D

缅怀一代歌王罗文的经典之声–第一篇

2024年12月27日

主播小D

在这里，听琼瑶，岁月长歌–第二篇

2024年12月24日

主播小D

在这里，听琼瑶，岁月长歌–第一篇

2024年12月21日

主播小D

你总能在这些歌里找到你的回忆–第一百零三篇

2024年12月18日

主播小D

你总能在这些歌里找到你的回忆–第一百零四篇

2024年12月13日

主播小D

《这些歌都发行在2001年–第三篇》

2024年12月10日

主播小D

《这些歌都发行在2001年–第二篇》

2024年12月7日

主播小D

Search Results placeholder

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30