人工反馈强化学习

505次阅读
没有评论

【人工反馈强化学习(ICML 2023 Tutorial)】《Reinforcement Learning from Human Feedback: A Tutorial * · SlidesLive》Nathan Lambert, Dmitry Ustalov

 

人工反馈强化学习

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy