#79. 强化学习——阿尔法围棋背后的技术

436次阅读
没有评论

嘉宾:田博士(Facebook人工智能研究院的研究员及经理)
主持:斯图亚特
剪辑:王立冰

本期内容包括:

  • 嘉宾在前阿尔法狗时代研发的世界顶级围棋AI
  • 阿尔法狗使用的技术
  • 阿尔法狗之后围棋AI的进展
  • 强化学习是什么
  • 强化学习的历史
  • 强化学习的落地方向和挑战
  • 两种强化学习:有模型的和无模型的
  • 强化学习的研发体验
  • 强化学习的未来发展方向
  • 进入强化学习领域需要做哪些准备

图片截取自 “japanese robot plays igo” by hiroaki maeda on Flickr https://www.flickr.com/photos/torisan3500/372829860
Licensed under CC BY-ND 2.0 https://creativecommons.org/licenses/by-nd/2.0/

片头片尾音乐
Courante 1st Cello Suite
Exzel Music Publishing (freemusicpublicdomain.com)
Licensed under Creative Commons: By Attribution 3.0
http://creativecommons.org/licenses/by/3.0/

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)