自由能原理基础：从⻉叶斯定理到主动推理｜自由能原理与强化学习读书会·周日直播

导语

自由能原理被认为是“自达尔文自然选择理论后最包罗万象的思想”，它试图从物理、生物和心智的角度提供智能体感知和行动的统一性原理，却也以理论的艰深晦涩著称。此次「自由能原理与强化学习读书会」第二期将在第一期自由能原理的概览介绍之后，从概率论的基础理论出发，对自由能原理主动推理进行详细推导。欢迎感兴趣的朋友和我们一起探索！

内容简介

主动推理（Active Inference），及其最近在部分可观察的马尔可夫决策过程（POMDPs）中的应用，为建模感知、学习和决策提供了统一的数学框架，该框架将这些心理过程及其相互作用视为相互依赖的推断形式。在主动推理中，决策智能体通过将先验信念与感觉输入结合起来，推断环境中不同外部状态和事件的概率，包括它们自己的行动。
不同于“被动”的感知推断过程（例如，根据光线模式对视网膜的影响来推断外部物体的存在），决策背后的推断是“主动的”，即智能体通过推断得出最可能产生偏好感觉输入的行动（例如，推断吃一些食物会减轻饥饿感）。智能体还通过推断得出最有可能减少不确定性并促进学习的行为（例如，推断打开冰箱将显示可用的食物选项）。这导致决策行为在最大化奖励和信息增益之间进行权衡。
主动推理预测的感知和行动模式与经验观察到的模式非常匹配。与主动推理相关的神经过程理论还成功地在多个研究范式中再现了经验观察到的神经反应，并产生了新颖的、可测试的预测。由于这些和其他考虑因素，这个框架在心理学、神经科学和机器学习领域近年来日益具有影响力。
本次读书会以论文《A step-by-step tutorial on active inference and its application to empirical data》为基础，从贝叶斯定理出发，引入变分推断方法进行近似贝叶斯推断，将感知建模为最小化变分自由能的过程，将行动建模为最小化期望自由能的过程。之后针对部分可观测马尔可夫决策过程通过因子图对其进行表示，并通过消息传播算法对信念进行更新。最后简要介绍主动推理框架在神经过程理论中的对应以及分层部分可观察马尔可夫决策过程。

内容大纲

主动推理简介
背景知识

概率论基础与生成模型
贝叶斯推断与变分推断

核心理论

变分自由能公式推导
期望自由能公式推导

实现及应用

图模型与消息传播
神经过程理论

扩展

分层马尔可夫决策过程

关键词

主动推理 Active Inference

贝叶斯定理 Bayes’ theorem

变分自由能 Variational Free Energy （VFE）

期望自由能 Expected Free Energy（EFE）

部分可观测马尔可夫过程 Partially observable Markov decision process (POMDP)

因子图 Factor graph

消息传播 Message passing

神经处理理论 Neural process theory

分层模型 Hierarchical model

主讲人简介

牟牧云，北京师范大学系统科学学院博士生，张江老师因果涌现研究小组成员。研究方向：复杂系统建模与调控、强化学习世界模型。

直播信息

时间：2024年3月17日（本周日）上午10:00-12:00
参与方式：斑图地址：https://pattern.swarma.org/study_group_issue/622
扫码参与自由能原理与强化学习读书会，加入群聊，获取系列读书会回看权限，加入集智社区，与社区的一线科研工作者沟通交流，共同推动因果涌现这一前沿领域的发展。
报名成为主讲人：读书会成员均可以在读书会期间申请成为主讲人。主讲人作为读书会成员，均遵循内容共创共享机制，可以获得报名费退款，并共享本读书会产生的所有内容资源。具体见系列读书会详情：自由能原理与强化学习读书会启动：探索感知和行动的统一原理

参考文献

• Smith, Ryan, Karl J. Friston, and Christopher J. Whyte. A step-by-step tutorial on active inference and its application to empirical data. Journal of mathematical psychology 107 (2022): 102632.

主动推理框架可以被描述为部分可观测马尔可夫决策过程（POMDP），这种表述成为建模神经认知过程的有用方法。本文提供了一个详细教程，介绍了基本概念、数学和编程实现，演示如何使用模型进行行为和神经建模，并将实验模型拟合到行为数据中。

• Friston, K. The free-energy principle: a unified brain theory?. Nat Rev Neurosci 11, 127–138 (2010). https://doi.org/10.1038/nrn2787

自由能原理经典奠基性综述

推荐阅读

自由能原理与强化学习读书会招募中

由能原理被认为是“自达尔文自然选择理论后最包罗万象的思想”，它试图从物理、生物和心智的角度提供智能体感知和行动的统一性规律，从第一性原理出发解释智能体更新认知、探索和改变世界的机制，从而对人工智能，特别是强化学习世界模型、通用人工智能研究具有重要启发意义。
集智俱乐部联合北京师范大学系统科学学院博士生牟牧云，南京航空航天大学副教授何真，以及骥智智能科技算法工程师、公众号 CreateAMind 主编张德祥，共同发起「自由能原理与强化学习读书会」，希望从自由能原理这个更底层的视角重新审视强化学习世界模型，探讨自由能原理、强化学习世界模型，以及脑与意识问题中的预测加工理论等前沿交叉问题，探索这些不同领域背后蕴含的感知和行动的统一原理。读书会从3月10日开始，每周日上午10:00-12:00，持续时间预计8-10周。欢迎感兴趣的朋友报名参与！

详情请见：自由能原理与强化学习读书会启动：探索感知和行动的统一原理

点击“阅读原文”，报名读书会

2024 年 3 月
一	二	三	四	五	六	日
	1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

自由能原理基础：从⻉叶斯定理到主动推理｜自由能原理与强化学习读书会·周日直播

内容简介

内容大纲

关键词

主讲人简介

直播信息

参考文献

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

老外对屏狂拍！海信全新一代RGB-Mini LED电视亮相轰动CES2026

三赴CES，睿尔曼以三大底层能力构建全球化具身智能新基建

刚开年，马斯克就到账了200亿美金！

首家央企AI独角兽浮出水面！背靠自研大模型，4家国家队资本背书

8块钱跑通一次强化学习全流程，潞晨云重塑微调赛道：1名算法工程师=1支Infra团队

文心AIGC