卡尔·弗里斯顿:万物解释者

767次阅读
没有评论

卡尔·弗里斯顿:万物解释者

封面:Victor Mosquera

导语

卡尔·弗里斯顿的自由能原理可能是自达尔文的自然选择论诞生以来,又一种囊括万物的理念。即便称不上“万物理论”,自由能原理已演变成了科幻作家阿西莫夫笔下真实版的“心理史学”,一种虚构的学科体系,旨在浓缩全部心理学、历史和物理学成一门统计科学。而为了理解以艰深晦涩著称的自由能原理,你需要深入弗里斯顿的思维世界一探究竟。
集智俱乐部「自由能原理与强化学习读书会」旨在探讨自由能原理、强化学习世界模型,以及意识的预测加工理论等前沿交叉问题,探索这些不同领域背后蕴含的感知和行动的统一原理。读书会由北京师范大学系统科学学院博士生牟牧云,南京航空航天大学副教授何真,以及公众号 CreateAMind 主编、骥智智能科技算法工程师张德祥共同发起,从3月10日开始,每周日上午10:00-12:00,本周日读书会的主题是「自由能原理基础:从⻉叶斯定理到主动推理」,欢迎感兴趣的朋友和我们一起探索!
研究领域:自由能原理,主动推理,人工智能,马尔科夫毯,贝叶斯推理卡尔·弗里斯顿:万物解释者 SHAUN RAVIV | 作者阿格 | 翻译张蒙 | 审校EON | 编辑神经现实 | 来源





1. 引言




英国国王乔治三世在其统治后期开始出现急性躁狂的症状,一时间,关于国王发疯的流言在民间迅速发散。有个传言宣称,国王试图与一棵树握手,认为“它”是普鲁士国王。另一传言则描述了乔治国王是如何被移送到伦敦布卢姆斯伯里区女王广场的一所子就医的。为此,夏洛特王后还租用了当地一家酒馆的酒窖来存储食材,保障国王的饮食。

 

两个多世纪过去了,这个关于女王广场的故事仍常见于伦敦的旅游指南。暂不论其真伪,但经过多年发展的广场街区似乎在印证着故事的真实性:广场北角矗立着一座夏洛特王后的雕像;西南角的那家酒馆被称为“王后的食橱”;而广场上静谧的矩形花园如今被众多机构环绕,机构里全是那些研究大脑以及大脑不停运转的人。国立神经内科和神经外科医院——现代王室成员或会到此就诊——占据着广场东角。而伦敦大学学院(UCL)那闻名于世的神经科学研究大楼遍布周围。在2018年七月的某一周,可以看到许多神经科患者及其家人坐在花园草地外缘的木椅上,静享晴朗的天气。


卡尔·弗里斯顿:万物解释者

卡尔·弗里斯顿(Karl Friston)丨图片来源:KATE PETERS


每周一中午12:25,卡尔·弗里斯顿(Karl Friston)到达女王广场,坐在夏洛特王后雕像前的花园里,点上一根烟。这个身形略弯、形影孤独、满头灰发的人,是UCL传奇的功能成像实验室的科学主任。烟抽完了,弗里斯顿便走到广场的西侧,进入一栋砖石与石灰石建筑,径直前往四楼的一间会议室。那里,总有二到二十几人数量不等的观众提前到场,对着毫无内容的白墙,苦苦等待弗里斯顿的到来。但他总喜欢晚到五分钟。

 

弗里斯顿问候了会议室里的参与者,而这很可能就是他当天的首次重要发言,因为他不喜欢在中午之前与人交谈。(在家里,他和妻子以及三个儿子一致同意,该聊天时就畅聊,不该聊天时就安静)他也很少与人单独会面。相反,他更喜欢参加此类公开会议,学生、博士后们可以参加,那些渴望了解弗里斯顿专业知识的民众也可以加入并感受他的广博知识。有趣的是,近年来参会的民众越来越多。“弗里斯顿认为,谁若产生了一个想法、一个问题或是开展了一个项目,那么,让其他人了解它的最佳方式便是把大家聚在一起,去听取这个人的分享,然后大家提出疑问并进行集体讨论。由此,个人的独自学习变成了群体的共同学习。”大卫·班理默(David Benrimoh)介绍说。他在麦吉尔大学学习精神病学,曾跟着弗里斯顿研究过一年。“这种讨论方式很独特!弗里斯顿也总是令人印象深刻。”



弗里斯顿设计了许多能获取脑成像的科学仪器,一跃成为学术界的英雄。



每次开会,所有人先轮流上台提出问题。这时,弗里斯顿会边听边缓缓围着圈走。他的眼镜总是滑至鼻尖,不得不低着头才能看清发言者。接着他会花几个小时来逐一回答大家提出的问题。“(他是)一位维多利亚式的绅士,举止如此,品味亦是如此,”一位朋友说,弗里斯顿甚至会极谦卑地、迅速地帮助发言者重新组织问题,哪怕听到了最混乱不明的问题。而Q&A部分——我称之为“问问卡尔吧!”——无不使人深深惊异于弗里斯顿所展现出的超强耐力、强大记忆、渊博知识和创造性思维!当大家看到弗里斯顿走到外面小小的金属阳台时,会议就结束了。他会抽完一根烟,再去上班。

 

最初,弗里斯顿因设计了许多能获取脑成像的科学仪器,一跃成为学术界的英雄。1990年,他发明了统计参数图像(SPM)软件。如某位神经学家所言,它可以帮助“压缩与挤压”大脑图像成一致相称的形状,以便研究人员对人颅骨内的不同活动进行同类比较。后来,SPM催生出一种推论方法,即“体素形态测量法”(voxel-based morphometry),此成像技术曾应用于一项著名的研究,以显示出伦敦出租车司机大脑海马体的后侧会随着司机们所积累的“伦敦地理知识”*增长而变大。

 

*注:为了考取伦敦出租车驾照,一名司机必须记住查林十字街6英里范围内的320条路线和许多地标。这个艰辛的过程还要求司机参加一系列与考官进行的一对一面谈,以及一次书面测试。


2011年发表在《科学》上的一项研究使用了由弗里斯顿发明并应用动态因果建模的第三代脑成像分析软件,以确定重度脑损伤患者是具有最低限度的意识还是已经变成了植物人。

 

2006年,弗里斯顿入选英国皇家学会。该学会将他的大脑研究成果称为“革命性的功绩”,并表示有超过90%的、已发布的脑成像论文使用了他提出的方法。两年前,由AI先驱奥伦·艾奇奥尼(Oren Etzioni)领导的艾伦人工智能研究所给出相关统计数据,显示弗里斯顿是世界上最高被引用的神经学家。他的h-index(h指数,用来衡量研究人员出版物影响的指标)几乎是爱因斯坦的两倍。2017年,在过去二十多年中成功预测了46位诺奖得主的科睿唯安,将弗里斯顿列为生理学或医学类三大最有可能的获奖者之一。

 

然而值得一提的是,如今拜访弗里斯顿的研究人员鲜有人谈大脑成像。2018年夏天有十天的时间,弗里斯顿为以下人员做了咨询:一位天体物理学家;几位哲学家;一位计算机工程师,该工程师正研究一种比亚马逊的Echo更个性化的智能音箱;一位人工智能项目负责人,该负责人工作于一家世界级的保险公司;一位追求制造先进助听设备的神经学家;一位初创公司的精神科医生,其公司运用机器学习来帮助治疗抑郁症。这些访客大多迫切想弄明白的是其他事情,而非大脑成像。

 

过去十年,弗里斯顿投入了大量时间和精力来发展他称为“自由能原理(the free energy principle)的理念。(他将自己的神经成像研究称为“正职”,这态度或像是一个爵士音乐家在说自己在公共图书馆“轮班”一样无足轻重。)有了这个理念,弗里斯顿相信他已经确定了所有生命甚至是生命智能的组织原理。“一个人存活于世,”他开始阐释,“必定会作何表现呢?”


但坏消息接踵而至:自由能原理太费解了!绝顶聪明的人士纷纷尝试理解它,皆无功而返。事实上,想要理解它难度甚大。一个拥有3000名粉丝的Twitter用户*甚至专门发推文嘲笑自由能原理的晦涩艰深。而且几乎所有与我谈及此原理的人,包括那些工作上要用到它的研究人员,都表示连他们也并未完全弄明白。

 

*注:该Twitter账号为“@FarlKriston”。其推文如下:“生命就是任意(遍历性的)随机动态系统所具有必然的与意外的属性,并且这个动态系统存在一条‘马尔科夫毯’。你可少不了这条毯子!”

 

卡尔·弗里斯顿:万物解释者

Farl Kriston对本文的转推


但同样是这批人,常常急着补充说,自由能原理的核心就是化繁为简并解决一个基本难题。热力学第二定律告诉人们宇宙趋向于熵增并走向消亡,但生命体却强烈抵制这种趋势。每日醒来,我们的模样和前一天几乎别无二致,但我们的细胞与器官之间,以及我们自身与外部世界之间却存在明显的差别异化。这是怎么回事?弗里斯顿的自由能原理这样解释:从单个细胞到拥有数十亿神经元的人脑,所有生命体的组织形式都是由同样的普遍命令驱动的。这个普遍命令可以简化为数学函数。弗里斯顿说,人活着,就是为了不断缩小“个人期望”和“感官感受”之间的差距。用他的术语来讲,就是要“最小化自由能”。

 

为了解此理论的潜在影响,我们不妨先观察那些每周一上午进进出出功能成像实验室的人们。有些人来这儿是想利用自由能原理来统一心智方面的理论,为生物学提供新的研究基础,并结合已有知识来解释生命。其他人则希望通过自由能原理最终夯实大脑功能研究对精神病学的影响基础。还有一些人想利用这个原理去突破AI研究过程中所遭遇的障碍。他们都不约而同地现身于FIL,因为他们认为唯一彻底理解自由能原理的人,可能就是卡尔·弗里斯顿本人。


卡尔·弗里斯顿:万物解释者

弗里斯顿的办公室。一位朋友形容他是“一位维多利亚式的绅士,举止如此,品味亦是如此。”丨图片来源:KATE PETERS





2. 学术生涯




弗里斯顿不仅是他所在领域内影响最为卓著的学者之一,还是毫无异议的、最多产的作家。今年59岁的他,每晚和每周末都工作,自本世纪以来已发表了1000多篇学术论文。仅2017年一年,他以第一作者与合作作者的身份发表了85份出版物*,每将近四天就有1份。

 

*注:《自然》杂志2018年的一篇文章分析了“极高产学者”现象。文章作者将其定义为“一年内发行超过72份出版物的人”。


若问如何方能做到学术上的高产,弗里斯顿定会说:“雄勇进取出成果,谨严治学远凡心。”

 

弗里斯顿小心翼翼地保护着他的内心生活,避免怪力乱神,其中就包括不“忧虑他人。”与私聊相比,他更喜欢现身台上,与他人保持舒适的距离。他不用手机。他总是穿着一件深蓝西装,而西装购于一家清仓店,当时他一次买了俩。然而,弗里斯顿发现自己在女王广场的每周例行散步受到了“十分伤脑筋”的搅扰。于是乎,他选择刻意远离他人,遇到国际(学术)会议也是如此。而且他不喜欢宣扬自己的想法。

 

与此同时,弗里斯顿却能透彻理解自己作为一名学者的驱动力。陷入数周沉思方能破解难题期间,他感受到一种极致的舒缓(溜出去抽烟也有同样效果)!他记述自己从童年时期就痴迷于寻找方法来整合、统一并简化流传于世的各种思想,着实令人信服。

 

弗里斯顿回忆道,自由能原理之理念产生要追溯到他8岁时的那个酷夏。当时,他们一家住在保存有古城墙的英格兰城市切斯特,靠近利物浦。有一天,在母亲准许下,他在花园里玩耍。翻过一根旧木头时,他发现了几只木虱——这些具有犰狳形外骨骼的小虫子正在胡乱地寻找避难所和暗处。刚开始他是这么认为的。观察了半小时后,他却推断这些虫子实际上不是在寻找阴影处。“那是一种幻觉,”弗里斯顿说。“是我自认为它们在那样做。”

 

他意识到爬来爬去的小木虱本身就没有大目标,至少这和人类不同,人类可是会坐车去办事的。这些虫子到处爬,太阳越猛,则爬得越快*。

 

*注:年轻的弗里斯顿可能是对的。许多种类的木虱在阳光直射下会被晒干,还有些木虱会随着气温升高便开始爬行,急速肆意地爬行。

 

弗里斯顿把这次经历称为“我的第一个科学见解”,当时他感到“所有关于目的和生存的人为、人格化的解释,突然剥离了我的脑海,”他说。“而我正在观察的事物则带给我一种感觉:它只能按照我的新理解去解释。”

 

弗里斯顿的父亲曾是一名土木工程师,研究桥梁,奔波于英国各地,所以一家人得随他搬迁。还不到11岁,年轻的弗里斯顿就换了六所不同的学校,随之而来的是深深的孤独感。对此,他的老师们也无计可施。而他通过独自解题来弥补自尊心的不足。10岁时,他设计出了一种自动修正机器人。从理论上来说,这个装载着自校反馈驱动器和水银水平仪的机器人可以携带一杯水,穿行不平坦的地面而不撒出来。而学校竟指派了一名心理医生去询问他是如何想出这个设计的。“你是很聪明的,我的孩子,”一贯给他以动力的母亲,再次安慰他。“不要让别人对你说你不聪明。”弗里斯顿说他当时不相信母亲所言。

 

长到十几岁,他又经历了一次“木虱时刻”。某天,刚看完电视的他回到卧室,望见窗外盛开的樱花,脑海却突然闪现出一种令他毕生难忘的想法:“世界上肯定有那么一种从零开始理解万物的方法。”他思考着。“如果在整个宇宙中我只有‘一点’,那这一点能否衍生出其他所有东西?”他躺在床上思考了几个小时,到最后也毫无头绪。这是他第一次尝试深度思考。“很明显,我彻底失败了。”他说。

 

临近中学毕业时,弗里斯顿和他的同学们参与了一项早期计算机辅助咨询的实验。他们要回答一系列问题,而答案则被打制成卡片并输入机器去推断回答者的完美职业选择。弗里斯顿说他痴迷于电子设计并且天生爱独处。因此,计算机建议他当一名电视天线安装员。这建议似乎不靠谱。后来他去咨询了学校的一位职业顾问,表明自己想在数学和物理学的背景下研究大脑。职业顾问告诉弗里斯顿他应该成为一名精神科医生,也就是说,弗里斯顿得学习医学。这令他害怕不已。

 

现在看来,弗里斯顿和那名顾问都将精神病学与心理学混为一谈了。或许他将来应该作为一名研究员去研究精神病学,但事实证明这次咨询是一个“幸运的错误”,因为弗里斯顿从此走上了研究心智和身体的道路*,并发展起他一生中最得心应手的技艺——逃离自知而找寻新知。

*注:弗里斯顿不忘找时间去扩大自己的钻研。在19岁时,他花了整整一个假期试图将物理学的知识浓缩在一页纸上。虽然最终失败了,但他成功熟识了量子力学的全部知识。


完成剑桥大学国王学院的医科学习后,弗里斯顿搬到了牛津大学(加入“精神病学轮训计划”),并到一家维多利亚时期开办的利特摩尔收容所做了两年的常驻实习生。根据1845年颁布的《精神病法案》(Lunacy Act),利特摩尔的成立初衷是帮助把所有“贫民疯子”从工厂转送到其他医院。直至20世纪80年代中期、弗里斯顿来此实习之际,利特摩尔仍是英国城市市郊最后一批旧收容所之一。

 

弗里斯顿当时被分配去照料一组慢性精神分裂症患者,共32名。这群人是利特摩尔最穷困的患者,对他们而言,收容即为“治疗”。这次实习经历将弗里斯顿带向了另一种思考:大脑内部的各种联系缘何容易被打断呢?当他回忆起那些患者时,其念旧情绪全然腾现。“利特摩尔是一个适合做研究的好地方,”他说。“这个小社会满是精神病理学的味道。”

 

弗里斯顿每周要主持两次90分钟的团体治疗会议。在此期间,患者们一起探讨他们的“小病”。这就跟现在的“问问卡尔吧!”会议如出一辙。值得注意的是,三十多年过去了,小组中形形色色的患者仍然激发着弗里斯顿的深思。例如,有一位叫希拉里*的患者  ,看着适合在《唐顿庄园》扮演高级厨师,但她被送到利特摩尔之前,曾用菜刀将她的男邻居斩首了,只因她“确信”那人幻化成了一只邪恶的人形“乌鸦”!

*注:故事里提到弗里斯顿的利特摩尔患者均采用化名。

 

还有一位欧内斯特,特喜欢柔色的玛莎牌开襟羊毛衫和绝配的橡胶底帆布鞋,但却是一个“远远出人意料的无法无天、不可救药的恋童癖者”,弗里斯顿说。

 

然后是罗伯特,一个口齿伶俐的年轻人。要是没遭受过严重的精神分裂症,他可能就进了大学。罗伯特沉溺于思考“天使粪”。他“思索”着:“天使粪”是一种祝福抑或是一种诅咒?人们看得见它吗?与人相处时,他看起来满脸困惑:怎么大家不去思考这些问题呢?在弗里斯顿看来,“天使粪”概念简直是一个奇迹。这让人明白了精神分裂症患者有一种能力,能够合成那些头脑运转正常的人士无法轻易获得的概念。“想出像‘天使粪’这样的东西是非常困难的,”弗里斯顿话语中带着一丝钦佩与羡慕。“这我可做不到。”

 

利特摩尔实习之后,在90年代早期的大部分时间里,弗里斯顿在试图使用一种相对新颖的技术——正电子发射型计算机断层显像(PET),来了解精神分裂症患者的大脑内部情况。为了处理PET功能成像数据,他也发明了统计参数图像(SPM)软件。弗里斯顿坚持认为SPM应该要自由共享而非专利化、商业化,无怪乎它今天会被如此广泛使用。那会儿,弗里斯顿得飞往世界各地,例如马里兰州贝塞斯达的国立卫生研究院,将SPM软件教给其他研究人员。“我的旅程通常如下:携带一份只有四分之一大小的生物识别磁带上飞机,飞到目的地后,将其下载到电脑里,紧接着再花一天的时间把它运转起来,教工作人员使用,最后就可以回家休息了,”弗里斯顿如是说。“当时的开源软件就是这样运作的。”



大脑以概率的方式来计算和感知世界,并根据感官输入情况,不断地作出预测和调整信念。

——Hermann von Helmholtz



弗里斯顿于1994年来到伦敦大学学院工作。之后几年,他在FIL的办公室就坐落在盖茨比计算神经科学中心的不远处。当时盖茨比中心由其创始人,认知心理学家兼计算机科学家杰弗里·辛顿(Geoffrey Hinton)负责,其研究员能在此研究生命体和机器系统的感知和学习理论。彼时,FIL逐渐成为神经成像领域首屈一指的实验室之一,而盖茨比中心也正在转变为一个重要培训基地,训练那些致力于将数学模型应用于神经系统研究的神经学家。


卡尔·弗里斯顿:万物解释者

杰弗里·辛顿(Geoffrey Hinton)丨图片来源:AARON VINCENT ELKAIM/REDUX


与很多人一样,弗里斯顿被辛顿对最复杂的统计模型所表现出的“孩童般热情”给吸引了。于是,二人交了朋友。*

 

*注:那会儿,辛顿住在卡姆登一栋特别嘈杂的楼里。邻居家的水管总是水声烦人,于是他在地下室卧室里用橡胶和四分之三英寸大小的干式墙板建造了一个隔音箱,这样他和妻子就能睡个安稳觉了。

 

随着时间的推移,辛顿使弗里斯顿接受了一种想法:探索大脑最好要像一台贝叶斯概率机那样。这个想法可追溯至19世纪赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz)进行的研究,即“大脑以概率的方式来计算和感知世界,并根据感官输入情况,不断地作出预测和调整信念”。根据时下最流行的贝叶斯算法,大脑可看作是一种旨在最大限度地减少“预测误差”的“推理引擎”。

 

2001年,辛顿离开伦敦前往多伦多大学。在那里他为现今的深度学习研究奠定了基础 *,使自己成为了人工智能领域最重要的人物之一。

 

*注:2012年,辛顿及其团队赢得了ImageNet挑战赛: 从李飞飞建立的包含有1500万图像的数据库中识别出特定物体。ImageNet帮助将神经网络和辛顿推向了人工智能领域的最前沿。


在辛顿动身前,弗里斯顿到盖茨比中心最后一次拜访了他。辛顿描述了他设计的一种新技术,允许计算机程序在运算过程中能更有效地模拟人类决策,并整合许多不同概率模型所产生的输入值,目前在机器学习中它称为“专家乘积系统”(product of experts,PoE)

 

这次会面使得弗里斯顿头脑飞驰、深受启发。本着“智力互惠”的精神,反过来,他给了辛顿他写的一系列笔记。这些笔记有关于一个理念:把几个看似无关的“大脑解剖学属性、生理学属性和精神物理学属性”统统联系起来。2005年,弗里斯顿整理这些笔记并发表了一篇论文,是他对自由能原理研究数十篇论文中的第一篇。

 

卡尔·弗里斯顿:万物解释者

卡尔·弗里斯顿办公室里的马尔科夫毯——“这个1856年产生的理论提供了你内部状态持续保暖的依据。”丨图片来源:KATE PETERS





3. 主动推理




在解释自由能原理时,就连弗里斯顿自己也会犯难,纠结于应该先解释什么。他常鼓励人们去看看维基百科对它的介绍。但于我而言,似乎先从观察弗里斯顿办公室的那条被褥毯子开始,会更容易些。

 

这毯子本是一张白色羊毛床罩,印有一幅定制的黑白肖像画,画着那位严厉的、蓄着大胡子的俄罗斯数学家安德烈·安德烈耶维奇·马尔科夫(Andrei Andreyevich Markov),他于1922年去世。弗里斯顿的儿子给父亲送了这么一份恶作剧礼物,其实这条毛绒聚酯做成的毯子是一个关于自由能原理核心理念的玩笑。“马尔科夫毯”就是以马尔科夫的名字命名的。这个概念出现在机器学习中,其本质相当于一个盾牌,在一个分层的、等级制的系统中将一组变量与其他组变量分离开来。心理学家克里斯托弗·弗里思(Christopher Frith,其h指数和弗里斯顿一样高)曾将马尔科夫毯描述为“认知领域的细胞膜:将毯子内的状态隔除于外部状态。”

 

弗里斯顿觉得,宇宙是由“马尔科夫毯里面的各种马尔科夫毯”构成的。每个人都有一条马尔科夫毯,将我们和外部的异化因素统统分隔开。一个人的身体内部也存在着各式各样的马尔科夫毯:有分隔不同器官的毯,有分隔不同细胞的毯,也有分隔不同细胞器的毯。马尔科夫毯解释了不同生物是如何随着时间流逝但依然保持着自身特性的。没有马尔科夫毯,我们都会化成一团热气并消散于以太。

 

“你听说的那条马尔科夫毯就在这儿,就是这条。你可以摸摸它,”当我第一次看到他办公室里的那条毯子时,弗里斯顿漫不经心地说道。我确实伸手去感受了它。从我首次读到马尔科夫毯以来,其实我到处都有“看见”它的踪影:在叶子上、树上甚至是蚊子身上。在伦敦,我也“看到”了马尔科夫毯:在FIL的博士后们身上,反法西斯集会中穿黑衣的抗议者们身上,以及生活于运河船上的人们身上。每个人都“披着”隐形斗篷,而斗篷之下又是一个个不同的生命系统,个个系统都在最大限度地减少自由能。

 

自由能概念源于物理学,这意味着如果没有数学方程式,就很难对它精确解释。从某种意义上说,它的强大之处在于,它不仅仅是一种修辞概念,也是一个可模型化的可测量,使用的数学就跟弗里斯顿那改变了世界并用于解读大脑图像的数学一样。你若将此概念从数学公式转化为文字,你大概会看到这个表述:自由能,即个体所期望进入的状态和个体感官感受的状态之间的差异。换言之,当你最大限度地减少自由能时,你就是在降低意外度(surprise)

 

弗里斯顿称,任何抵抗紊乱与解体(disorder and dissolution)倾向的生物系统*都会遵循自由能原理——无论是一个原生动物,还是一支职业篮球队。

 

*注:2013年,弗里斯顿运作了一个模型,模拟一个充满浮动分子的原始汤(primordial soup),并将其编程为遵循基本物理学和自由能原理的模式。该原始汤模型产生了类似于结构化生命的东西。


与大脑一样,单细胞生物也具有降低意外度的必行机制。

 

而两者唯一的区别在于,随着自组织生物系统的发展,大脑会变得非常复杂。大脑汲取数十亿身体感受器里的信息,并十分高效地将这些信息组装成一个准确的外部世界模型。“可以说,大脑实际上是一个奇妙的器官。它所幻演的外部世界假设,适合用来解释数不胜数的万物模式,以及它所接受的感官信息流,”弗里斯顿说。在预测一轮又一轮的感官信息时,大脑根据感官的回传信息不断作出推断,更新信念,并试图最小化预测误差信号。



在预测一轮又一轮的感官信息时,大脑根据感官的回传信息不断作出推断,更新信念,并试图最小化预测误差信号。



看到这里,你可能也注意到了,上述的大脑运行理念很像贝叶斯概率机,也就是辛顿在90年代跟弗里斯顿说的“推理引擎”。事实也是如此。弗里斯顿认为贝叶斯模型就是自由能原理的基础(“自由能”甚至可说是“预测误差”的粗略同义词)。但弗里斯顿也认为,贝叶斯模型的局限性在于它只能解释信念与知觉之间的相互作用,并不影响身体外形或肢体动作。比如,它不会驱动你离开椅子。

 

贝叶斯模型对于弗里斯顿而言仍是不够的。他使用“主动推理(active inference)一词来描述世界上的有机体最大限度地降低意外度的方式。弗里斯顿认为,当大脑做出的预测尚未被感官回传的信息即刻证实时,大脑可能通过以下两种方式之一来最小化自由能:修改预测,去接受意外度、容许错误、更新外部世界模型;或者,使预测成真如果我推断我的左食指在触碰我的鼻子,但是我的本体感受器却告诉我我的手臂仍垂于腰间,那我可以通过抬起手臂并将伸出食指放在鼻尖来最小化我大脑预测错误的信号。


事实上,自由能原理照此解释我们所做的一切:感知、行动、计划、解决问题。当一个人坐车去办事时,他通过确认自己的假设甚至是自己的幻想,以此行动来最小化自由能。

 

在弗里斯顿看来,将行动和运动转化成数学等式非常重要。他指出,连知觉本身也是“被行动所奴役的”:为了收集信息,眼睛会注视物体,横隔膜将空气吸入鼻子,手指会在物体表面产生摩擦。所有这些精细运动,都存在于一个能作出更多计划、探索*和行动的连续统一体中。

*注:弗里斯顿将这种探索称为“知识觅食”(epistemic foraging)。他造的一些新词被同事们戏称为“弗里斯顿话”。


“我们对周围事物进行采样检验,”弗里斯顿写道,“以确保我们的预测成为一种自我实现的预言。”

 

那么当我们的预言无法自我实现时,会发生什么?一个被意外度打败的生命系统是怎样的?现实证明,自由能原理不仅仅是关于行动、感知和规划方面的一种统一理论,还是一种可以解释精神疾病的理论。要是大脑对从感官涌入的证据信息分配了太少或太多的注意力,精神世界就会乱套。例如,精神分裂症患者可能无法更新他们大脑建立的外部世界模型来解释输入的视觉信息。一个正常人看到的可能是一位友善的邻居,但患者希拉里可能会看到一只巨大、邪恶的“乌鸦”。“如果你去思考精神疾病甚至是大多数神经系统疾病,你会发现它们都只是破碎的信念或错误的推断,也就是幻觉和妄想,”弗里斯顿说道。


过去几年,弗里斯顿和其他一些科学家运用自由能原理来帮助解释自闭症、帕金森病和精神病态(psychopathy)的某些症状,以及焦虑、抑郁和精神错乱(psychosis)等。得益于弗里斯顿设计的神经成像方法,科学家已经从许多案例了解到哪些脑区域在不同的失调症状下会出现运转故障,以及哪些神经信号会被破坏掉。但明白了这一点还不够。“了解哪些突触、哪些连接不正常,还不足以解决问题。”弗里斯顿说,“我们需要一种能解释信念的’微积分’。”

 

故:自由能原理为心智的运转和失灵各自提供了一个统一解释。因此,我们有理由相信,它也可能帮助我们重新构建心智体系。


 



4.自由能原理与人工智能




数年前,一群英国研究人员决定用一种新的分析工具来重新审视国王乔治三世发疯的事实。他们将国王写的大约500封信件上传到机器学习系统中,并大力训练此系统以识别信件的文本特征,包括单词重复度、句子长度和句法复杂度等。训练结束时,该系统能够预测一封皇家信函是在国王躁狂时还是清醒时写的。

 

这种模式匹配技术大致类似于教授机器识别人脸、猫咪图像和语音模式的技术,过去几年在计算领域取得了巨大进步。但它要求大量的前期数据和人工监督,而且可能还很易损。人工智能的另一种训练方法,称为强化学习。它在游戏方面取得了令人难以置信的成功,比如围棋、国际象棋和打砖块(Atari’s Breakout)等。强化学习不需要人们标记大量的训练数据,而只需告诉神经网络去寻求某种奖励,比如游戏中的“取胜”。神经网络通过一遍又一遍地玩游戏来学习,不断优化策略并实现最终通关。同样,狗狗或是以这种不断完成特定任务的方式来获取食物的。

 

但强化学习也有很大的局限性。在多数现实情形下,人们拥有的并非是单一、狭义的目标。(有时候,你必须停止玩Breakout游戏,才能上洗手间、扑灭火灾或者与老板交谈。)大多数真实环境并不像游戏环境那样稳定并有规则约束。神经网络背后的思维就是“它们应该按照我们人类的方式去思考”,但强化学习做不到。



令人欣慰的是,支撑自由能原理的贝叶斯公式——那些难以翻译成文字的公式——已经用机器学习语言编写出来了。



对弗里斯顿以及他的拥护者而言,强化学习的这一失败完全是有据可依的。毕竟,根据自由能原理的解释,人类思维的根本动力不是“寻求一些任意的外在奖励”,而是为了最小化预测误差。很显然,神经网络也应如法炮制。令人欣慰的是,支撑自由能原理的贝叶斯公式——那些难以翻译成文字的公式——已经用机器学习语言编写出来了。

 

Netflix机器学习基础设施负责人朱莉·皮特(Julie Pitt)于2014年发现了弗里斯顿及其自由能原理,从此改变了她的思维。(皮特的Twitter签名是这样写的:“我通过主动推理来推断自己的行为。”)在Netflix的主业之外,她一直在一个名为“量统实验室”的编外项目中探索该原理的应用方式。皮特说,自由能模型的美妙之处在于它允许人工主体(artificial agent)在任何环境中行动,哪怕是一个崭新、未知的环境。在目前的强化学习模型下,你必须不断发布新规则和子奖励,以使你的主体能够应对复杂任务。但相比之下,自由能主体却总能为自己带来自我内在奖励:降低意外度。皮特说,这种奖励还包括了“出走与探索”必行机制。

 

2017年末,伦敦国王学院(KCL)的神经学家兼工程师罗莎琳·莫兰(Rosalyn Moran)领导的一个研究小组让两个AI玩家在某版3D射击游戏《毁灭战士》(Doom)中相互竞争,其目标是将由主动推理驱动的主体和由奖励最大化驱动的主体进行比较。


卡尔·弗里斯顿:万物解释者

罗莎琳·莫兰(Rosalyn Moran)丨图片来源:@CompPsychiatry


基于奖励的主体以杀死游戏中的怪物为目标,但自由能驱动的主体只需要尽可能降低意外度。后者,这个弗里斯顿式的主体在游戏开始时不慌不忙,最终表现得像是胸有成竹似的,例如,它似乎已经意识到,当自己往左移动时,怪物往往向右移动。

 

很快,研究人员发现即使在游戏的虚拟环境中,奖励最大化主体“明显没那么强大”;而自由能主体能更好地学习环境。“它的表现要优于强化学习主体,因为它在探索环境,”莫兰说。在另一场模拟中,以最小化自由能为目标的主体与真人玩家相互竞争,但自由能主体依然保持学习、探索环境。自由能主体开头不急,积极地探索行动策略——进行“知识觅食”(弗里斯顿式术语)——然后迅速达到真人玩家般的游戏水准。

 

莫兰告诉我,主动推理正逐渐渗透到目前更为主流的深度学习研究中,尽管速度不快。另外,弗里斯顿的一些学生去了DeepMind和Google Brain工作,其中一名学生还创建了华为的人工智能理论实验室。“自由能原理正从女王广场的UCL传播出去,”莫兰继续说道。但它仍然不像强化学习那样普遍,因为连本科生都在学强化学习。“本科教育尚未涵盖到自由能原理。”

 

当我第一次向弗里斯顿询问自由能原理和人工智能之间的关联时,他预测,在5到10年内大部分机器学习都会运用到自由能最小化理念。问到第二次,他的反应带着喜感。“哈哈,你想一下,为什么自由能原理被认为是‘主动推理’(Active Inference)呢?”看我在绞尽脑汁思索他的文字游戏,他呵呵一笑,露出了整齐洁白的牙齿。“因为它简称‘AI’呀!”弗里斯顿继续说道。“所以,‘主动推理’是新的AI吗?是的,首字母缩写就是这个,错不了。”这并非弗里斯顿第一次跟我开玩笑。


 



5. 艰深的万物理论




逗留伦敦期间,我还去看了弗里斯顿给一家定量交易公司做的一场演讲。底下估计有60名左右年轻朝气的股票交易员观众,听完演讲他们就可以下班了。台上,弗里斯顿描述了自由能原理将如何塑造人工主体的好奇心。讲了大约15分钟,他让听明白的观众举手。结果只有三只手举了起来。于是他换了一个问题:“如果你觉得刚才的演讲完全是胡说八道而且也听不懂我在说什么,请举一下手?”这一次,很多人举了手!照我看,没举手的观众可能是出于礼貌。演讲还剩45分钟,弗里斯顿转过头看着活动组织者,似乎想问他,大家怎么会听不懂呢?那名组织者经理顿了一下,“其实这里的每位听众都很聪明。”弗里斯顿慷慨而不失风度地点了点头,继续演讲直至结束。

 

第二天一早,我问弗里斯顿,昨天的演讲是否还行?毕竟大多聪明的观众不能理解他。“还将有相当大比例的观众不能理解——这理论本就超出了他们的理解范围。”他坦言,“有时观众会感到泄气,因为他们听说自由能原理很重要,但结果他们却理解不了它。他们认为它是无稽之谈,接着就转身离开。我已习惯了这种现实。”

 

2010年,哥伦比亚大学的精神病学家彼得·弗里德(Peter Freed)聚集了15名大脑研究人员,来讨论弗里斯顿的一篇论文。弗里德在《神经心理学分析》(Neuropsychoanalysis)期刊上发表了这次讨论:“当时房间里充满了数学氛围,我们有:三位统计学家、两位物理学家、一位物理化学家、一位核物理学家和一大群神经成像学家——但显然,我们还达不到理解那篇论文的水平。后来,我和一位普林斯顿物理学家、一位斯坦福神经生理学家以及一位冷泉港神经生物学家当面探讨了这篇论文。结果我再一次感到云里雾里、无法理解,每次都是这样,这论文包含了太多的方程式、太多的假设、太多的运动部件以及太全局的理论,我甚至都不知道该提出什么问题。于是,大家放弃了讨论。”

 

被弗里斯顿的艰深理论给激怒的人甚多,但几乎同时,也有众多人认为他已经解开了巨大的秘密,觉得他的理念和达尔文的自然选择论一样,一丝一毫都包含广阔意义。加拿大哲学家马克斯韦尔·拉姆斯特德(Maxwell Ramstead)于2014年首次读到弗里斯顿著作,当时,他早已开始寻找方法来关联不同规模、复杂的生命系统——从细胞到大脑,从个体到社会。2016年,他见到了弗里斯顿。后者告诉他,某种数学应用于细胞分化——即未分化的细胞变成专门类型的过程——这种数学也可以应用于文化的动态发展。“这次会面改变了我的生活,”拉姆斯特德说。“我差点激动地流鼻血了!”

 

“这原理在历史上绝无仅有,”拉姆斯特德告诉我。那会儿我们正坐在女王广场的一条长凳上谈论,周围是一些附近的住院病人和医院工作人员。在弗里斯顿以及他提出的理论出现之前,“我们像是无奈地游荡在纷繁丛立的学科之中,每个人都汲取着各种复杂知识,但却没有可供知识交换的’通用货币’,”他继续说道。“而自由能原理为我们提供了这种“货币”。”



自由能原理已演变成了科幻作家艾萨克·阿西莫夫笔下真实版的“心理史学”,一种虚构的学科体系,旨在浓缩全部心理学、历史和物理学成一门统计科学。



2017年,拉姆斯特德、弗里斯顿以及墨尔本大学的保罗·巴德科克(Paul Badcock)合著了一篇论文。在论文里,他们运用马尔科夫毯阐释了所有生命及其活动。我们知道,一个细胞要遵循马尔科夫毯并最小化自由能方能生存,而人类部落、宗教信仰和各类物种亦是如此。

 

在拉姆斯特德的论文发表后,FIL的认知神经学家迈卡·艾伦(Micah Allen)写道,自由能原理已演变成了科幻作家艾萨克·阿西莫夫笔下真实版的“心理史学”*,一种虚构的学科体系,旨在浓缩全部心理学、历史和物理学成一门统计科学。

 

*注:在1951年出版的《基地》中,阿西莫夫虚构的一个人物将“心理史学”定义为“数学的一个分支,研究大规模人类群体对恒定社会与经济刺激的反应”。


的确,自由能原理似乎扩展到了如心理史学般的存在,即便称不上“万物理论”。(另外,弗里斯顿跟我说,当细胞陷入迷惑时,会作出错误推理,而癌症肿瘤可能是这种推理的产物。)但迈卡·艾伦还问道,解释一切的理论是否有可能最后什么也无法解释?

 

伦敦之行的最后一天,我拜访了位于里克曼斯沃思镇的弗里斯顿家。他们住在一栋满是动物标本*的房子里,因为他妻子把收集标本当作一种爱好。

 

*注:最近的一个周六,一名男子上门询问弗里斯顿他的妻子是否在家。当弗里斯顿说“在”时,那个男人说:“好。我这里有一只死猫。”他想让弗里斯顿妻子把它做成标本。


巧的是,里克曼斯沃思镇出现在著名小说《银河系漫游指南》的第一页。在小说里,小镇上某个“小咖啡馆里的独坐女孩”突然发现了如何让这个世界变得“美好而快乐”的秘密。但命运弄人。“她还未来得及打电话告诉其他人,突然一场可怕、愚蠢的灾难降临了,这个秘密便从此消失。”

 

人们并不清楚自由能原理是否就是那个“秘密”,能让世界变得美好幸福的秘密,虽然它的一些拥护者几乎是这样认为的。随着会谈深入,弗里斯顿本人采取了更加谨慎的语气,向我指出,只有主动推理及其推论的前景才是一片光明的。有几次,他承认他说的东西可能“一文不值”。在我上一次参加的FIL团体会议中,他告诉大家,自由能原理是一个“仿佛”(as if)概念——它不要求生命体最小化自由能以求得生存。它仅能解释生物自组织。

 

几年前,弗里斯顿的母亲去世了。但最近他一直回想起自己童年时,母亲给他的安慰:你是非常聪明的,我的孩子。“我从来就不是很相信她说的这句话,”他坦言道。“蓦地,我发现自己竟被她的话语给吸引了。现在,我确实相信我是非常聪明的。”但这种新建立的自尊心也使他开始审视他的自我中心性。

 

弗里斯顿说他有两个工作动力。要是有朝一日能看到自由能原理带来了人工意识的觉醒,那当然很好,他说。但这不是他的首要任务。相反,他的第一个主要心愿就是推动精神分裂症研究取得进步,以帮助修复大脑,帮助像利特摩尔收容所中的那些患者。他告诉我,他的第二个主要心愿或是动力,显得“更自私一点。”他想回到十几岁时的那个夜晚,在卧室里看着窗外的樱桃花,继续思索:“我能否用最简单的方法解释万物?”

 

“这是很任性的想法。它不是某位无私医生出于同情而给我的建议,只是一种私欲,想要尽可能完整、严格又简单地理解万事万物罢了,”他说。“我经常反思人们对我开的各种玩笑——有时出于恶意,有时出于逗趣——说我无法沟通。我心想:‘我的理论又不是为你们写的。我是为我自己写的。’”

 

最后,弗里斯顿告诉我,他偶尔会错过最后一班回里克曼斯沃思镇的火车。于是,他索性继续沉浸于思索某个仍需数周方能解开的难题。而后,他便回到办公室,蜷缩在自己的沙发床上,披着那条马尔科夫毯,不必担心外界搅扰,最终安享一晚沉睡。


原文链接:https://www.wired.com/story/karl-friston-free-energy-principle-artificial-intelligence/

Shaun Raviv,自由记者,现居亚特兰大,为《连线》《大西洋月刊》《史密森尼》和Mosaic等媒体撰稿。



– 活动预告 –


卡尔·弗里斯顿:万物解释者



自由能原理与强化学习读书会启动


由能原理被认为是“自达尔文自然选择理论后最包罗万象的思想”,它试图从物理、生物和心智的角度提供智能体感知和行动的统一性规律,从第一性原理出发解释智能体更新认知、探索和改变世界的机制,从而对人工智能,特别是强化学习世界模型、通用人工智能AGI研究具有重要启发意义。


集智俱乐部联合北京师范大学系统科学学院博士生牟牧云,南京航空航天大学副教授何真,以及骥智智能科技算法工程师、公众号 CreateAMind 主编张德祥,共同发起「自由能原理与强化学习读书会」,希望探讨自由能原理、强化学习世界模型,以及脑与意识问题中的预测加工理论等前沿交叉问题,探索这些不同领域背后蕴含的感知和行动的统一原理。读书会从3月10日开始,每周日上午10:00-12:00,持续时间预计8-10周。欢迎感兴趣的朋友报名参与!


卡尔·弗里斯顿:万物解释者


详情请见:自由能原理与强化学习读书会启动:探索感知和行动的统一原理


推荐阅读

1. 长文综述:大脑中的熵、自由能、对称性和动力学2. 神经复杂性经典综述:涌现的复杂神经动力学3. 意识理论综述:众多竞争的意识理论如何相互关联?4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程5. 龙年大运起,学习正当时!解锁集智全站内容,开启新年学习计划6. 加入集智,一起复杂!



点击“阅读原文”,报名读书会

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy