人工智能这门技术从诞生以来就一直在从脑科学领域寻找灵感,而现在随着人工智能本身变得越来越强大,它开始反过来“影响”着脑科学的发展。
6月29日,由蚂蚁技术研究院和复旦大学脑科学研究院联合攻坚的类脑研究“基于图计算的脑仿真架构”正式启动。双方希望通过图计算、人工智能与实验神经科学的紧密结合,开发新的大规模高精度脑仿真系统,为理解生物智能和治疗脑疾病提供新的研究手段。
据介绍,蚂蚁和复旦团队的合作,第一期目标是先构建出小鼠 MS 中脑间隔这个脑区的模型,这是攻坚阿尔兹海默症的关键之一,项目周期为三年。
在当天的活动上,项目核心成员做了分享,我们也主持了一场圆桌,听他们分享了项目的来龙去脉,图计算和脑神经科学的最新科研进展,脑科学家和人工智能研究者对所谓通用人工智能的看法,以及贯彻背后的人工智能与脑科学“纠缠不清”的漫长互动史。
对话嘉宾简介:
王云,复旦大学脑科学研究院高级PI、研究员、博士生导师,附属中山医院教授吉凯基因新药事业部首席技术官,上海市药学会药理分会委员。
陈文光,蚂蚁技术研究院院长,蚂蚁图计算技术负责人,清华大学计算机系教授。主要研究领域为操作系统、程序设计语言与并行计算。获国家科技进步二等奖一次,部级科技一等奖两次,国家自然科学基金杰出青年基金获得者,国家重点研发计划项目首席科学家。
王小斐,1998~2005年于清华大学计算机系学习,2006~2010年于不列颠哥伦比亚大学计算机系博士学习。2011年回国后在清华大学信息技术研究院和电子工程系担任高级工程师。现于复旦大学脑科学研究院担任工程师。主持国家自然科学基金项目一项,联合基金两项。发表了包括PNAS的研究论文8篇,其中第一通讯论文2篇。
朱晓伟,2018年博士毕业于清华大学计算机系,主要研究方向为图计算系统与图数据库技术,曾获西贝尔学者、中国计算机学会优秀博士论文奖等荣誉;2020年加入蚂蚁集团,现任蚂蚁技术研究院图计算实验室研究员。
以下为对话实录。
王兆洋:刚刚四位的分享信息量很大,一个很流行的说法,就是听下来死了好多脑细胞,所以想先问一下王云老师, 这种说法对么?
王云:哈哈,这个说法不对,其实更准确的说法是,在丰富环境里面我们的脑细胞更被激活了。
王兆洋:这个我们就放心了,您刚刚提到脑子里的零件都是没有备用件的,每个都不想要失去。
刚才各位的分享让我有很多好奇,首先请各位讲一下这次合作的起源和过程,复旦为什么会选择蚂蚁,以及蚂蚁对合作的期待是什么,以及各位在跨界合作里面,最让你们感到最兴奋的点是什么。
陈文光:我们都是比较实际的讲这件事儿。这件事儿的缘起是小斐有一天在清华门口约我喝咖啡,然后递给我一份论文,说脑的这事儿已经这样了,你这个图计算应该有得搞,能用上。
我一看,这好事儿啊。但是当时还没有想好怎么去运作这个项目,你要弄这件事儿,其实是需要经费的。做实验,刚才我们讲的很多那都是要设备、要材料、要人工,要很多的经费。所以当时还没有完全想好。
所以小斐位置比较关键,他确实拉通两边。这边觉得我们的计算技术可能有用武之地,那边觉得说脑的这些实验技术的发展也确实到了这个程度。所以最后他选择了王云老师的实验室,跟王云老师去沟通了。然后王云老师也很高兴,觉得可以做。
总体上,大家都有一种在这个新技术层出不穷的时候做一些突破性的事情的想法。我觉得这是大家一直都有的动机。然后在小斐居中的联系催化下,形成了这样一个合作。
后面要做这件事还是需要一个相当数量的经费的。其实蚂蚁技术研究院去年的时候就在酝酿,也刚刚成立,像这个额度的在蚂蚁也是不多见的,我们也是跟老苗(蚂蚁CTO倪行军,花名苗人凤)做了汇报。他还是非常支持这样的一种前瞻性的、创新性的项目,所以后面我们就得以比较顺利的去推进,构成了这次的合作。
王小斐:就像文光老师说的,我看论文嘛。一直在学习中,然后看论文就找到相似的点,脑子里的神经元被激活了,然后就去找文光老师。因为我大一就认识文光老师,很多年了。
对于我来说,为什么一直想做这个事儿呢?起源于20年前,我还是清华计算机系的研究生,那时候脑子也不知道哪个神经元有问题,去上了清华大学的神经生物学课,然后课程设计是你要写个东西,但是你不是生物科班出身,你写什么呢?
我写了一个怎么把CPU和人脑联在一起,然后实现一个东西。
当时教我神经生物学课的老师说,计算机系每隔十年就会来你一个这样的。我特别想知道,我之前那十年谁去了。
这是个故事,但是这个故事我现在还能回想起来,这个就是一个理想主义。然后后来我在清华那边参与了各种神经生物学的课程和事情。现在算是懂得确实多一些,当年的梦想我觉得没有错,我们还可以再试试,又有机会了。
王兆洋:那请王云老师也讲讲,小斐老师怎么打动您的。
王云:小斐跟我讲过很多次陈老师刚才介绍的那个故事。其实小斐来找我他真的不需要打动我,他一说,我就一口答应了。为什么?实际上这也是我刚才因为时间关系没有讲的那一个故事,小斐也都不知道。
我当年从复旦离开去了英国。我就是拿了我刚才讲的1987年那篇论文,英文是我自己翻译的,然后我投到英国去了以后,我就拿到了英国最高的奖学金。那时候年少无知,就进了那个实验室。
我的博士实验室的导师是做数学计算模型的,是做的脊髓的计算模型。我后来跟我导师聊天的时候我说,你为什么招我?我对这个一窃不通。他说我看中是你的技术,就比如我现在的学生能够做膜片钳的话,在差不多40年前,我已经能够做细胞内的记录,那时候还没有膜片钳,而且是在体内的细胞技术。
所以说,小斐和陈老师给了我一个机会,让我读完博士都没懂我的导师在干什么的这一个事情,能够重新捡起来。我希望我在退休的时候能把这件事情做成。
王兆洋:看来这个合作里大家都各自有一些执念在里面的。晓伟有没有要补充的?
朱晓伟:其实这个事情对我来说,某种意义上可以算是一个命题作文,因为有了这样一个项目。
王兆洋:那你现在有点像当年的他们,也是不知道为什么但处在了一个交叉的前沿。
王小斐:这个事情对我自己而言,其实还是有相应的动力在的。从做研究开始,一直到加入蚂蚁,接触到的图计算的应用,他还是感觉局限在一些东西里,当然它离我们生活很近,但是就感觉跟科学有点远。
但是其实我一直知道说,图计算其实是在科学领域,不光是社会科学还有自然科学,都是有这种应用的。所以有这样一个机会,虽然我刚刚说是命题作文,但是这个命题作文我还是很乐意去以一种比较好的状态把它写好。
王兆洋:好,接下来每个人的问题,我先问陈老师。我注意到您过往多次提到一个思路也是指导您工作和科研的思路,就是要做一些有想象力和开创性的东西,而不是说在一个已有的系统里面去做一些修修补补。
刚才您分享里面也提到Open AI,我刚才自己去想,它的想象力好像和跨界这种想象力不太一样,像Open AI这样他相信一个技术路线,充满质疑的情况下去做了很多脏活把这个最终给做成了,这是一个开创性的想象力。另外一种,就像王云老师做了这么多年,他可能就在等这一天,之前没有人把这两个技术融到一块儿去做的,这也是一种想象力。所以想问您,您怎么去定义这个想象力。
陈文光:其实想象力更多的是看那个结果。你做出来的结果让人觉得这东西还能这么做。
像AlphaFold,我们最近是被ChatGPT刷屏了,但是之前AlphaFold也是个非常非常令人震惊的工作,他可以通过输入蛋白质一维的序列,基本上非常精准的预测出他的三维的结构。
因为这个工作我之前用我们叫做第一原理的方法做过,实际上他非常的耗时。你要真正的通过那个方法要得出来一个完整的蛋白质的序列,需要非常长的时间。所以就会有一个项目叫做Folding@home,就是把这个任务分发到这些空闲的桌面机,全球的人的机器上面去做。因为和这个对应的之前叫SETI@home(Search for Extraterrestrial Intelligence at home,在家探索外星文明),那些分析外星信号的一样也是计算量非常大的。
所以,过去这么大计算量的一个工作,现在由于有了AI的方法的演进,可以能够拿到这样一个非常惊人的效果,我觉得从这个角度讲,我认为就是很有想象力的。
包括AlphaGo也是这样的,其实他不太在那个过程。你说我就是认定了一个方向就往前走,还是说我是通过交叉做出来的,还是通过其他的方式做出来的,我觉得方式不重要,最重要的是那个结果你要先能想到。
因为有些科研是说你就是做出来了,大家也觉得也还可以,就那么回事儿吧。但我觉得我们这个项目,我们这次跟王云老师这两年的项目,我们其实还只是做了一个很小的区的模拟。但是一个大的愿景,我们还是真的希望能够精准的、精确的去模拟全脑。
这个事情我想如果能做出来一定是非常有想象力的。
当然这里面还有很多挑战,刚才小斐说了,要10的29次方。大家知道,现在所谓的的AI涌现现象,是10的24次方。10的22次方以上就有一个大拐点,但是他还是FP16(半精度,深度学习里的一种数据类型)的,或者现在新的一些精度的,但是像这个里面,经常是FP64(双精度)。就是说,他的一次计算顶你10次计算的复杂性。所以说这个计算量还是非常有挑战的。
这是计算量的角度,我们之前做过好几个工作,包括在咱们国家最大的超级计算机上我们做过100万亿边的图,这个量级我们其实是已经达到了。包括大模型训练,我们也都做过100万亿参数模型的训练。所以我觉得我们在相关的一些技术的基础上,也不是完全的没有基础,或者说我们现在的一个想象,应该就是说一个极大的计算能力,我们是有足够的能力去支撑的。再和这样的一个领域相结合,我们相信是一个值得探索的方向。
王兆洋:也就是要做就要做最重要想象力最大的事情。
陈文光:是的。
王兆洋:另外今天这样的合作里,大家也很关心图计算这个技术本身发展的现状是什么样的。
我们最近关注很多生成式人工智能相关的进展,我会理解图计算更偏向数据那部分,而现在外界更关注的是算法、模型这些非常光鲜的、能让每个人都聊两句的东西。这里面包括很流行的GNN这些,其实跟图计算有关,但人们似乎没太关注里面图计算扮演的角色。所以结合生成式人工智能的进展,请您讲一讲图计算现在的一个现状。
陈文光:对。图和关系数据相比较的话,你可以看成是在更深度的关联上面的一种数据处理的方式。但其实图和智能之间我认为也是天然的有两个连接点的。就像你刚才讲的,第一个点是知识图谱,第二个点是图神经网络。
那么这两个点,未来还是有很大的空间的。当然之前陆奇讲过一个话,不要用知识图谱,就用统计的模型就好了。但后来也有说法说陆奇否认他自己说过这句话,是媒体的误传。但是不管怎么样,实际上蚂蚁技术研究院另外一个我们想做的事情,实际上是希望能够做大规模的常识知识图谱,因为你可以想现在的大语言模型说他读了这么多语言的东西,他自动的自回归的自生成了一个类似于把知识嵌入进去了。但是实际上这样的语言模型,也为大规模的生成一个显式的知识图谱提供了机会。就是过去可能处理不了这么好,现在你能够处理的比过去更好了。
那么数据能够有一个显式的知识图谱,比过去的知识图谱的规模大10-100倍的这样一个规模的显式的知识图谱出来。有了这个东西以后,他对于解决现有的模型中的一些幻觉、一些不确定的问题,是会有很多的帮助。
这也是我的一个信仰。
但是我也跟很多人谈过,大家现在的思路都不一样,有认为说知识图谱本身有扩展性的问题,所以他应该只局限于在一些领域里面构建一些知识图谱,去和大模型作为通用的知识去结合。但我自己还是刚才那个逻辑,我们要想一些比较难的,或者说别人认为可能这条路是比较挑战或者不太容易做的事情,我可能还是想往这个方向去发展。
所以整体上,从智能的角度来讲,图的角度来讲。第一个就是我们和神经科学、脑科学结合,去有一些更多的促进和发展。另外一个是大规模知识图谱的构建,看看这个能不能有一些涌现的现象出现。大概是这样的一个考虑。
陈文光
王兆洋:感谢,接下来问问王云教授。
我们刚才讨论会发现,今天人工智能领域是一个充满不同路线,彼此较量的一个学科。而脑科学方面,您刚才讲的美国和欧洲的不同项目,其实背后也有一个路线的不同,就是到底模拟出来的脑重要,还是脑是完全模拟不了的,你就先做,然后你再逆向工程,再去解释这个原理。
现在看起来我们是选择模拟脑的路线。不过我回想了一下人类的技术演进,尤其是人类想要超越自身限制,模仿一些大自然里的神奇能力的过程,比如最典型就是飞机,人类也是一开始像达芬奇设计的跟鸟一样扇翅膀,但是后来飞机真的实现飞行的梦,并不是扇翅膀,反而是先有了飞机,再有研究出来流体力学、空气力学这种东西的逆向工程的感觉。
所以您怎么看今天脑科学和人工智能结合时候的技术路线?
王云:这件事情,从我的观点来讲,我会认为我们去做这样的一个脑的话,肯定首先是要对脑的一些基本的原理做深入的理解。
刚才的视频里面已经讲的很清楚了,里面有一个数字,他们里面模拟的2000多个连接的时候,只有20个可能性,已经可以被实验科学所做到的。那么我们就可以看到,我们要对这个实验科学去理解,他肯定是一个很长时间的,而且需要耗费大量的资金、人力和财力的过程来做到这件事情。那么在这个发展的过程中,刚提到的两种路线,这两者必然是一个结合的。陈老师在最开始的时候讲了,这两者就是互为相互关系的,不是说哪一个更在一个前面或者更在一个后面的关系。我是这么来理解的。
我是希望说,这两者之间能够互相互补,任何的知识发展,任何的技术发展,和理论和技术、理论和最终的产品,我一直认为认可的是互为推动、螺旋式上升的过程,而不是说我只有先有一个理论完全成熟了以后,才能有这个技术,才能变成一个产品。或者说,我先要有了技术、先要有了产品,才能推动这个理论的发展。我希望是一个能够互相互为的作用,然后螺旋式上升,才能够不断的是一个有序的上升。
王兆洋:也就是像刚才陈老师说的,互为目的和手段,以及螺旋式上升。那么如果具体到这一次的合作,我刚刚听到也有第一个两年的规划,第一个阶段谁会先是谁的目的?
王云:这么说吧,接着我刚才讲的我和我的博士导师之间的对话。
我那时候真的是年少无知,我也不懂,我就给他提供数据。这是一个很粗浅的参与方式。陈老师在前一次我们沟通的时候也是一直就强调,前面很多的人在做这样的模型的时候,都是说我只要拿到生物学的数据以后,我就来建模,建了模了以后就是这样。
我们希望是说,我们互为目的和结果,就是一个螺旋上升的,而且不仅我们可以获取不管是美国脑计划、还是欧洲脑计划,还是其他的实验室里面的数据,我们更要获取我们自己实验的数据。
为什么我讲这一点,我们知道生物学的数据里面,刚才讲了,我们对这个脑区已经知道他有三类神经元,有论文发表。但是大家知道生物学数据里面有一个很重要的,我为了一个目的去做的实验,他有基础。所以说我现在给我的学生一个指标,没有任何的基础,你就是“盲着眼睛”去做,不要说这两个细胞之间,我找到有关系的我才去记录他。
所以说我们要真的通过大数据,通过数据去验证,然后推动这个模型向前发展。这也是陈老师所希望的,我们不是一个松散的联系,而是紧密的联系,我们要不断复盘我们的结果,复盘我们的模型。
王兆洋:听下来脑科学跟人工智能比起来,路线的意味不太强烈,更多的是一个只要能为我所用,都会用到你的研究里面。
王云:对,因为如果为了想要说明一个科学问题,那么我就是有目的的去获取这样相关性的数据,但是我们在做真正仿真的时候,我就必须是一个真,真是一个非常重要的词,真才是一个真正的词。我们对这个真的了解是什么?这是关键。
王兆洋:我还想追问一下,刚刚听您分享您的科研历程,会发现脑科学还有一个特点,一方面在学术研究上,像您刚刚讲的是40多年其实对大脑还是一无所知,其实这也意味着对科学家做科研突破诱惑性非常大,甚至需要像您刚提到的没有目的的去追求极致的真。但另一方面,您刚才同时也提到在开发药物的经验,其实现在我们普通人太需要马上有研究成果转化出来的,帮助到大家,甚至是救命的一些东西。
那么这两者如何平衡,您是怎么去把握的。
王云
王云:我觉得这在于说明确你的不同的目的。
如果说在实验室,就是两个科学问题。第一个是关于这个脑仿真相关的科学问题,这里面的网络架构是怎么样的,神经元的网络架构和仿真网络是怎么样的,他这是一个真实的东西,或者说是一个客观的东西,那我就要客观的呈现。那么陈老师他们这个图计算里面出来的仿真的才能够真正的是和真更加接近,或者说无限接近的一个过程。
而我们在去做药物的测试的时候,或者说药物研究的时候,我就要去针对我所要的这个目的,去获取我针对的这个靶点相关的数据,那么一些不相关的数据,我就可以先放到一边去。
所以,你要根据不同的目的,采取不同的手段,没有对和错,只是你的目的一定要明确。我一直和学生在讲,只有你的目的明确了,你做的事情才是正确的。
王兆洋:好。感谢。接下来问问晓伟老师,刚刚你分享了很多图计算的案例,像你说的,其实都更贴近实际的场景,比如用在社交网络关系的分析,欺诈的可能性的分析,你也提到图计算现在要用到脑科学的时候,其实还有一些不太一样的地方,比如神经元的复杂度也不太一样。那么如何让这个技术更适配脑科学的需求。
王小斐:这个事情需要随着计算机这边的同学相应的神经科学方面知识的不断的积累来不断加深。
最开始的时候,我们就觉得神经元好象就应该是一个点,但我们讨论时候就会发现好象把神经元当点不一定是最好的选择。当然了,现在我们也很难说是不是现有的那些框架,比如说用树来描述这个神经元,就是一个更好的选择,也不一定。
但一方面是说我们了解了更多之后,会有更多的idea,但是其实我们做系统的很难说一定哪一个是最正确的,我们要都尝试过之后,然后再来看哪个更好。
以及其实可能真的没有更好的,因为做系统的最重要的一个事情就是取舍,我在某方面获得的提升可能是牺牲了另一方面的。所以,我觉得这个事情挺有意思的,但是这个会在学习和实践的过程当中不断的来修正我们的一些已有对图计算的一些认知。
王兆洋:刚提到学习不同知识,我记得有人形容计算神经学是人工智能跟脑科学之间的桥梁,听刚才大家分享,其实会发现这个合作里,小斐老师就是蚂蚁和复旦之间的桥梁。
有一个问题想问小斐,其实刚才听了你分享之后有一个感觉,就是会觉得这合作早就应该是这样啊,怎么直到今天,图计算才被用到了脑科学,开玩笑的话,是不是你更早看到论文就会更早做这个事儿?
王小斐:哈哈,其实一直在看论文,主要工作就是看论文。之所以之前没有到现在这个状态,其实是因为一个是生命科学的技术是在不断成熟的。
从膜片钳到多通道膜片钳,到更多,现在王云老师说的这个工作量,已经是非常优化的一个结果了。
第二个方面是数据方面的积累,确实是美国脑计划和欧洲脑计划让数据开始攒得多了。如果你数据量不到位的话,这些都是无源之水。
第三个方面是图计算技术成熟,或者说大家开始动这个脑子了。也是从2020年之后,就是我那张图,那个蓝色部分,2020年左右出现了好几个蓝色的小框,这就是意味着大家开始做这个事儿了。
我讲一个科学故事,但是不太负责任啊。大家都知道希格斯,希格斯获得了诺奖。但是希格斯的发现是1960年代的。他当时为什么发现了这个?推算出希格斯粒子的论文其实在三个月里面有6-7篇,这6-7篇论文来自于欧洲和美国不同的地方,这些都是理论物理学家推出的。
那么为什么在这三个月中出现了这么多,且都推出了希格斯粒子?就是因为欧洲的实验物理学砸出了东西,这个设备建成了,这个能级达到了这个程度了,实验数据就出来了。而若干个搞物理的组都知道这个数据,都等着这个数据,都在做这个东西。
然后希格斯是被接受的第一个。然后那之后希格斯就一直在锻炼身体,直到拿到诺奖——我说了我对这个故事不负责任啊。所以爱丁堡大学的一景,就是每天去看希格斯跑步。然后终于在希格斯90岁还是92岁的时候,拿到了诺奖。那么多推出来的,为什么是他?一个是活的久,另一个是欧洲的加速器能级升级了,就又砸出了一批数据,验证了希格斯粒子,另外那6、7个都是算的慢,但是都是对的。
所以,其实大家都知道,但就必须得有实验数据砸出来了才行。于是第二年赶快给希格斯老头子诺奖。这个故事就是这样的,不负责任的一个故事啊,但这就是一个时间到了,可以做了。
王兆洋:有意思的故事,相比起来,我们这件事儿,其实是两个学科都要同时到了一个节点。也是一个螺旋的关系。
王小斐:没错。
王兆洋:你刚才提到这个,也会让人想到现在的人工智能,所谓涌现,也有这种感觉,ChatGPT出来以后,马上就出现了其他的希格斯们,只不过比他证明的慢一点,现在还在跑,而且没有那么快。
今天你的身份是最特殊的,跨两边的,所以对人工智能一些话题也可以让您聊一下。刚才王云老师说了,包括整个研究脑的人肯定都会有这个敬畏,就是说我们对脑依然一无所知,但为什么一个好像要复现人的脑的人工智能出现了这么大的一个进步,让人们觉得我们离通用人工智能更近了?你有想过这样一个问题么,或者怎么理解这个问题?
王小斐:作为学计算机的跳到生物这边,我本质还是相信(智能是)计算机可以计算的,早晚会出现。但是人工智能我觉得现在包括ChatGPT也已经出现了,跟人还是不一样。或者说,他还是一个工具,并不好评估到底他跟人有多像。
或者说它不一定跟人有多像,而是人可能比想象的更接近机器,这是一个反向的思路,我倾向于这个。
王兆洋:就是不一定一切讨论都要以碳基为出发点,可能是硅基。
王小斐:或者说,人不像自己想象的那么有随机性,因为我印象很深,ChatGPT出现了之后我就在想,当时对我震撼蛮大的,他确实聊的很像个人。
后来我就做了一个思维实验,我想了我每天思考的事儿到底有多少件?我发现不多。人没有想象的那么聪明,而不是AI进展过快。不过我这个可能是一个邪道,我过滤了一下自己,我每天思考的事儿,大概就是吃饭、睡觉,不需要很多智能。
王兆洋:归根结底还是像王云老师说的,怪我们大脑。谁告诉我们要研究大脑,谁告诉我说大脑最厉害,其实都是大脑告诉我们的,所以可能大脑骗了我们。
王小斐:对对对,我在反向的复盘他的工作量。
王兆洋:看来还是得给大脑列比较清楚的KPI。
王小斐:是的。
王兆洋:最后有一些供大家去一起讨论的问题。
第一个问题,刚才跟王云老师在聊,前天我也去了复旦听拉维特(michael levitt)教授在分享,我觉得有一个让我觉得挺厉害的,他是一个生物科学的人,但他分享了他对人工智能怎么去理解,非常精炼简洁。
而作为对比,我刚才注意到一个细节,各位每个人的幻灯片里都涉及到了对方领域的东西,但是一旦到相关部分的时候,大家都很谦虚,会说我这个可能不对,我这个可能是从网上拿来的。但是我觉得跨学科有一个很大的价值是,你带来的不同的视角,和不同的对本质的理解。
所以请大家不要谦虚,分享一下在图计算的研究者或者科学家眼里面,脑科学是什么东西,以及在脑科学家的眼里,图计算或者人工智能是怎么去理解的。
图左到右:陈文光,王小斐,王云,朱晓伟,王兆洋
陈文光:对,你刚才说的人工智能和脑科学之间的关系,我也想稍微回应一下。
实际上人工智能是有他自己的发展道路的,就是数据加算法加上规模,我觉得基本上是这样的一个关系。
你不能说他完全没有参考脑的事儿,如果你看深度神经网络,和人的那个视觉脑区的层次结构是有一定接近的。但是,相当多的人工智能研究者都认为,他们两个并不需要完全的绑定,并不是脑怎么做的,人工智能就要怎么做。
人工智能其实有了自己这个学科发展的一些方式,包括他向不同的方式探索,包括大规模的并行处理,达到现在的效果,我觉得它是既有联系又有它自己独立的发展路径的。
所以,并不是说我们理解的脑越多,你就一定会有更好的智能。
但是为什么我们还是希望做这件事呢?原因是说,如果我们想突破现有的这条路径,这条路径他已经走的很好了,走的不错了。我们想说,怎么能做得更好。
我们其实没有太多别的方法,就比如知识图谱可能是一个方法,另外,理解人脑是怎么运作的,可能也是一个可能的方法,这个我觉得更多的是从一种替代路径的角度来考虑这件事情。
我觉得你刚才举的飞机和鸟的例子也是很合适的,飞机并不是完整的去模拟了一只鸟,但是我如果理解了鸟的一些行为的规律,对我设计飞机应该说还是有帮助的。我觉得他们两个是这样的一类关系。我觉得这是人工智能和脑之间的一个关系。
王云:小斐刚才讲的那个东西我补充一点。小斐刚才说作为一个人来讲,每天在思考的事情并不多,我就是吃饭、睡觉、工作。我不同意这个观点。
实际上站在神经科学的角度来讲,人涉猎很多的东西,但是都是一种无意识的涉猎,或者说现在有一个比较时髦的叫做斜杠,我很喜欢做一些斜杠的事情。我们的信息进来了以后,对他进行了一些处理了以后,他会根据不同的需求,然后构建成不同的网络。那么如果说我们的每天的任何的信息,我们在座的每一个人,每天获取的信息的量是差不多的。你的这些信息是不是能够被进行计算了以后,和你原来的记忆一起,是要对他进行编码,编码了以后,要把原来的信息提取出去然后进行再编码,这个过程叫什么?这个过程在神经科学或者叫认知科学里面、心理学里面叫信息的融合,你要把这些信息给综合起来。
从我个人的认知上面来讲,我现在越来越觉得,我们看一个人的知识量大不大,或者他聪明不聪明,实际上就是你对这个信息的融合的能力,而不是你信息的获取的能力有多少。现在我们的信息获取更多了,来源更多了,但是你能不能把这些信息的融合起来,把一个信息叠加成多个的信息。所以我说,你每天可能就这件事情,但是你的一些无意识的信息,都在促进你的脑的成长,你的思考,你的那些能力的提升。
围绕您刚才的问题,我在过去几年里面,我刚才说了跨界、斜杠,比如我对脑机接口非常感兴趣,有机会和做脑机接口的公司互动,他们邀请我讲课,我也要求他们给我讲讲。当然我之前也不是说从0开始的,这就是我刚才讲的,我的这些信息不断的在从其他地方进来,并且已经储存在你的脑子里面,可能在你的潜意识里,那么你的这个信息来了,你就能融合。
所以我们从神经生物学的角度来讲,我对像是Alpha Fold等人工智能这些都是非常关注的,我在前面去做报告的时候,我最初在我的合作的公司里面,他们开发出来了一个关于靶点研究的,当然他后来有一个自己的名字。最早还没有自己名字的时候,我就把它命名为Alpha G,实际上就是我们用人工智能去判断这个基因的可成药性,我就给他命名为Alpha G,实际上原理是一样的。
所以说,跨界这不是一个很大的问题,只在于说你能不能够更多的关注他,而且把他给结合起来。这是最重要的。
王兆洋:时间关系,最后一个问题。刚才我突然发现,我们看起来是蚂蚁和复旦在谈合作,但其实台上也是一个复旦和三个清华。我觉得有一个很有意思的问题问一下大家,刚才提到计算神经学,你看小斐分享里面有一个计算社会学,似乎计算两个字后面可以加任何东西,包括图计算也是有这种属性,能跟很多学科做很深入的融合。
我现在想问的是,各位都有一些学界、企业界双重身份,我们都会遇到跨学科的,就像我们刚才调侃说自学,未来尽量不要自学,需要有一些方法。能不能跟大家分享一下每个人的一些想法。
王小斐:我的心路历程是一个比较复杂的过程,从小就感兴趣,然后大学的时候修了课程。我一共读计算机系修了生化原理、神经生物学和营养学三门生物系的课,分数还可以,中等偏上一点,因为老师比较怜惜我。
王兆洋:毕竟十年才来一个。
王小斐:对。后来一段时间,专心的写程序。有一段时间也和生物系的同学在组里做实验,后来自学成才是自学成才,但是跟生物系的人就混在一起了。然后你会发现,是可以自学成才的,学习曲线极其陡峭,但是兴趣是最好的老师,你感兴趣你就会想把他搞明白。
曾经有一个老师问我,你这样到底图个啥?
我当时就说,我想知道这个世界为什么是这个样子的。
那个老师到现在对我还挺好的,就看你兴趣驱动,就是王老师的PPT里面的那个小白鼠,下面就写着“Explore(探索)是人的本能”。大家开玩笑说抗AD最好的就是你的环境要丰富,在一个玩具非常多的环境中的小鼠,它的老年痴呆概率就是把单一环境下的小鼠要低得多,探索就是让自己神经元总在兴奋,然后就可以有趣。
王云:我有一个很重要的感受,您刚才讲了,我们这边是一个复旦、三个清华。但我还是想说,这是蚂蚁和复旦的合作。这实际上不仅是一个跨界所带来的创新的项目,对你个人也是非常非常重要的提升。因为你在一个狭窄的社会环境里面生长是不行的。
刚才小斐也讲了,我们老鼠在一个单一的环境里面,它的神经元的生长,我们说神经元本身不能增加了,但是它的树突上面的这个关联的突出是会增加的。老鼠你让它在丰富环境里面多了以后,它这个突出会增多。
给我自己的亲身体会是什么?如果说我早几年回国的话,我跟现在完全是不一样的,在学业上会有一些更好的成就,但是我一点都不后悔,为什么?我去了企业。那几年给我的个人的成长,从我个人成长的丰富度上面来讲是不可比拟的,我至今我认为我在礼来的那几年获得的所谓的大厂的正规的训练,对我的整个人生是非常非常重要的。所以说,我特别感谢蚂蚁,特别感谢陈老师,能够有这样的机会我们进行合作,真正的做校企合作。
王兆洋:感谢大家,非常期待合作接下来的成果。