3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

662次阅读
没有评论

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

  新智元报道  

编辑:Lumina

【新智元导读】谷歌宣布将绘制出小鼠大脑中海马体的所有连接组,这将是人类有史以来最大的生物数据集。


人脑是现存最复杂的计算机器,由数十亿个细胞网络组成。

而直到现在,研究人员也没能破解大脑中的细胞网络机制的缺陷是如何导致了精神疾病和痴呆等其他疾病。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

然而,新兴的连接组学领域可以帮助解决这一问题。

连接组学旨在精确绘制大脑中每个细胞之间的连接图,现在,学界已绘制了较为简单的生物体的大脑图谱,如果蝇。

但想要绘制更复杂一点的生物体,就变得十分困难。

而绘制更大的大脑图谱的技术进步可以促进对人脑是如何工作的了解,以及如何治疗脑部疾病。

近期,在美国国立卫生研究院(NIH)的创新神经技术(BRAIN)大脑研究项目的支持下,谷歌研究院的Connectomics团队将与哈佛、艾伦研究所、MIT、剑桥大学,普林斯顿大学和约翰霍普金斯大学的多学科专家团队,以及哈佛大学医学研究所Janelia研究园区的顾问一起展开研究。

这项耗资3300万美元的项目,目标是解决神经科学领域的巨大挑战:绘制小鼠大脑的极小部分图谱(2~3%)。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

这项研究将特别瞄准,小鼠大脑中负责记忆编码、注意力和空间导航的海马区。

谷歌Connectomics团队将为该项目提供计算和分析资源,这也引出了一个关键问题:

我们能否通过扩大和加快数字化技术,从而绘制出小鼠大脑的整个连接组?

现代的连接组学

绘制小鼠大脑的2~3%,听起来似乎也不是什么大目标。但实际上,连接组学走到这一步,已经花费了数十年的创新和积累。

2021年,谷歌和哈佛大学合作成功绘制了一立方毫米的人脑地图,并将其作为H01数据集发布。

这成为了研究人脑和扩展连接组学技术的宝贵资源。

但人脑的神经网络的复杂性甚至可以与宇宙的星系网络相比拟,绘制整个人脑连接组将需要收集和分析多达泽字节(十亿个TB)的数据。

这远远超出了现有技术的能力。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

于是人们把目光转向了同为哺乳动物,并且与人类基因组相似程度达到90%的小鼠身上。

将其选为绘制大脑连接组的原因有两点:

首先,小鼠的大脑足够小,在技术上是可行的。

其次,小鼠的大脑有可能提供与我们自己的大脑相关的见解,如神经科学家已经用小鼠来研究人类大脑的功能和功能障碍。

通过合作绘制10-15立方毫米的小鼠大脑图谱,开发出新的方法,让我们能够绘制小鼠大脑的其余部分,以及之后完整的人类大脑图谱。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

几十年来,神经科学家一直致力于绘制越来越大、更复杂的连接体图谱

生物学上最大的数据集之一

谷歌Connectomics团队将绘制小鼠大脑海马体形成的连接组,它能将短期记忆转化为长期记忆并帮助小鼠在空间中进行导航。

通过绘制小鼠大脑的海马体的连接组,可以帮助我们了解大脑中最大的区域,同时创建生物学领域里最大的数据集之一,其中包含约25000TB或25PB的大脑数据。

作为参考,银河系中大约有2500亿颗恒星。如果这些恒星中的每一颗都是一个字节,那么需要10万个银河系才能匹配该项目绘制小鼠大脑一小块区域时收集的25 PB数据。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

为了说明海马项目的规模,谷歌计算了需要多少台有512GB储存空间的Pixel手机(如下所示的Pixel手机堆叠)来存储完成的连接组项目所绘制的线虫和果蝇大脑的图像数据,以及刚刚启动的小鼠海马区和整个小鼠大脑项目。

然后,我们将每个Pixel(单个Pixel的厚度9mm)堆叠的高度与熟悉的物体和地标进行了比较:

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

存储大脑蛔虫大脑的图像数据需要2台Pixel手机,高度与一个橄榄差不多。

存储果蝇大脑的图像数据需要100台Pixel手机,高度与一个四岁的女孩一样高。

相比之下,小鼠海马连接组项目将需要相当于48,800多台Pixel手机的存储空间,高度与帝国大厦相当。

而存储整个小鼠大脑的连接组数据则需要堆叠的Pixel手机与珠穆朗玛峰高度相同。

打开拍字节PB级(10^15)管道

过去的数十年来,谷歌Connectomics团队一直致力开发用于管理海量连接组数据集的工具,并从中提取科学价值。

谷歌曾帮助果蝇建立了大脑大部分区域的连接组,但小鼠大脑的神经元数量是果蝇大脑的1000倍。

构建小鼠大脑连接组的数据对现有技术提出了挑战,团队必须要以前所未有的速度才能绘制更多数据。

对此,谷歌表示将会继续改进其洪水填充网络(flood-filling networks),该网络使用深度学习来追踪或“分割”每个神经元在电子显微镜数据制成的三维脑体积中的路径。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

除此之外,谷歌将通过扩展的自我监督学习技术SegCLR的功能,从分割的三维脑体积中自动提取关键信息:

例如识别细胞类型(如锥体神经元、篮子神经元等)和每个神经元的部分(如轴突、树突等)。

3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量

同时,谷歌还表示将会进一步提升和增强核心连接组学基础设施的可扩展性和性能,例如用于存储的TensorStore和用于可视化的Neuroglancer。

这将使所有的计算管道和人类分析工作流程都能在这些新的数据规模下运行。

一叶知秋,探索小鼠的大脑将会是人类在攻克莫测难解的脑科学路上的又一冲锋。

我们也可以期待,或许完全解析大脑奥秘的这一天,就在眼前了。

参考资料:

https://blog.research.google/2023/09/google-research-embarks-on-effort-to.html


3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量


3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量
3300万美元,谷歌开启5年脑计划!绘制小鼠大脑2-3%图谱,大约一个珠穆朗玛峰的数据量


 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy