谷歌研究院着手绘制小鼠大脑图谱

人类大脑可能是现存计算最复杂的机器,由数十亿个细胞组成的网络组成。研究人员目前还不了解大脑网络机制故障如何导致精神疾病和其他疾病(如痴呆症)。然而,新兴的连接组学领域旨在精确绘制大脑中每个细胞之间的连接,可以帮助解决这一问题。虽然目前只为较简单的生物体绘制了地图,但绘制更大大脑的技术进步可以让我们了解人类大脑的工作原理,以及如何治疗脑部疾病。

今天,我们很高兴地宣布, Google Research 的连接组学团队和我们的合作伙伴将启动一个耗资3300 万美元的项目,以在未来五年内拓展连接组学的前沿。该项目得到了美国国立卫生研究院(NIH)先进创新神经技术脑研究(BRAIN) 计划的支持,由哈佛大学的研究人员领导,我们将与来自艾伦研究所、麻省理工学院、剑桥大学、普林斯顿大学和约翰霍普金斯大学的多学科专家团队以及来自霍华德休斯医学研究所 Janelia 研究院的顾问合作。我们的项目目标是解决神经科学领域的一项巨大挑战:绘制小鼠大脑的一小部分 (2-3%)。我们将特别针对海马区域,该区域负责编码记忆、注意力和空间导航。该项目是美国国立卫生研究院 1.5 亿美元的BRAIN 计划跨尺度连接(BRAIN CONNECTS) 计划资助的 11 个项目之一。 Google Research 为这项工作贡献了计算和分析资源,不会接受 NIH 的任何资助。我们的项目提出了一个关键问题:我们能否扩大和加快我们的技术,以绘制小鼠大脑的整个连接组图?

连接组学的现代时代

这项绘制小鼠大脑一小部分连接组图的工作建立在该领域十年创新的基础之上,其中包括 Google Research 连接组学团队发起的许多进展。我们希望实现与人类基因组计划早期类似的目标,当时科学家们花了数年时间对人类基因组的一小部分进行测序,同时改进技术,使他们能够完成基因组的其余部分。

2021 年,我们与哈佛大学的合作者成功绘制了 1 立方毫米的人类大脑图谱,并将其作为H01数据集发布,这是研究人类大脑和扩展连接组学技术的资源。但绘制整个人类大脑连接组图需要收集和分析多达 1 ZB(10 亿 TB)的数据,这超出了现有技术的能力范围。

分析小鼠连接组是下一个最佳选择。它足够小,在技术上是可行的,并且可能提供与我们自己的思维相关的见解;神经科学家已经使用小鼠来研究人类大脑的功能和功能障碍。通过合作绘制 10-15 立方毫米的小鼠大脑,我们希望开发出新的方法,使我们能够绘制小鼠大脑的整个剩余部分,以及此后的人类大脑。

几十年来,神经科学家一直致力于绘制越来越大、越来越复杂的连接组。

生物学最大的数据集之一

在这个连接组学项目中,我们将绘制小鼠大脑海马结构 的连接组,该结构将短期记忆转换为长期记忆,并帮助小鼠在空间中导航。小鼠海马结构是我们尝试以这种方式了解的所有大脑中最大的区域。通过绘制小鼠大脑的这个区域,我们将创建生物学中最大的数据集之一,结合了大约 25,000 TB 或 25 PB 的大脑数据。作为参考,我们的银河系中有大约 2500 亿颗恒星。如果每颗恒星都是一个字节,则需要 100,000 个银河系才能匹配该项目在绘制小鼠大脑的一小部分时将收集的 25 PB 数据。

为了说明海马项目的规模,我们计算了需要多少 Pixel 手机(如下图所示的 Pixel 堆栈)来存储已完成的连接组项目(绘制蛔虫和果蝇大脑图)的图像数据,以及刚刚起步的小鼠海马区和整个小鼠大脑项目。

然后,我们将每个 Pixel 堆栈的高度与熟悉的物体和地标进行比较。需要 100 个 Pixel 堆栈(相当于四岁女孩的高度)来存储果蝇大脑的图像数据,这是迄今为止完成的最大项目。相比之下,小鼠海马连接组工作将需要相当于超过 48,800 个 Pixel 的存储量,高度与帝国大厦相当。下面的动画显示了小鼠海马项目将如何超越以前的连接组项目的规模。

我们正在与几位合作者合作,为小鼠大脑的海马区构建一个连接组(脑细胞之间的连接图)。该项目将创建有史以来最大的连接组数据集,规模超过之前绘制较小的蛔虫和果蝇大脑的项目。我们希望这一努力能够促成新方法的开发,让我们以后能够绘制整个小鼠大脑。此动画通过计算存储来自各个项目的数据所需的 Pixel 手机数量,展示了连接组学领域的扩展情况。存储蛔虫连接组数据仅需两个 Pixel(橄榄的高度),而存储整个小鼠连接组的数据则需要一堆珠穆朗玛峰大小的 Pixel。

了解小鼠海马结构的连接组有助于阐明我们大脑的工作方式。例如,我们可能会发现小鼠大脑和人类大脑中这种回路的共同特征,这些特征可以解释我们如何知道自己在哪里,我们的大脑如何将记忆与特定位置联系起来,以及无法正确形成新的空间记忆的人出了什么问题。

开启 PB 级管道

在过去十年中,我们的团队一直致力于开发用于管理大量连接组数据集的工具,并从中提取科学价值。但是,小鼠大脑的神经元数量是果蝇大脑的 1,000 倍,而我们帮助果蝇构建了大脑大部分区域的连接组。启动小鼠大脑连接组研究将挑战我们改进现有技术,使我们能够以前所未有的速度绘制更多数据。

我们将继续完善我们的洪水填充网络,该网络使用深度学习来追踪或“分割”每个神经元通过由电子显微镜数据制成的三维脑体积的路径。我们还将扩展我们的自监督学习技术SegCLR的功能,该技术使我们能够自动从分割体积中提取关键见解,例如识别细胞类型(例如锥体神经元、篮状神经元等)和每个神经元的部分(例如轴突、树突等)。

洪水填充网络通过三维脑空间追踪神经元。

我们还将继续增强我们核心连接组学基础设施的可扩展性和性能,例如用于存储的 TensorStore和用于可视化的 Neuroglancer,以便使我们所有的计算管道和人工分析工作流程能够在这些新的数据规模下运行。我们渴望开始研究,看看窥视老鼠的大脑能告诉我们什么关于我们自己的信息。

致谢

本博文中描述的小鼠连接组学项目将得到 NIH BRAIN Initiative 的部分资助,资助编号为 1UM1NS132250。Google Research 为小鼠连接组学项目贡献了计算和分析资源,不会接受 NIH 的资助。许多人参与了使该项目成为可能的技术的开发。我们感谢 Lichtman 实验室(哈佛大学)、HHMI Janelia 和 Denk 实验室(马克斯普朗克生物智能研究所)的长期学术合作者,并感谢 Google 连接组学团队的核心贡献。我们还感谢 John Guilyard 为本文制作了说明性动画,并感谢 Elise Kleeman 和 Erika Check Hayden 的支持。感谢 Lizzie Dorfman、Michael Brenner、Jay Yagnik 和 Jeff Dean 的支持、协调和领导。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论