可浏览的人类皮层千万亿次级重建

2020 年 1 月,我们发布了果蝇“半脑”连接组,这是一个在线数据库,提供了果蝇(Drosophila melanogaster)大约一半大脑的形态结构和突触连接。该数据库及其支持可视化重新定义了研究和理解果蝇大脑神经回路的方式。虽然果蝇大脑足够小,可以使用现代绘图技术获得相对完整的地图,但获得的见解充其量只能部分帮助人们理解神经科学中最有趣的对象——人类大脑。

今天,我们与哈佛大学Lichtman 实验室合作,发布了“H01”数据集,这是一份 1.4 PB 大小的人类脑组织小样本渲染图,同时发布的还有一篇配套论文《对人类大脑皮层千万亿级片段的连接组学研究》。H01 样本通过连续切片电子显微镜以 4nm 分辨率成像,并通过自动计算技术进行重建和注释,然后进行分析以初步了解人类大脑皮层的结构。该数据集包含覆盖大约一立方毫米脑组织的图像数据,包括数万个重建的神经元、数百万个神经元片段、1.3 亿个带注释的突触、104 个校对细胞以及许多其他亚细胞注释和结构 — 所有这些都可以通过Neuroglancer 浏览器界面轻松访问。 H01 是迄今为止所有物种中以这种细节水平成像和重建的最大脑组织样本,也是首次对人类皮层突触连接进行大规模研究,研究范围涵盖皮层所有层的多种细胞类型。该项目的主要目标是为研究人类大脑提供新的资源,并改进和扩展底层的连接组学技术。

1728910901701.jpg

人类大脑皮层体积的 PB 级连接组重建。左图:数据集的小子体积。右图:数据集中 5000 个神经元和兴奋性(绿色)和抑制性(红色)连接的子图。完整的图(连接组)太密集而无法可视化。

什么是人类皮层?

大脑皮层是脊椎动物大脑最薄的表层,是最近进化而来的,不同哺乳动物的大脑皮层大小差异最大(人类的大脑皮层尤其大)。大脑皮层的每个部分都有六层(例如L2 ),每层都有不同种类的神经细胞(例如棘状星状细胞)。大脑皮层在大多数高级认知功能中起着至关重要的作用,如思考、记忆、计划、感知、语言和注意力。虽然在理解这种非常复杂组织的宏观组织方面取得了一些进展,但在单个神经细胞及其相互连接的突触层面上的组织仍然很大程度上未知。

人类大脑连接组学:从手术活检到 3D 数据库

以单个突触的分辨率绘制大脑结构图需要高分辨率显微镜技术,这种技术可以对生化稳定(固定)组织进行成像。我们与波士顿麻省总医院(MGH) 的脑外科医生合作,他们在进行治疗癫痫的手术时有时会切除正常人类大脑皮层的碎片,以便进入大脑深层癫痫发作的部位。患者匿名将这些通常会被丢弃的组织捐赠给我们在 Lichtman 实验室的同事。哈佛大学的研究人员使用自动胶带收集超薄切片机将组织切成约 5300 个 30 纳米的独立切片,将这些切片安装到硅晶片上,然后在定制的61 光束并行扫描电子显微镜中以 4 纳米的分辨率对脑组织进行成像,以快速采集图像。

对约 5300 个物理切片进行成像产生了 2.25 亿张单独的 2D 图像。然后,我们的团队通过计算拼接和对齐这些数据以生成单个3D体积。虽然数据质量通常都很棒,但这些对齐管道必须可靠地处理许多挑战,包括成像伪影、缺失切片、显微镜参数的变化以及组织的物理拉伸和压缩。对齐后,应用多尺度填充网络管道(使用数千个 Google Cloud TPU)对组织中每个单独的细胞进行 3D 分割。还应用了额外的机器学习管道来识别和表征 1.3 亿个突触,将每个 3D 片段分类为不同的“子区室”(例如轴突、树突或细胞体),并识别其他感兴趣的结构,如髓鞘和纤毛。自动重建结果并不完美,因此需要手动“校对”数据中的大约一百个细胞。随着时间的推移,我们希望通过额外的人工努力和自动化的进一步发展,向这个已验证的集合中添加更多的细胞。

可以通过名为Neuroglancer 的交互式网络 3D 可视化界面查看图像数据、重建结果和注释,该界面最初是为可视化果蝇大脑而开发的。Neuroglancer 是一种开源软件,在更广泛的连接组学界中得到广泛使用。引入了几个新功能来支持对 H01 数据集的分析,特别是支持根据类型或其他属性在数据集中搜索特定神经元。

1728910860035.jpg1728910867937.jpg1728910876902.jpg

该体积横跨所有六个皮质层 突出显示第 2 层中间神经元 兴奋性和抑制性传入突触

1728910783697.jpg1728910790557.jpg1728910798045.jpg

神经元亚区室分类 枝形吊灯细胞和它抑制的一些锥体神经元 追踪整个体积的血管

1728910724625.jpg1728910760993.jpg1728910772864.jpg

一对神经元之间的串行接触 具有复杂螺旋结构的轴突 具有异常自我接触倾向的神经元

Neuroglancer 与 H01 体积和注释的接口。用户可以根据细胞的层和类型选择特定细胞,可以查看细胞的传入和传出突触,等等。(单击上面的图像可转到所示的 Neuroglancer 视图。)

人类皮层分析

在配套预印本中,我们展示了 H01 如何用于研究人类皮层组织的几个有趣方面。特别是,我们发现了新的细胞类型,以及“异常”轴突输入的存在,这些输入与目标树突建立了强大的突触连接。虽然这些发现是一个有希望的开始,但 H01 数据集的庞大性将为对人类皮层感兴趣的研究人员提供多年进一步研究的基础。

为了加速 H01 的分析,我们还提供了H01 数据的嵌入,这些数据由使用SimCLR自监督学习技术变体训练的神经网络生成。这些嵌入提供了数据集局部部分的高度信息表示,可用于快速注释新结构并开发根据纯数据驱动标准对大脑结构进行聚类和分类的新方法。我们使用 Google Cloud TPU pod训练这些嵌入,然后在整个卷中分布的大约 40 亿个数据位置执行推理。

通过改进压缩来管理数据集大小

H01 是一个 PB 级的数据集,但体积仅为整个人脑的百万分之一。将突触级脑图扩展到整个鼠脑(比 H01 大 500 倍),更不用说整个人脑,仍然存在严重的技术挑战。其中一个挑战是数据存储:鼠脑可以产生 EB 级的数据,存储这些数据的成本很高。为了解决这个问题,我们今天还发布了一篇论文“基于去噪的连接组学图像压缩”,其中详细介绍了如何使用基于机器学习的去噪策略将数据(例如 H01)压缩至少 17 倍(下图中的虚线),而自动重建的准确性损失可以忽略不计。

1728910695018.jpg

噪声和去噪图像的重建质量与JPEG XL (JXL) 和AV 图像格式(AVIF) 编解码器的压缩率有关。点和线表示平均值,阴影区域覆盖平均值周围 ±1 个标准差。

电子显微镜成像过程中的随机变化会导致图像噪声,这种噪声甚至在理论上也难以压缩,因为噪声缺乏空间相关性或其他可以用较少字节描述的结构。因此,我们在“快速”采集模式(导致大量噪声)和“慢速”采集模式(导致少量噪声)下采集了同一块组织的图像,然后训练神经网络从“快速”扫描中推断出“慢速”扫描。然后,标准图像压缩编解码器能够(有损地)压缩“虚拟”慢速扫描,与原始数据相比,伪影更少。我们相信这一进步有可能显著降低未来大规模连接组学项目的成本。

下一步

但存储并不是唯一的问题。未来数据集的庞大规模将要求研究人员制定新的策略来组织和访问连接组数据中固有的丰富信息。这些挑战将需要人类和即将出现的大脑映射数据之间新的互动模式。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论