通过机器学习提高对难以发现的息肉的检测_人工智能

随着持续、准确地处理大量数据（尤其是视觉数据）的能力不断增强，计算机辅助诊断系统越来越频繁地被用于协助医生工作。这反过来又可以带来医疗保健领域的重大改善。结直肠癌( CRC) 的诊断和治疗就是其中特别有用的一个例子，这种疾病特别致命，全球每年导致超过90 万人死亡。CRC 起源于结肠中的小癌前病变，称为息肉，识别和切除息肉可非常有效地预防与 CRC 相关的死亡。

结肠镜检查是胃肠病学家 (GI) 检测和切除息肉的标准程序，仅在美国，每年就有大约 1900 万次此类检查。在结肠镜检查过程中，胃肠病学家使用带有摄像头的探头检查肠道是否存在癌前息肉和癌症的早期迹象，并切除看起来令人担忧的组织。然而，一些复杂因素，例如检测不完整（息肉出现在视野范围内，但可能由于其大小或形状而被 GI 遗漏）和探查不完整（息肉未出现在摄像头的视野范围内），可能会导致大量息肉被遗漏。事实上，研究表明，22%–28% 的息肉在结肠镜检查中被遗漏，其中 20%–24% 有可能变成癌变（腺瘤）。

今天，我们将分享使用机器学习 (ML) 帮助胃肠道对抗结直肠癌的进展，让结肠镜检查更加有效。在“通过大规模人工智能系统检测难以发现的息肉”一文中，我们介绍了一种 ML 模型，旨在通过帮助胃肠道检测视野内的息肉来解决检测不完整的问题。这项工作补充了我们之前发表的研究成果，该研究通过标记可能遗漏的胃肠道随访区域，最大限度地扩大结肠镜检查期间结肠的覆盖范围。通过临床研究，我们表明这些系统可显著提高息肉的检测率。

探索不完整

为了帮助 GI 检测视野之外的息肉，我们之前开发了一个 ML 系统，通过估算结肠镜检查期间结肠覆盖区域和未覆盖区域的分数来降低未完成探索的概率。这项早期研究使用计算机视觉和几何技术，我们称之为通过深度计算结肠镜检查覆盖缺陷，以计算结肠的逐段覆盖率。它分两个阶段进行：首先计算结肠镜检查视频每一帧的深度图，然后使用这些深度图实时计算覆盖率。

ML 系统从单个 RGB 图像（左）计算出深度图像（中）。然后，基于视频序列的深度图像计算，计算局部覆盖率（右），并检测覆盖率不足且需要再次查看的位置（蓝色表示观察到的部分，红色表示未覆盖的部分）。您可以在我们之前的博客文章中了解有关这项工作的更多信息。

这种逐段检查可以估算出当前段的哪一部分已被覆盖。这种功能的实用性显而易见：在手术过程中，医生可以收到覆盖不足的段的警报，并可以立即返回检查这些区域，从而可能降低因探查不充分而遗漏息肉的概率。

不完整检测

在我们最近的论文中，我们研究了不完整检测的问题。我们描述了一个 ML 模型，它可以帮助 GI 检测视野内的息肉，从而降低不完整检测的发生率。我们开发了一个基于卷积神经网络(CNN) 的系统，其架构将时间逻辑与单帧检测器相结合，从而实现更准确的检测。

这种新系统有两个主要优点。首先，该系统通过减少难以发现的息肉（即胃肠道特别难以发现的息肉）的假阴性检测数量来提高检测性能。第二个优点是该系统的假阳性率非常低。这种低假阳性率使得这些系统更有可能在临床上得到采用。

ML 系统检测到的各种息肉的示例。

我们利用 3600 个程序（8600 万个视频帧）对系统进行了训练，利用 1400 个程序（3300 万个帧）对其进行了测试。所有视频和元数据均已去除身份信息。系统检测到了 97% 的息肉（即灵敏度为 97%），每个程序的误报率为 4.6 次，这比之前发布的结果有了显著改善。后续审查显示，在误报中，有些实际上是有效的息肉检测，这表明系统能够检测到执行内窥镜检查的医师和数据注释者遗漏的息肉。系统在这些难以发现的息肉上的表现表明了它的普遍性，因为系统已经学会了检测最初被所有观看程序的人遗漏的样本。

我们评估了系统对在视野中出现时间少于 5 秒的息肉的性能，这使得胃肠道更难检测到它们，而且模型对这些息肉的灵敏度通常要低得多。在这种情况下，系统获得的灵敏度约为原始程序的三倍。当息肉在视野中出现时间少于 2 秒时，差异更加明显——系统的灵敏度提高了 4 倍。

值得注意的是，该系统对神经网络架构的选择相当不敏感。我们使用了两种架构：RetinaNet和 LSTM-SSD。RetinaNet是一种领先的静态图像对象检测技术（用于视频，通过连续应用于帧）。在固定的计算预算下，它是各种基准测试中表现最好的技术之一，以平衡计算速度和准确性而闻名。LSTM-SSD 是一种真正的视频对象检测架构，可以明确考虑视频的时间特性（例如，检测的时间一致性、处理模糊和快速运动的能力等）。它以稳健和计算量非常小而闻名，因此可以在较便宜的处理器上运行。在更重的Faster R-CNN架构上也获得了可比的结果。不同架构的结果相似这一事实意味着可以选择符合可用硬件规格的网络。

前瞻性临床研究

作为检测论文中报告的研究的一部分，我们与耶路撒冷的Shaare Zedek 医疗中心合作对 100 例手术进行了临床验证，我们的系统实时用于帮助胃肠医生。该系统平均每例手术可检测到一个息肉，而胃肠医生在手术过程中可能会漏掉这些息肉，同时不会漏掉胃肠医生检测到的任何息肉，每例手术的误报率为 3.8 次。胃肠医生的反馈一直很积极。

我们对该系统对改善息肉检测的潜在帮助感到鼓舞，我们期待与手术室的医生一起进一步验证这项研究。

致谢

这项研究由来自 Google Health 和 Google Research 的团队在Verily Life Sciences的支持下，与 Shaare Zedek 医疗中心合作完成。Verily 正通过 Ehud Rivlin 领导的位于以色列的新中心推进这项研究。这项研究由 Danny Veikherman、Tomer Golany、Dan M. Livovsky、Amit Aides、Valentin Dashinsky、Nadav Rabani、David Ben Shimol、Yochai Blau、Liran Katzir、Ilan Shimshoni、Yun Liu、Ori Segol、Eran Goldin、Greg Corrado、Jesse Lachter、Yossi Matias、Ehud Rivlin 和 Daniel Freedman 完成。我们还要感谢在整个过程中提供建议并测试我们的系统原型的多家机构和 GI。我们要感谢与我们一起参与这个项目的所有团队成员和合作者，包括：Chen Barshai、Nia Stoykova 等等。

通过机器学习提高对难以发现的息肉的检测

版权声明

相关推荐

评论