SCIN:代表性皮肤病学图像的新资源

P)~2H9])JDCP13Q){MYS4CE.png

皮肤状况图像网络 (SCIN) 数据集提供了多样化且具有代表性的皮肤状况图像集合,为人工智能开发、医学研究和公平的医疗保健工具弥补了重要差距。

健康数据集在研究和医学教育中发挥着至关重要的作用,但创建代表现实世界的数据集可能具有挑战性。例如,皮肤病在外观和严重程度上各不相同,在不同肤色上表现也不同。然而,现有的皮肤病图像数据集通常缺乏对日常状况(如皮疹、过敏和感染)的描述,并且偏向较浅的肤色。此外,种族和民族信息经常缺失,这阻碍了我们评估差异或制定解决方案的能力。

为了解决这些限制,我们与斯坦福医学院的医生合作发布了皮肤状况图像网络 (SCIN) 数据集。我们设计 SCIN 是为了反映人们在网上搜索的广泛问题,补充临床数据集中常见的疾病类型。它包含各种肤色和身体部位的图像,有助于确保未来的 AI 工具对所有人都有效。我们已将SCIN 数据集作为开放资源免费提供给研究人员、教育工作者和开发人员,并采取了谨慎的措施来保护贡献者的隐私。

SCIN1-示例英雄

SCIN 数据集中的图像和元数据示例集。

数据集组成

SCIN 数据集目前包含 10,000 多张皮肤、指甲或头发状况的图片,这些图片均由经历过这些状况的个人直接提供。所有图片均由美国个人在知情同意下自愿提供,并接受机构审查委员会批准的研究。为了为回顾性皮肤科医生标签提供背景信息,要求提供图片,包括近距离图片和稍远距离图片。他们可以选择自我报告人口统计信息和晒黑倾向(自我报告的 Fitzpatrick 皮肤类型,即 sFST),并描述与他们所关注的问题相关的质地、持续时间和症状。

一到三名皮肤科医生为每份贡献内容标注了最多五种皮肤病,并为每个标签设定了置信度分数。SCIN 数据集包含这些单独的标签,以及从中得出的汇总加权鉴别诊断,可用于模型测试或训练。这些标签是事后分配的,并不等同于临床诊断,但它们使我们能够将 SCIN 数据集中的皮肤病分布与现有数据集进行比较。

SCIN2-比较

SCIN 数据集主要包含过敏、炎症和感染情况,而来自临床来源的数据集则集中于良性和恶性肿瘤。

虽然许多现有的皮肤病学数据集侧重于恶性和良性肿瘤,旨在协助皮肤癌诊断,但 SCIN 数据集主要包含常见的过敏、炎症和感染性疾病。SCIN 数据集中的大多数图像都显示出早期问题 — 超过一半的图像是在拍摄照片前不到一周内出现的,30% 的图像是在拍摄照片前不到一天内出现的。这个时间范围内的疾病在医疗系统中很少见,因此在现有的皮肤病学数据集中代表性不足。

我们还获得了皮肤科医生对图像的 Fitzpatrick 皮肤类型的估计值(估计 FST 或 eFST)和普通标注员对Monk 肤色的估计值(eMST)。这样就可以将皮肤状况和皮肤类型分布与现有皮肤病学数据集进行比较。虽然我们没有选择性地针对任何皮肤类型或肤色,但与来自临床来源的类似数据集相比,SCIN 数据集具有均衡的 Fitzpatrick 皮肤类型分布(3、4、5 和 6 型较多)。

SCIN3-皮肤分布

与现有的未丰富的皮肤病学数据集(Fitzpatrick17k、PH²、SKINL2和PAD-UFES-20)相比,SCIN 数据集中自我报告和皮肤科医生估计的 Fitzpatrick 皮肤类型分布。

Fitzpatrick 皮肤类型量表最初是作为照片分类量表开发的,用于测量皮肤类型对紫外线辐射的反应,并广泛用于皮肤病学研究。Monk 肤色量表是一种较新的 10 度量表,它测量的是肤色而不是皮肤照片类型,可以捕捉到较深肤色之间更细微的差异。虽然这两个量表都不是用于使用图像进行回顾性估计,但加入这些标签的目的是为了便于未来研究皮肤病学中的皮肤类型和肤色表现。例如,SCIN 数据集为美国人口中这些皮肤类型和肤色的分布提供了初步基准。

SCIN 数据集中女性和年轻人的比例很高,这可能反映了多种因素。这些因素可能包括皮肤病发病率的差异、在线查找健康信息的倾向以及不同人口统计学群体对研究做出贡献的意愿的差异。

众包方法

为了创建 SCIN 数据集,我们使用了一种新颖的众包方法,我们在与斯坦福医学院研究人员共同撰写的随附研究论文中描述了这种方法。这种方法使个人能够在医疗保健研究中发挥积极作用。它使我们能够在人们的健康问题出现较早的阶段(可能在他们寻求正式治疗之前)接触到他们。至关重要的是,这种方法使用网络搜索结果页面上的广告(许多人健康之旅的起点)与参与者建立联系。

我们的结果表明,众包可以产生高质量的数据集,同时垃圾邮件率较低。超过 97.5% 的贡献都是真实的皮肤状况图像。在执行进一步的过滤步骤以排除 SCIN 数据集范围之外的图像并删除重复项后,我们能够发布在 8 个月的研究期间收到的近 90% 的贡献。大多数图像清晰且曝光良好。大约一半的贡献包括自我报告的人口统计数据,80% 包含与皮肤状况相关的自我报告信息,例如质地、持续时间或其他症状。我们发现皮肤科医生回顾性地做出鉴别诊断的能力更多地取决于自我报告信息的可用性,而不是图像质量。

SCIN4-标签

皮肤科医生对其标签的信心(等级从 1 到 5)取决于自我报告的人口统计和症状信息的可用性。

虽然永远无法保证完美的图像去识别性,但在创建 SCIN 数据集时,保护贡献图像的个人的隐私是重中之重。通过知情同意,贡献者意识到潜在的重新识别风险,并建议避免上传具有识别特征的图像。提交后的隐私保护措施包括手动编辑或裁剪以排除潜在的识别区域、反向图像搜索以排除公开可用的副本以及元数据删除或聚合。SCIN数据使用许可证禁止尝试重新识别贡献者。

我们希望 SCIN 数据集将成为那些致力于推动包容性皮肤病学研究、教育和 AI 工具开发的人们的有用资源。通过展示传统数据集创建方法的替代方案,SCIN 为在自我报告数据或回顾性标记可行的领域中创建更具代表性的数据集铺平了道路。

致谢

我们感谢所有合著者 Abbi Ward、Jimmy Li、Julie Wang、Sriram Lakshminarasimhan、Ashley Carrick、Bilson Campana、Jay Hartford、Pradeep Kumar S、Tiya Tiyasirisokchai、Sunny Virmani、Renee Wong、Yossi Matias、Greg S. Corrado、Dale R. Webster、Dawn Siegel (Stanford Medicine)、Steven Lin (Stanford Medicine)、Justin Ko (Stanford Medicine)、Alan Karthikesalingam 和 Christopher Semturs。我们还要感谢 Yetunde Ibitoye、Sami Lachgar、Lisa Lehmann、Javier Perez、Margaret Ann Smith (Stanford Medicine)、Rachelle Sico、Amit Talreja、Annisah Um'rani 和 Wayne Westerlind 对这项工作做出的重要贡献。最后,我们感谢 Heather Cole-Lewis、Naama Hammel、Ivor Horn、Michael Howell、Yun Liu 和 Eric Teasley 对研究设计和手稿的深刻评论。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论