请选择 进入手机版 | 继续访问电脑版

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 195|回复: 0

利用机器学习让医疗数据更好地发挥作用

[复制链接]

545

主题

0

回帖

1677

积分

金牌会员

积分
1677
发表于 2024-12-13 23:27:57 | 显示全部楼层 |阅读模式
在过去的 10 年里,医疗保健数据从大部分纸质数据转变为几乎完全数字化的电子健康记录。但要理解这些数据涉及一些关键挑战。首先,不同供应商之间没有通用的数据表示形式;每个供应商都使用不同的方式来构建数据。其次,即使是使用同一供应商的站点也可能有很大差异,例如,他们通常对同一种药物使用不同的代码。第三,数据可以分布在许多表中,一些包含诊疗记录,一些包含实验室结果,还有一些包含生命体征。快速医疗互操作性资源
( FHIR) 标准解决了大部分此类挑战:它具有可靠且可扩展的数据模型,建立在成熟的 Web 标准之上,并且正在迅速成为个人记录和批量数据访问的事实标准。但为了实现大规模机器学习,我们还需要一些补充:各种编程语言的实现、将大量数据序列化到磁盘的有效方法以及允许分析大型数据集的表示形式。今天,我们很高兴开源了FHIR 标准的协议缓冲区实现,它解决了这些问题。当前版本支持 Java,很快将支持 C++、Go 和 Python。对配置文件的支持也将很快推出,此外还将提供工具来帮助将旧数据转换为 FHIR。FHIR作为核心数据模型在过去几年中,随着我们与学术医疗中心合作将机器学习应用于去识别医疗记录,很明显我们需要正面解决医疗数据的复杂性。事实上,为了使机器学习有效地处理医疗数据,我们需要全面了解每位患者在一段时间内的情况。此外,我们希望数据表示能够直接应用于临床环境。虽然FHIR 标准满足了我们的大部分需求,使医疗保健数据比“遗留”数据结构更易于管理,并支持独立于供应商的大规模机器学习,但我们相信引入协议缓冲区可以帮助应用程序开发人员和(机器学习)研究人员使用 FHIR。协议缓冲区的当前版本我们已尽力使我们的协议缓冲区表示适合编程访问和数据库查询。提供的示例之一展示了如何将 FHIR 数据上传到 Google Cloud BigQuery
并可供查询,我们还添加了其他直接从批量数据导出上传的示例。我们的协议缓冲区遵循 FHIR 标准(它们实际上是从该标准自动生成的),但可以进行更优雅的查询。
当前版本尚不支持训练TensorFlow模型,但请留意未来的更新。我们的目标是尽可能多地开源我们最近的工作,以帮助使我们的研究更具可重复性并适用于现实世界的情况。此外,我们正在与 Google Cloud 的同事密切合作,开发更多用于大规模管理医疗数据的工具。
致谢
我们很高兴与 FHIR 社区进行了精彩的讨论并获得了有益的反馈,包括Grahame Grieve、Ewout Kramer、Josh Mandel等。感谢DeepMind的同事、Google Brain 团队和我们的学术合作者。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|绿色天空实验室

GMT+8, 2025-1-22 05:06 , Processed in 0.085790 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表