Google AI :使用深度学习分析电子健康记录

2018-06-13    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
发布人:Google AI 研究员 Alvin Rajkomar 博士和产品经理 Eyal Oren 博士

当患者被送进医院后,他们对接下来发生的事情有很多疑问。我什么时候能回家?我会好起来吗?我还需要再住院吗?准确回答这些问题有助于医生和护士提供更好、更安全和更快速的护理。并且如果患者的情况恶化,医生还可以提前主动采取措施。

预测接下来会发生什么是机器学习一个自然的应用领域。我们可以用它预测通勤途中的交通状况,以及将英语翻译成西班牙语时可能用到的下一个词汇。那么,这些类型的机器学习是否也可以用于临床预测呢?要做到实用,预测必须至少具备以下两点:

可扩展:预测应当直截了当,得出所有重要信息,并且适用于不同的医院系统。鉴于医疗保健数据非常复杂,需要进行大量数据处理,这一要求并不容易满足。

准确:预测应当提醒医生关注真正的问题,而不是用误报警分散他们的注意力。随着电子健康记录逐渐普及,我们正尝试利用其中的数据构建更准确的预测模型。

我们联合加州大学旧金山分校、斯坦福大学医学院和芝加哥大学医学院的同事,在《自然》杂志合作期刊《数字医学》上发表了题为 "Scalable and Accurate Deep Learning with Electronic Health Records" 的论文,这篇论文对实现前文所述的两个目标有所帮助。 (论文地址:https://www.nature.com/articles/s41746-018-0029-1)

 

 

基于去除了身份信息的电子健康记录,我们使用深度学习模型对住院患者进行了广泛预测。值得一提的是,我们能够直接使用原始数据,无需人工对记录中的相关变量进行提取、清理、整理和转换等一系列费时费力的操作。合作伙伴在将电子健康数据交给我们之前,先对其进行了脱敏处理。我们也采用了最先进的安全措施保护数据,包括逻辑分离、严格的访问控制,以及静态和传输中的数据加密。

可扩展性

电子健康记录 (EHR) 极其复杂。以体温为例,因测量位置不同(舌头下方、耳膜或额头),数据往往具有不同含义。而体温不过是一个简单的生命体征。此外,各个卫生系统都会自定义他们的 EHR 系统,这样一来,即使患者在两家医院接受类似的护理,不同的医院采集的数据也大不相同。在用机器学习处理分析数据之前,需要先将它们统一格式。我们基于开放的快速医疗互操作性资源 (FHIR) 标准构建了一套标准格式,之前的一篇博文对此进行了介绍。

格式统一后,我们就不再需要手动选择或调整相关变量了。进行各项预测时,深度学习模型会读取过去到现在的所有数据点,并学习哪些数据有助于预测结果。由于这一过程涉及数千个数据点,我们不得不开发了一些基于递归神经网络 (RNN) 和前馈网络的新型深度学习建模方法。

 

 

我们用时间线来表示患者记录中的数据。为便于说明,我们按行显示各种类型的临床数据(例如就医记录和实验室测试)。每个数据片段都用灰点表示,它们存储在 FHIR 中,FHIR 是一种可供任何医疗机构使用的开放式数据标准。深度学习模型通过从左往右读取时间线,分析患者从图表开头到现在的住院信息,并据此进行不同类型的预测。

于是,我们设计了一个计算机系统,以可扩展的方式进行预测,而无需为每项预测任务手动制作新数据集。设置数据只是全部工作的一部分,预测的准确性也十分重要。

预测准确性

评估准确性的最常见方法是受试者工作曲线下指标,它可以有效评估模型区分特定未来结果患者和非特定未来结果患者的效果。在这个指标中,1.00 代表完美,0.50 代表不比随机结果准确,也就是说得分越高,模型越准确。通过这种指标,论文中报告的模型在预测患者是否会在医院停留很久时的得分为 0.86(传统逻辑回归的得分为 0.76);预测住院死亡率时的得分为 0.95(传统方法的得分为 0.86),预测出院后意外再住院率时的得分为 0.77(传统方法的得分为 0.70)。从统计学上讲,这些提升非常显著。

我们还使用这些模型确定患者接受治疗的状态。例如,如果医生为发烧、咳嗽的患者开具头孢曲松和强力霉素,模型就会判定患者正在接受肺炎治疗。我们想要强调的是,模型不会诊断患者,它只是收集患者的相关信号,以及临床医生编写的治疗方案和笔记。因此,它更像是一位优秀的听众,而不是主诊医生。

我们工作的一个重要焦点是深度学习模型的可解释。每项预测的"注意力图"会展示模型在进行这项预测时认为重要的数据点。我将展示一个示例作为概念验证,并将此视为让预测对临床医生产生价值的重要部分。

 

 

在患者入院 24 小时后,我们使用深度学习模型进行预测。时间线(上图顶部)包含患者几个月的历史数据,我们将最近的数据在图中间放大显示。模型用红色"标注"了患者图表中用于"解释"其预测的信息。在这个案例研究中,模型标注了临床上有意义的信息片段。数字来自我们的论文。

这对患者和临床医生有何意义?

这项研究成果还处于早期阶段,而且也仅基于回顾性数据。事实上,证明机器学习可用于改善医疗保健这一假设还有做很多工作要做,这篇论文只不过是一个开始。医生们已经疲于应付各种警报和需求,机器学习模型能否帮助处理繁琐的管理任务,让他们更好地专注于护理有更多需要的患者?我们是否可以帮助患者获得高质量护理,无论他们在哪里寻求治疗?我们期待着与医生和患者合作,找出这些问题的答案。

标签: Google https 安全 网络 选择

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:计算语言顶会ACL 2018最佳论文公布!这些大学与研究员榜上有名

下一篇:Kaggle 20G数据集强势分析“绝地求生”,科学吃鸡攻略拿走不谢!