MIMIC-IV数据库更新到3.0版本

 

 

一、数据扩充

 

住ICU人数增加了30%不到,但是对应的特护单(chartevents表格)体积增加了接近50%,应该新增病人的数据颗粒度要比以前更细。

 

项目 2.2 3
时间跨度 2008-2019 2008-2022
患者人数 299,712 364,627
住院人数 431,231 546,028
住ICU人数 73,181 94,458

 

此次更新最显著的变化是新增了2020年至2022年期间的住院数据。新增数据的具体情况如下:

  • 患者数:从v2.2的299,712增加至364,627。

  • 住院次数:从v2.2的431,231增加至546,028。

  • ICU停留次数:从v2.2的73,181增加至94,458。

此外,数据库中还包含了住院或急诊出院后最长1年的院外死亡率数据。这一改进将极大地提升研究人员对于患者长期预后的研究能力。

 

二、数据改进

 

除了数据量的增加,MIMIC-IV v3.0还对现有数据进行了多项改进:

2.1 语言数据改进

 

之前版本中,“admissions”表的“language”列在非英语情况下常常显示“?”。新版本中,该列提供了标准化的主要语言,这将使得研究人员能够更准确地进行语言相关的研究。

2.2 保险数据改进

新版本中,“admissions”表的“insurance”列类别得到了扩展,包括“Medicare”、“Medicaid”、“Private”、“Self-pay”、“No charge”和“Other”六类。这一改动使得该字段与国家住院样本(National Inpatient Sample)等其他数据库更好地对齐。

三、安装

 

  • 官方还针对3.0更新安装及试图创建代码;

  • 3.0相对于2.2只是病人资料的增加,表格结构跟之前都是一样的;

  • 目前配套的note,ed和cxr模块都还没有升级;

  • 可以使用2.2的代码安装和创建试图表格,可以参考以前的安装教程

 

MIMIC数据库安装保姆级教程(上)

MIMIC数据库安装保姆级教程(下)

安装常见问题(一)

安装常见问题(二)

MIMIC-IV数据库安装常见问题(三)

MIMIC-IV数据库安装常见问题(四)

MIMIC-IV-ED适合科研小白的安装方法

MIMIC数据库官方函数的安装与使用

手把手教会你认识跟安装MIMIC-IV物化视图

 

四、小节

 

MIMIC-IV v3.0的发布无疑为医疗数据研究带来了更为丰富和准确的数据支持。新增的2020-2022年住院数据以及院外死亡率数据,将为研究人员提供更广泛的研究基础。而语言和保险数据的改进,则提升了数据的精确度和实用性。

这一版本的发布,标志着MIMIC-IV数据库在医疗数据领域的又一重大进步。研究人员可以借助这些更新的数据,进一步推动医疗研究的发展,为医疗实践提供更加科学的数据支持。