一、数据扩充
住ICU人数增加了30%不到,但是对应的特护单(chartevents表格)体积增加了接近50%,应该新增病人的数据颗粒度要比以前更细。
项目 | 2.2 | 3 |
时间跨度 | 2008-2019 | 2008-2022 |
患者人数 | 299,712 | 364,627 |
住院人数 | 431,231 | 546,028 |
住ICU人数 | 73,181 | 94,458 |
此次更新最显著的变化是新增了2020年至2022年期间的住院数据。新增数据的具体情况如下:
-
患者数:从v2.2的299,712增加至364,627。
-
住院次数:从v2.2的431,231增加至546,028。
-
ICU停留次数:从v2.2的73,181增加至94,458。
此外,数据库中还包含了住院或急诊出院后最长1年的院外死亡率数据。这一改进将极大地提升研究人员对于患者长期预后的研究能力。
二、数据改进
除了数据量的增加,MIMIC-IV v3.0还对现有数据进行了多项改进:
2.1 语言数据改进
之前版本中,“admissions”表的“language”列在非英语情况下常常显示“?”。新版本中,该列提供了标准化的主要语言,这将使得研究人员能够更准确地进行语言相关的研究。
2.2 保险数据改进
新版本中,“admissions”表的“insurance”列类别得到了扩展,包括“Medicare”、“Medicaid”、“Private”、“Self-pay”、“No charge”和“Other”六类。这一改动使得该字段与国家住院样本(National Inpatient Sample)等其他数据库更好地对齐。
三、安装
-
官方还针对3.0更新安装及试图创建代码;
-
3.0相对于2.2只是病人资料的增加,表格结构跟之前都是一样的;
-
目前配套的note,ed和cxr模块都还没有升级;
-
可以使用2.2的代码安装和创建试图表格,可以参考以前的安装教程
四、小节
MIMIC-IV v3.0的发布无疑为医疗数据研究带来了更为丰富和准确的数据支持。新增的2020-2022年住院数据以及院外死亡率数据,将为研究人员提供更广泛的研究基础。而语言和保险数据的改进,则提升了数据的精确度和实用性。
这一版本的发布,标志着MIMIC-IV数据库在医疗数据领域的又一重大进步。研究人员可以借助这些更新的数据,进一步推动医疗研究的发展,为医疗实践提供更加科学的数据支持。