MIMIC-IV常用数据结构 —— hosp模块

MIMIC IV常用数据说明

MIMIC Ⅳ数据库主要有三类数据:

第一类是从医院电子病历系统 (EHR,electronic health record)中提取的临床数据,包括患者的人口统计学、疾病诊断、实验室检测、药物治疗、生命体征等。

第二类是ICU床旁监护设备采集的波形数据、生命体征、液体管理和事件记录,主要来自于IMDSoft MetaVision系统。

第三类是死亡随访数据,通过社会保险系统得到患者院外死亡的日期,作为MIMIC 数据库的组成部分,这部分数据对研究患者的预后很重要。

MIMIC-IV数据库主要分为两个模块,分别是 Hosp 模块和 ICU 模块(其他模块本文不做讲解)

(1)Hosp 模块介绍

Hosp模块提供从医院范围内的电子健康记录中获取的所有数据,这些数据主要在住院期间记录,有一些表格也包括来自医院外的数据。所涵盖的信息包括患者和入院信息、实验室测量、微生物学、药物管理和收费诊断等。

(a)omr(医疗记录表)

在线医疗记录(OMR)表记录了电子健康记录中的杂项信息。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
chartdate 记录日期 记录观察结果的日期 DATE NOT NULL
seq_num 序列数 唯一区分同一天记录的同一类型结果的单调递增整数。例如,如果两次血压测量发生在同一天,seq_num会按时间顺序排列 INTEGER NOT NULL
result_name 结果属性名 每一行提供关于EHR中单个观察的详细信息。result_name提供了对观察结果的可人工解释的描述 VARCHAR(100) NOT NULL
result_value 结果属性值 result_value是与给定OMR观测相关联的值。例如,对于“血压”的result_name,field_value列包含记录的血压(120/80、130/70,依此类推) TEXT NOT NULL
SELECT * FROM omr LIMIT 100;

 

 

知识点:

(1)subject_id。好比病人的身份证,唯一的。另有hadm_id,为入院编号。

subject_id 每个患者有唯一的subject_id。

hadm_id 患者的每一次入院会有一个唯一的hadm_id。

transfer_id 患者每一次更换病房会有一个唯一的transfer_id。

stay_id 在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。

所有id的分配都是随机的,与时间先后无关。

(2)chartdate与storetime。前者是观察记录的时间,后者是存档的时间。同一事,前者早于后者。chartdate与charttime。前者精确到日期,后者精确到分钟。

注意:charttime与storetime不一样,一个是实际上用药的时间,一个是记录用药的时间。研究中,charttime用的多。

(b)provider(提供者编号表)

提供表列出了数据库中使用的提供者标识符,此表只有一个字段属性。

字段 中文字段 字段描述 字段类型
provider_id 提供编号 provider_id列出了整个数据库中使用的提供者的所有可能标识符。提供者标识符遵循一致的模式:字母“P”,后跟三个数字,后跟两个字母或两个数字。例如,“P003AB”、“P00102”、“P1248B”等。提供者标识符是随机生成的,除了在数据库中唯一标识同一提供者之外,没有任何固有含义 VARCHAR(10) NOT NULL
SELECT * FROM provider LIMIT 100;

 

 

(c)admissions(入院信息表)

入院表提供了有关患者入院的信息。由于患者每次唯一的医院就诊都被分配了一个唯一的hadm_id,因此入院表可以被视为hadm_id的定义表。可用信息包括入院和出院的时间信息、人口统计信息、入院来源等。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符,与单个subject_id相关联的任何行都属于同一个人。该表可能有重复的subject_id,表示一名患者多次入院。ADMISSIONS表可以使用subject_id链接到PATIENTS表 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER NOT NULL
admittime 入院时间 admittime提供患者入院的日期和时间 TIMESTAMP NOT NULL
dischtime 出院时间 dischtime提供患者出院的日期和日期 TIMESTAMP
deathtime 死亡时间 deathtime表示患者住院死亡时间,只有当患者在医院去世时,死亡时间才会出现 TIMESTAMP
admission_type 入院类型 admission_type表示对入院的紧迫性进行分类。有9种可能性:‘AMBULATORY OBSERVATION’, ‘DIRECT EMER.’, ‘DIRECT OBSERVATION’, ‘ELECTIVE’, ‘EU OBSERVATION’, ‘EW EMER.’, ‘OBSERVATION ADMIT’, ‘SURGICAL SAME DAY ADMISSION’, ‘URGENT’ VARCHAR(40) NOT NULL
admit_provider_id 标识符 admit_provider_id为收治患者的提供者提供匿名标识符。提供者标识符遵循一致的模式:字母“P”,后跟三个数字,后跟两个字母或两个数字。例如,“P003AB”、“P00102”、“P1248B”等。提供者标识符是随机生成的,除了在数据库中唯一标识同一提供者之外,没有任何固有含义 VARCHAR(10)
admission_location 入院位置 admission_location表示患者在到达医院之前的位置的信息。请注意,由于急诊室在技术上是一个诊所,通过急诊室入院的患者通常将其作为入院地点 VARCHAR(60)
discharge_location 出院位置 discharge_location表示患者出院后的位置 VARCHAR(60)
insurance 保险类型 insurance表示患者的保险类型 VARCHAR(255)
language 语种 language表示患者的语种 VARCHAR(10)
marital_status 婚姻状况 marital_status表示患者的婚姻状况 VARCHAR(30)
race 种族 race表示患者的种族情况 VARCHAR(80)
edregtime 急诊留观时间 edregtime表示患者登记进入急诊科的日期和时间 TIMESTAMP
edouttime 急诊出观时间 edouttime表示患者登记进入急诊科的日期和时间 TIMESTAMP
hospital_expire_flag 院内死亡标记 hospital_expire_flag表示患者是否在给定的住院时间内死亡。1表示在医院中死亡,0表示存活到出院 SMALLINT

知识点:

(1)保险、语言、婚姻状况和种族列提供了特定住院患者的人口统计信息。请注意,由于每次入院都会记录这些数据,因此这些数据可能会随住院时间而变化。

(2)患者入院信息, 以每次入院为单位记录, 每条记录有一个单独的hadm_id, hospital_expire_flag只当次住院是否院内死亡, 部分院内死亡患者没有deathtime, 可能是数据库本身问题.

SELECT * FROM admissions LIMIT 100;

 

 

 

(d)d_hcpcs(代码定义表)

d_hcpcs表用于获取hcpcsevents表中使用的代码定义。这些概念主要对应于医院计费,并且大多是CPT代码。注意:并非所有代码定义都可用。

字段 中文字段 字段描述 字段类型
code 代码 唯一表示事件的五个字符的代码 CHAR(5) NOT NULL
category 代码类别 category表示代码分类 SMALLINT
long_description 长描述 long_description表示给定行列出的代码的文本描述 TEXT
short_description 短描述 short_description表示给定行列出的代码的文本描述 VARCHAR(180)
SELECT * FROM d_hcpcs LIMIT 100;

 

 

(e)d_icd_diagnoses(诊断代码索引表)

d_icd_diagnostics表定义了国际疾病分类(ICD)第9版和第10版的诊断代码。这些代码在患者住院结束时获得,用于支付医院所提供的护理费用。

字段 中文字段 字段描述 字段类型
icd_code 国际定义疾病编码 icd_code表示世界卫生组织制定的国际统一的疾病分类方法,是一种字母和数字相结合的编码 CHAR(7) NOT NULL
icd_version 疾病编码版本号 此编码系统有两个版本:版本9(ICD-9)和版本10(ICD-10)。这些可以使用icd_version列进行区分。一般来说,ICD-10代码更详细,尽管存在将ICD-9代码转换为ICD-10码的代码映射(或“交叉步”)。 ICD-9和ICD-10代码通常都用十进制表示。解释ICD代码时不需要此小数;即“0010”的icd_code等效于“001.0”。 ICD-9和ICD-10代码有不同的格式:ICD-9代码是5个字符长的字符串,完全是数字(前缀为“E”或“V”的代码除外,这些代码用于外部伤害原因或补充分类)。重要的是,ICD-9代码作为字符串保留在数据库中,因为代码中的前导0是有意义的。 ICD-10代码长3-7个字符,前缀总是一个字母,后面跟着一组数值 INTEGER NOT NULL
long_title 编码含义 long_title提供了ICD代码的含义。例如,ICD-9代码0010的标题很长,是“霍乱弧菌引起的霍乱” VARCHAR(255)
SELECT * FROM d_icd_diagnoses LIMIT 100;

 

 

(f)d_icd_procedures(手术操作索引表)

d_icd_procedures表定义了国际疾病分类(ICD)程序代码。这些代码在患者住院结束时分配,用于支付医院所提供的护理费用。

字段 中文字段 字段描述 字段类型
icd_code 国际定义疾病编码 icd_code表示世界卫生组织制定的国际统一的疾病分类方法,是一种字母和数字相结合的编码 CHAR(7) NOT NULL
icd_version 疾病编码版本号 此编码系统有两个版本:版本9(ICD-9)和版本10(ICD-10)。这些可以使用icd_version列进行区分。一般来说,ICD-10代码更详细,尽管存在将ICD-9代码转换为ICD-10码的代码映射(或“交叉步”)。 ICD-9和ICD-10代码通常都用十进制表示。解释ICD代码时不需要此小数;即“0010”的icd_code等效于“001.0”。 ICD-9和ICD-10代码有不同的格式:ICD-9代码是5个字符长的字符串,完全是数字(前缀为“E”或“V”的代码除外,这些代码用于外部伤害原因或补充分类)。重要的是,ICD-9代码作为字符串保留在数据库中,因为代码中的前导0是有意义的。 ICD-10代码长3-7个字符,前缀总是一个字母,后面跟着一组数值 INTEGER NOT NULL
long_title 编码含义 long_title提供了ICD代码的含义。例如,ICD-9代码0010的标题很长,是“霍乱弧菌引起的霍乱” VARCHAR(255)
SELECT * FROM d_icd_procedures LIMIT 100;

 

 

(g)d_labitems(化验项目索引表)

d_labitems表是对所有化验项目的描述。d_labitems表包含了与MIMIC数据库中的实验室测量相关联的所有itemid的定义。labelvents中的所有数据都链接到d_labitems表。医院数据库中的每个唯一(流体、类别、标签)元组都在该表中分配了一个条目ID,使用该条目ID有助于高效存储和查询数据。 其中实验室数据包含收集并记录在医院实验室数据库中的信息。这包括在医院内的病房和医院外的诊所进行的测量。

字段 中文字段 字段描述 字段类型
itemid 化验项目编号 化验项目概念的唯一标识符。itemid对每一行都是唯一的,可用于标识与特定概念相关联的标签中的数据 INTEGER
label 项目标签 标签列描述了由itemid表示的概念 VARCHAR(50)
fluid 流体类型 fluid表示进行测量的流体物质。例如,经常对血液进行化学测量,血液在本栏中被列为“血液”。这些测量中的许多也可以在其他液体上获得,如尿液,本专栏区分了这些不同的概念 VARCHAR(50)
category 化验类型 category提供了关于测量类型的更高级别的信息。例如,“ABG”类别表示测量是动脉血气 VARCHAR(50)
SELECT * FROM d_labitems LIMIT 100;

 

 

(h)diagnoses_icd(诊断代码表)

在常规医院护理期间,医院会向患者收取与住院相关的诊断费用。该表包含患者在住院期间使用ICD-9和ICD-10本体的所有诊断记录。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符,与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER NOT NULL
seq_num 序列数 seq_num表示分配给诊断的优先级。优先级可以被解释为对哪些诊断是“重要的”的排名。例如,被诊断为败血症的患者必须将败血症作为他们的第二种疾病。第一种情况必须是传染源。对低优先级诊断进行“正确”排序也不那么重要(例如,第5到第10个诊断代码的优先级可能没有正确的排序) INTEGER NOT NULL
icd_code 国际定义疾病编码 icd_code表示世界卫生组织制定的国际统一的疾病分类方法,是一种字母和数字相结合的编码 VARCHAR(7)
icd_version 疾病编码版本号 此编码系统有两个版本:版本9(ICD-9)和版本10(ICD-10)。这些可以使用icd_version列进行区分 INTEGER
SELECT * FROM diagnoses_icd LIMIT 100;

 

 

(i)drgcodes(患者诊断类别表)

该表是住院的计费诊断类别组(DRG)代码。医院使用诊断类别组(DRG)来报销患者的住院费用。这些代码与患者住院的主要原因相对应。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符,与单个subject_id相关联的任何行都属于同一个人 INTEGER
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER
drg_type 诊断类别 DRG诊断类别 VARCHAR(4)
drg_code 诊断编码 DRG诊断编码 VARCHAR(10)
description 描述 给定诊断编码的描述 VARCHAR(195)
drg_severity 严重程度 drg_severity分为4个等级,用整数表示,分别表示严重程度高低 SMALLINT
drg_mortality 死亡率 drg_mortality分为4个等级,用整数表示,分别表示死亡率大小 SMALLINT
SELECT * FROM drgcodes LIMIT 100;

 

(j)emar(患者服用药物表)

EMAR表用于记录单个患者服用某种药物的情况。该表中的记录由床边护理人员扫描与药物和患者相关的条形码填充。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 ubject_id是指定单个患者的唯一标识符,与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER
emar_id 服用药物编号 EMAR表的标识符。emar_id是emar中每条记录的唯一标识符。emar_id由subject_id和emar_seq组成,其模式如下:“subject_id-emar-seq” VARCHAR(25) NOT NULL
emar_seq 编号序列 EMAR表的标识符。emar_id是emar中每条记录的唯一标识符。emar_id由subject_id和emar_seq组成,其模式如下:“subject_id-emar-seq” INTEGER NOT NULL
poe_id 订单输入编号 将emar中的管理与poe中的订单和处方联系起来的标识符 VARCHAR(25) NOT NULL
pharmacy_id pharmacy标识符 将emar中的管理与pharmacy表中的药房信息联系起来的标识符 INTEGER
enter_provider_id 输入emar标识符 enter_provider_id为将信息输入EMAR系统的提供者提供匿名标识符。提供者标识符遵循一致的模式:字母“P”,后跟三个数字,后跟两个字母或两个数字。例如,“P003AB”、“P00102”、“P1248B”等。提供者标识符是随机生成的,除了在数据库中唯一标识同一提供者之外,没有任何固有含义 VARCHAR(10)
charttime 用药时间 表示用药时间 TIMESTAMP NOT NULL
medication 药物名称 表示患者服用药物的名称 TEXT
event_txt 管理信息 有关管理的信息。最常见的event_txt是“Administratored”,但其他可能的值是“Applied”、“Confirmed”、“Delayed”、“Not Given”等 VARCHAR(100)
scheduletime 计划时间 如果存在,则为计划管理的时间 TIMESTAMP
storetime 存储时间 表示eMAR表中记录给药的时间 TIMESTAMP NOT NULL
SELECT * FROM emar LIMIT 100;

 

(k)emar_detail(给药详细信息表)

emar_detail表包含emar表中每种药物给药的信息。信息包括相关的药房订单、到期剂量、给药剂量以及与医疗管理相关的许多其他参数。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
emar_id 服用药物编号 EMAR表的标识符。emar_id是emar中每条记录的唯一标识符。emar_id由subject_id和emar_seq组成,其模式如下:“subject_id-emar-seq” VARCHAR(25) NOT NULL
emar_seq 编号序列 emar_seq是按时间顺序对emar订单进行编号的连续整数 INTEGER NOT NULL
parent_field_ordinal 给药剂量 parent_field_ordinal描述了同一EMAR事件的多次给药,例如全剂量的多个处方剂量。由于EMAR要求给药提供者扫描提供给患者的每个处方的条形码,通常情况下emar_detail中的多行对应于emar中的一行(例如,给药的多个药丸加起来达到所需剂量)。emar_detail行的结构如下: VARCHAR(10)
administration_type 给药类型 给药类型,包括“静脉滴注”、“静脉输液”、“药物输液”和“透皮贴剂”等。 VARCHAR(50)
pharmacy_id 药房表标识 允许将EMAR订单链接到药房表中提供的药房信息的标识符。注意:很少相同的emar_id在emar_detail表中的行之间有多个不同的pharmacy_id。 INTEGER NOT NULL
barcode_type 暂无   VARCHAR(4)
reason_for_no_barcode 暂无   TEXT
complete_dose_not_given 暂无   VARCHAR(5)
dose_due 暂无   VARCHAR(100)
dose_due_unit 暂无   VARCHAR(50)
dose_given 暂无   VARCHAR(255)
dose_given_unit 暂无   VARCHAR(50)
will_remainder_of_dose_be_given 暂无   VARCHAR(5)
product_amount_given 暂无   VARCHAR(30)
product_unit 暂无   VARCHAR(30)
product_code 暂无   VARCHAR(30)
product_description 暂无   VARCHAR(255)
product_description_other 暂无   VARCHAR(255)
prior_infusion_rate 暂无   VARCHAR(40)
infusion_rate 暂无   VARCHAR(40)
infusion_rate_adjustment 暂无   VARCHAR(50)
infusion_rate_adjustment_amount 暂无   VARCHAR(30)
infusion_rate_unit 暂无   VARCHAR(30)
route 暂无   VARCHAR(10)
infusion_complete 暂无   VARCHAR(1)
completion_interval 暂无   VARCHAR(50)
new_iv_bag_hung 暂无   VARCHAR(1)
continued_infusion_in_other_location 暂无   VARCHAR(1)
restart_interval 暂无   TEXT
side 暂无   VARCHAR(10)
site 暂无   VARCHAR(255)
non_formulary_visual_verification 暂无   VARCHAR(1)

注意:每个eMAR订单有一行parent_field_ordinal为空:这一行通常包含给药所需的剂量。之后,如果有N个处方剂量,parent_field_ordinal 将取值“1.1”、“1.2”、…、“1.N”。最常见的情况是每种药物只有一个处方剂量。在这种情况下,emar_id在emar_detail表中有两行:一行parent_field_ordinal的值为NULL(通常提供到期剂量),另一行parent_field_ordial的值为“1.1”(通常提供实际给药剂量)。

SELECT * FROM emar_detail LIMIT 100;

 

(l)hcpcsevents(计费表)

住院期间发生的计费事件。包括CPT代码。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER NOT NULL
chartdate 记录日期 与编码事件关联的日期 DATE
hcpcs_cd 代码 唯一表示事件的五个字符的代码。将其链接到d_hcpcs中的代码以获得代码的详细描述 CHAR(5) NOT NULL
seq_num 代码序列 为个人住院指定的HCPCS代码顺序。这个顺序有时传达意义,例如有时更高的优先级,但这并不能保证所有代码都能实现 INTEGER NOT NULL
short_description 文本描述 为给定行列出的hcpcs_cd的简短文本描述 VARCHAR(180)
SELECT * FROM hcpcsevents LIMIT 100;

 

 

(m)labevents(患者化验测量表)

labelvents表存储单个患者的所有化验测量结果。这些包括血液学测量、血气分析、化学小组和不太常见的测试,如基因分析。

字段 中文字段 字段描述 字段类型
labevent_id 化验测量标识符 化验测量结果的唯一标识符 INTEGER NOT NULL
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER
specimen_id 样本测量标识 唯一表示用于化验测量的样本。大多数实验室测量都是对患者来源的样本(样本)进行的,如血液、尿液等。通常对同一样本进行多次测量。specimen_id将对同一样本进行的测量进行分组,例如对同一血液样本进行的血气测量 INTEGER NOT NULL
itemid 项目标识符 唯一表示实验室概念的标识符 INTEGER NOT NULL
order_provider_id 订单提供者编号 order_provider_id为下订单的提供者提供了一个匿名标识符 VARCHAR(10)
charttime 采集样本时间 绘制化验测量的时间。这通常是采集样本的时间,通常明显早于可进行测量的时间。 TIMESTAMP(0)
storetime 测量时间 在化验系统中进行测量的时间。这是护理提供者可以获得信息的时候。 TIMESTAMP(0)
value 测量结果 化验测量结果 VARCHAR(200)
valuenum 数字测量结果 数字类型的化验测量结果 DOUBLE PRECISION
valueuom 化验计量单位 化验测量概念的计量单位 VARCHAR(20)
ref_range_lower 正常值上限 化验测量正常范围的下限参考范围。超出参考范围的值被视为异常 DOUBLE PRECISION
ref_range_upper 正常值下线 化验测量正常范围的上限参考范围。超出参考范围的值被视为异常 DOUBLE PRECISION
flag 结果异常标记 一个简短的字符串,主要用于指示实验室测量是否异常 VARCHAR(10)
priority 测量优先级 实验室测量的优先级:常规或统计(紧急) VARCHAR(7)
comments 文本 与化验测量相关的未识别的自由文本评论。这些信息提供了有关样本的信息,是否向护理人员发出了关于结果的通知,解释的考虑因素,或者在某些情况下,评论包含实验室本身的结果。已完全取消标识的评论(即未保留任何信息内容)显示为三个下划线:___。NULL注释表示没有对该行进行任何注释。 TEXT
SELECT * FROM labevents LIMIT 100;

 

 

(n)microbiologyevents(微生物病原检测表)

微生物测试是一种常见的检查感染生长和评估哪种抗生素治疗最有效的程序。本表是患者在医院检测后标本微生物的检测结果。

字段 中文字段 字段描述 字段类型
microevent_id 检测编号 表示行的唯一标识 INTEGER NOT NULL
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER
micro_specimen_id 样本标识 唯一表示进行微生物学测量的样本。大多数微生物学测量都是对患者来源的样本(样本)进行的,如血液、尿液等。通常对同一样本进行多次测量。micro_specimen_id将对同一样本进行的测量进行分组,例如从同一血液样本中生长的生物体 INTEGER NOT NULL
order_provider_id 订单提供者编号 order_provider_id为下订单的提供者提供了一个匿名标识符 VARCHAR(10)
chartdate 记录日期 记录了绘制观测的时间,通常是最接近实际测量数据的时间。chartdate与chartdime相同,只是没有可用的时间 TIMESTAMP(0) NOT NULL
charttime 记录时间 记录了绘制观测的时间,通常是最接近实际测量数据的时间 TIMESTAMP(0)
spec_itemid 细菌生长测试标识 进行细菌生长测试的标本。样本是从患者身上提取的样本;例如血、尿、痰等 INTEGER NOT NULL
spec_type_desc 细菌生长测试类型 进行细菌生长测试的标本类型 VARCHAR(100) NOT NULL
test_seq 测试序列 如果绘制了多个样本,test_seq将对它们进行描绘。例如,如果有氧和无氧培养瓶用于同一个样本,它们将具有不同的test_seq值(可能为1和2)。 INTEGER NOT NULL
storedate 存储日期 微生物学结果可用的日期(存储日期)或日期和时间(存储时间)。虽然在评估微生物培养的过程中可以获得许多中期结果,但这里的时间是最后一次已知更新的时间 TIMESTAMP(0)
storetime 存储时间 微生物学结果可用的日期日期和时间(存储时间) TIMESTAMP(0)
test_itemid 测试标识 对给定样本进行的测试 INTEGER
test_name 测试名称 对给定样本进行的测试的样本名称 VARCHAR(100)
org_itemid 生长标识 测试时生长的生物体(如果有的话)。如果为NULL,则表示没有生物体生长(即阴性培养) INTEGER
org_name 生长名称 测试时生长的生物体(如果有的话)的名称 VARCHAR(100)
isolate_num 分离数量 为了测试抗生素,分离的菌落(整数;从1开始) SMALLINT
quantity 暂无 暂无 VARCHAR(50)
ab_itemid 敏感性抗生素标识 如果一种抗生素对给定的生物体进行了敏感性测试,则此处列出了该抗生素 INTEGER
ab_name 敏感性抗生素名称 敏感性抗生素名称 VARCHAR(30)
dilution_text 稀释文本 检测抗生素敏感性时的稀释值(符号+值) VARCHAR(10)
dilution_comparison 稀释对比 检测抗生素敏感性的稀释值比较 VARCHAR(20)
dilution_value 稀释值 检测抗生素敏感性时的稀释值 DOUBLE PRECISION
interpretation 测试结果 抗生素敏感性的解释,并指示测试结果。“S”是敏感的,“R”是抗性的,“I”是中间的,“P”是待定的 VARCHAR(5)
comments 文本定义 与微生物学测量相关的未识别的自由文本评论。这些信息提供了有关样本的信息,是否向护理提供者发出了关于结果的通知,解释的考虑因素,或者在某些情况下,评论包含测量本身的结果。已完全取消标识的评论(即未保留任何信息内容)显示为三个下划线:___。NULL注释表示没有对该行进行任何注释 TEXT
SELECT * FROM microbiologyevents LIMIT 100;

 

(o)patients(患者信息表)

如果信息存在,该表会列出患者的性别、年龄和死亡日期。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
gender 患者性别 患者的基因型性别 VARCHAR(1) NOT NULL
anchor_age 入院年龄 这些列提供了有关患者入院的实际患者年份以及患者当时的年龄的信息 INTEGER NOT NULL
anchor_year 入院年份 对于患者来说,anchor_eyear是一个转换的年份。 anchor_eyear_group是一个年份范围,患者的anchor_eYear发生在这个范围内。 anchor_age是患者在anchor_year中的年龄。如果患者的年龄超过89岁,那么无论他们的实际年龄如何,他们的年龄都将设置为91岁 INTEGER NOT NULL
anchor_year_group 年龄范围 对于患者来说,anchor_eyear是一个转换的年份。 anchor_eyear_group是一个年份范围,患者的anchor_eYear发生在这个范围内。 anchor_age是患者在anchor_year中的年龄。如果患者的年龄超过89岁,那么无论他们的实际年龄如何,他们的年龄都将设置为91岁 VARCHAR(255) NOT NULL
dod 死亡标记 患者未确定的死亡日期。死亡日期从两个来源提取:医院信息系统和马萨诸塞州生命记录和统计登记处。使用基于姓名、社会保险号码和出生日期等标识符的自定义算法,将MIMIC的个人患者记录与生命记录进行匹配。 由于这种联系,MIMIC-IV患者出院后一年内可获得院外死亡率。所有患者出院后一年以上死亡的情况都会受到审查。生存研究应将此纳入其设计中 TIMESTAMP(0)
SELECT * FROM patients LIMIT 100;

 

 

知识点:

(1)年龄怎么算。

以subject_id为10000032为例,anchor_year为2180,anchor_year_group为2014-2016,anchor_age为52。患者的2180年对应于2014-2016年,52岁。如果入院时间2185年,患者住院将发生在2019-2021年,此时,年龄为57岁。

2180,2014-2016,52

2185,? ,?

52+(2185-2180)=57

 

(p)pharmacy(药房表)

药房表提供了有关为患者开具的已填充药物的详细信息。药房信息包括药物剂量、处方剂量数量、给药频率、用药途径和处方持续时间。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER NOT NULL
pharmacy_id 药品编号 给定药房条目的唯一标识符。药房表格的每一行都有一个唯一的pharmacy_id。该标识符可用于将药房信息链接到提供者订单(在poe或处方中)或药物管理(在emar中) INTEGER NOT NULL
poe_id 订单输入编号 提供者订单的唯一标识符。poe_id由subject_id和一个单调递增的整数poe_seq组成,格式如下:subject_id-poe_seq VARCHAR(50)
starttime 开始时间 给定处方药的开始时间 TIMESTAMP(3)
stoptime 停止时间 给定处方药的停止时间 TIMESTAMP(3)
medication 药物名称 提供的药物名称 TEXT
proc_type 订单类型 订单类型:“IV Piggyback”、“非处方”、“单位剂量”等 VARCHAR(50) NOT NULL
status 处方状态 处方是激活的、非激活的还是停用的 VARCHAR(50)
entertime 输入时间 将处方输入药房系统的日期和时间 TIMESTAMP(3) NOT NULL
verifiedtime 验证时间 医生验证处方的日期和时间 TIMESTAMP(3)
route 给药途径 处方的预期给药途径 VARCHAR(50)
frequency 给药频率 应给患者服用药物的频率。在频率列中使用了许多常用的短手。Q#表示每#小时;例如“Q6”或“Q6H”是每6小时一次 VARCHAR(50)
disp_sched 给药时间 一天中应该给药的时间,例如“08、20”表示应该分别在上午8:00和下午8:00给药 VARCHAR(255)
infusion_type 输注类型 描述输液类型的编码字母:“B”、“C”、“N”、“N1”、“O”或“R” VARCHAR(15)
sliding_scale 滑动量表标记 指示是否应按滑动量表给药:“Y”或“N” VARCHAR(1)
lockout_interval 给药间隔 患者必须等待的时间,直到为自己提供另一剂;常用于患者自控镇痛 VARCHAR(50)
basal_rate 给药速率 24小时内给药的速率 REAL
one_hr_max 给药最大剂量 一小时内可能给予的最大剂量 VARCHAR(10)
doses_per_24_hrs 24小时给药剂量 每24小时的预期剂量。请注意,本栏可能会误导持续输注的药物,因为尽管持续给药,但它们通常每天只“给药”一次 REAL
duration 给药持续时间 给定剂量的数字持续时间 REAL
duration_interval 持续时间测量单位 而duration_interval可以被视为给定持续时间的测量单位 VARCHAR(50)
expiration_value 有效期长度 如果药物有一个相关的有效期,这些列会详细说明这种情况发生的时间 INTEGER
expiration_unit 时间单位 expiration_unit提供药物到期的时间长度,例如30天、72小时等 VARCHAR(50)
expirationdate 到期日期 expirationdate提供未识别的到期日期 TIMESTAMP(3)
dispensation 分配来源 药物的分配来源 VARCHAR(50)
fill_quantity 公式比例 填写公式集的比例 VARCHAR(50)
SELECT * FROM pharmacy LIMIT 100;

 

 

(q)poe(提供者订单输入表)

提供者订单输入(POE)是医院护理提供者输入订单的通用界面。大多数治疗和程序必须通过POE订购。医疗服务提供者作出的与病人护理有关的命令。

字段 中文字段 字段描述 字段类型
poe_id 订单输入编号 提供者订单的唯一标识符。poe_id由subject_id和一个单调递增的整数poe_seq组成,格式如下:subject_id-poe_seq VARCHAR(25) NOT NULL
poe_seq 订单顺序标识 一个单调递增的整数,按时间顺序对POE顺序进行排序。也就是说,POE订单可以按POE_seq顺序排序 INTEGER NOT NULL
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER
ordertime 订单时间 提供者订单的日期和时间 TIMESTAMP(0) NOT NULL
order_type 订单类型 提供者订单的类型 VARCHAR(25) NOT NULL
order_subtype 订单详细信息 供应商订单类型的进一步详细信息。order_subtype最好与order_type一起解释,例如order_type:“Cardiology”与order_subtype:“Holter Monitor” VARCHAR(50)
transaction_type 操作类型 提供程序在执行此订单时执行的操作 VARCHAR(15)
discontinue_of_poe_id 中止订单编号 如果此订单中止了前一个订单,那么discontinue_of_poe_id将链接到已中止的前一个顺序 VARCHAR(25)
discontinued_by_poe_id 未来订单编号 如果该订单后来被一个不同的订单中断,那么discontinued_by_poe_id将链接到该未来订单 VARCHAR(25)
order_provider_id 订单提供者编号 order_provider_id为下订单的提供者提供了一个匿名标识符 VARCHAR(10)
order_status 订单状态 订单是否仍处于活动状态(“活动”)或是否已被取消激活(“激活”)。 VARCHAR(15)

 

SELECT * FROM poe LIMIT 100;

 

(r)poe_detail(供应商补充信息表)

医院供应商订单的补充信息。

字段 中文字段 字段描述 字段类型
poe_id 订单输入编号 提供者订单的唯一标识符。poe_id由subject_id和一个单调递增的整数poe_seq组成,格式如下:subject_id-poe_seq VARCHAR(25) NOT NULL
poe_seq 订单顺序标识 一个单调递增的整数,按时间顺序对POE顺序进行排序。也就是说,POE订单可以按POE_seq顺序排序 INTEGER NOT NULL
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
field_name 订单详细信息名称 每一行都提供了有关POE订单特定方面的详细信息。field_name是该方面的名称。从MIMIC-IV v2.2开始,下表列出了可能的值以及字段值中最常见的条目 VARCHAR(255) NOT NULL
field_value 订单详细信息值 field_value是与给定POE订单和field_name相关联的值。例如,对于“入院”的field_name,field_value列包含患者入院的单位类型(精神病学、妇科等) TEXT
SELECT * FROM admissions LIMIT 100;

(s)prescriptions(处方药物表)

prescriptions表提供了有关处方药物的信息。信息包括药物名称、编码标识符,包括通用序列号(GSN)和国家药品代码(NDC)、产品强度、处方剂量和给药途径。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER NOT NULL
pharmacy_id 药房表标识 将emar中的管理与药房表中的药房信息联系起来的标识符。 INTEGER NOT NULL
poe_id 订单输入编号 提供者订单的唯一标识符。poe_id由subject_id和一个单调递增的整数poe_seq组成,格式如下:subject_id-poe_seq VARCHAR(25)
poe_seq 订单顺序标识 emar_seq是按时间顺序对emar订单进行编号的连续整数 INTEGER
order_provider_id 订单提供者编号 order_provider_id为发起订单的提供者提供了一个匿名标识符 VARCHAR(10)
starttime 暂无   TIMESTAMP(3)
stoptime 暂无   TIMESTAMP(3)
drug_type 暂无   VARCHAR(20) NOT NULL
drug 暂无   VARCHAR(255) NOT NULL
formulary_drug_cd 暂无   VARCHAR(50)
gsn 暂无   VARCHAR(255)
ndc 暂无   VARCHAR(25)
prod_strength 暂无   VARCHAR(255)
form_rx 暂无   VARCHAR(25)
dose_val_rx 暂无   VARCHAR(100)
dose_unit_rx 暂无   VARCHAR(50)
form_val_disp 暂无   VARCHAR(50)
form_unit_disp 暂无   VARCHAR(50)
doses_per_24_hrs 暂无   REAL
route 暂无   VARCHAR(50)
SELECT * FROM prescriptions LIMIT 100;

 

 

(t)procedures_icd(患者手术记录表)

在医院的常规护理过程中,患者接受的手术由医院收费。该表包含患者在住院期间使用ICD-9和ICD-10本体的所有手术记录。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER NOT NULL
seq_num 优先级序列 住院期间发生的程序的指定优先级 INTEGER NOT NULL
chartdate 记录日期 相关程序的日期。日期与seq_num没有严格关联 DATE NOT NULL
icd_code 国际定义疾病编码 icd_code表示世界卫生组织制定的国际统一的疾病分类方法,是一种字母和数字相结合的编码 VARCHAR(7)
icd_version 疾病编码版本号 此编码系统有两个版本:版本9(ICD-9)和版本10(ICD-10) INTEGER
SELECT * FROM procedures_icd LIMIT 100;

 

 

(u)services(患者医疗服务表)

services表记录了患者接受的服务。每项服务都以缩写形式列在表中——这正是数据存储在医院数据库中的方式。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INT
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INT
transfertime 服务种类更改时间 transfertime是患者从先前服务(如果存在)转移到当前服务的时间 TIMESTAMP(0)
prev_service 先前服务类型 prev_service表示患者的先前服务类型 VARCHAR(20)
curr_service 当前服务类型 curr_service表示患者的当前服务类型 VARCHAR(20)

注意:虽然患者可以在特定的ICU类型(比如MICU)进行物理定位,但他们不一定由MICU的工作人员团队照顾。发生这种情况的原因有很多,包括床位短缺。

SELECT * FROM services LIMIT 100;

 

 

(v)transfers(患者周转信息表)

transfers表记录了患者住院期间的周转信息。

字段 中文字段 字段描述 字段类型
subject_id 患者编号 subject_id是指定单个患者的唯一标识符。与单个subject_id相关联的任何行都属于同一个人 INTEGER NOT NULL
hadm_id 病案编号 该表的每一行都包含一个唯一的hadm_id,表示单个患者入院。hadm_id的范围从2000000到2999999 INTEGER
transfer_id 周转编号 transfer_id对患者物理位置唯一。 请注意,icustays和edstays表中存在的stay_id是从transfer_id派生的。例如,三个连续的ICU病房将为每个不同的物理位置提供三个单独的transfer_id(例如,患者可以从一张床移动到另一张床)。整个住宿将有一个单独的stay_id,其将等于第一个物理位置的transfer_id。 INTEGER NOT NULL
eventtype 转移类型 事件类型描述了发生的转移事件:急诊科住院为“ed”,入院为“入院”,院内转移为“转移”,出院为“出院” VARCHAR(10)
careunit 病房类型 患者所在的病房或病房的类型。护理单位的例子包括医疗ICU、外科ICU、医疗病房、新生儿托儿所等 VARCHAR(255)
intime 入科室时间 intime提供患者从以前的护理单元转移到当前护理单元(护理单元)的日期和时间 TIMESTAMP(0)
outtime 出科室时间 outtime提供患者从当前物理位置转出的日期和时间 TIMESTAMP(0)
SELECT * FROM transfers LIMIT 100;