MIMIC-IV数据库更新到3.0版本
一、数据扩充
住ICU人数增加了30%不到,但是对应的特护单(chartevents表格)体积增加了接近50%,应该新增病人的数据颗粒度要比以前更细。
项目
2.2
3
时间跨度
2008-2019
2008-2022
患者人数
299,712
364,627
住院人数
431,231
546,028
住ICU人数
73,181
94,458
此次更新最显著的变化是新增了2020年至2022年期间的住院数据。新增数据的具体情况如下:
患者数:从v2.2的299,7...
文献分享 | MIMIC数据库+机器学习方法+糖尿病酮症酸中毒+风险预测模型=IF 5.2分
原论文下载: https://www.frontiersin.org/journals/endocrinology/articles/10.3389/fendo.2024.1344277/pdf
今天跟大家一起精读一篇2024年发表于FRONTIERS IN ENDOCRINOLOGY (IF:5.2)的研究性文章Feature selection and risk prediction for diabetic patients with ketoacidosis based on MIMI...
文献分享 | MIMIC-IV数据库-心外科手术患者重症监护室住院时间预测模型研究
【摘要】 目的 验证不同变量选择方法对临床预测模型性能的影响。方法 从 MIMIC 数据库中提取了
3 组样本数据集(急性心肌梗塞组、脓毒症组和脑出血组),用 COX 回归的直接进入、逐步向前、逐步向后、
LASSO、岭回归、基于随机森林的变量重要性六种方法,选出的不同方法的最优变量集构建模型,通过 C 指数、受
试者工作特征曲线下面积(AUC 值)和校准曲线,比较组内和组间的结果差异。结果 6 种变量选择方法筛选的
变量及数目各不相同,但不管是组内还是组间,并没有显示出哪种方法有明显提高...
文献分享 | 基于 MIMIC-Ⅳ数据库构建重症心肌病病人预后 预测模型
摘要 目的:分析合并心肌病重症病人院内死亡的影响因素 , 并构 建 列线 图 模 型 。 方法: 回 顾 性 分 析 2008 年— 2019 年 在医 学 信 息 市场重症监护(MIMIC-Ⅳ) 数据库中 2 115 例重症病人的临床资料 ,主要结局为院 内 死亡 。采用多 因素 Logistic 回归模型构建院 内 死 亡的预测模型 。应用 R 语言建立预测院内死亡的列线图模型 ,并计算 C-指数评估该模型对预后的辨别能力 。 采用 1 000 次重采样 的 BootStrap 方法绘制标定曲线...
NASA环境数据批量下载
我们在NASA网站下载数据如温度,降雨,植被指数,通常数据量较多。时间及地区范围,通过改文章,我们获取到所需数据的下载链接,然后使用SHELL来实现 批量下载。(如何获取下载链接)
下面就来介绍如何设置批量下载。本文主要参考 How to Download Data Files from HTTPS Service with wget
(MAC 测试成功。Windows 自行摸索)
1.注册NASA账号
这里给出注册链接地址,可自行百度
2.Wget设置
注册好账号后,需要在终端安装wget,
...
NASA环境数据下载
对于NASA的数据介绍主要包括一下几个数据库:
美国国家航空航天局(NASA)地球科学数据和信息系统(ESDIS)项目是戈达德太空飞行中心飞行项目管理局下属地球科学项目部的一部分。作为ESDIS的关键组成部分,由美国独立设施的分布式网络运营12个互连的分布式活动档案中心(DAAC)
ASDC:The Atmospheric Science Data Center (ASDC)
ASF DAAC:Alaska Satellite Facility Distributed Active Archive C...
NHANES Database 访问链接
生存数据
Demographics(人口统计学)
Dietary(饮食)
Examination(考试)
Laboratory(实验室)
LimitedAccess(有限访问)
Questionnare(问卷)
1999-2000
Demographics
Dietary
Examination
Laboratory
LimitedAccess
Questionnaire
2001-2002
Demographics
Dietary
Examination
Laboratory
Limit...
MIMIC数据提取教程 - 官方提供的时间函数(一)
mimic数据库中有非常多的指标是需要根据时间计算出来, 跟时间有关的指标都需要通过官方的时间函数进行计算得出
MIMIC数据库常用的几个时间计算函数如下
一、DATETIME_DIFF函数
1.1 实例:获取某个患者在ICU待了多少个小时
如果要以天为单位,datepart参数换成'DAY'
结果保留两位小数
结果保留整数
1.2 实例:统计同等大小入院组的入院人数 (等宽直方图展示)
with base1 as (
SELECT
mimiciv_de...
20个中文语料数据集,含数学考试、公务员考题、医患对话等
想训练出具有中文语境特色的大语言模型,中文语料数据必不可少,今天给大家分享20个中文语料数据集
No.1 Math23K (Math23K for Math Word Problem Solving)
● 发布方:腾讯人工智能实验室
● 发布时间:2017
● 简介:
Math23K 是为解决数学单词问题而创建的数据集,包含从互联网上爬取的 23,162 个中文问题。
● 下载地址:
https://opendatalab.org.cn/Math23K
● 论文地址:
https://a...
公开重症监护数据库MIMIC代码仓库介绍
《The MIMIC Code Repository: Enabling reproducibility in critical care research》论文
引言#
科学结果的可重复性越来越受到关注1;
医疗领域进入数字化革命(本文是2017年接收),引出形成MIMIC-III数据库;
EHR二次分析需要临床专家和数据科学家的合作,在EHR数据库上推导或者定义一些概念是需要资源的,对于没有特别强的临床背景或者数据科学技能的人来说巨大障碍;
该文介绍MIMIC代码仓库,介绍与重症相关概念的导出以及相关...
什么是CRRT
一、什么是CRRT
CRRT,Continuous renal replacement therapy,中文作连续性肾脏替代治疗,也被称作连续血液净化治疗 (continuous blood purification, CBP)。
CRRT 是临床出现一种新的代替肾脏治疗方法, 即每天持续 24 小时或接近 24 小时的一种长时间、连续体外血液净化疗法。
连续性肾脏替代治疗(CRRT)是指一组体外血液净化的治疗技术,是所有连续、缓慢清除水分和溶质治疗方式的总称。传统CRRT应持续治疗24h以上,但临床上可根...
免疫性不孕 - 透明带异常
凡夫妇结婚3年以上,性生活正常,也未避孕,女方不妊娠,可称为不孕不育症。 由于女性生理、心理或病理因素导致者称为女子不孕; 由男子因素导致者,称男子不孕。
免疫性不孕
免疫性不孕是指由于生殖系统抗原的自身免疫或同种免疫引起的不孕症。
现代医学认为, 免疫性不孕可分为精子免疫引起不孕和卵透明带免疫引起不孕。 精子介入女性生殖道,即可视为同种异体抗原的移植过程。 当精液中免疫抑制物有质或量上的缺陷时,或当女性生殖道炎症及子宫出血时性交, 由于生殖道黏膜渗透性的改变。增强抗原的吸收,同时细菌感染加强了对精子抗...
甲基强的松龙Methylprednisolone
甲基强的松龙Methylprednisolone
甲基强的松龙具强烈消炎及抗过敏作用, 一般用于治疗类风湿关节炎、风湿热等炎症。 甲基强的松龙抗炎治疗可以抑制炎症,从而改善预后
通用名:注射用甲泼尼龙琥珀酸钠
【成分】
本品主要成分为甲泼尼龙琥珀酸钠。
【药理作用】
本药为供肌注和静注用的甲基强的松龙,属于合成的糖皮质激素,其高浓度的溶液特别适合治疗一些需要强效并具有快速激素作用的病变。
甲基强的松龙具有强力抗炎作用、免疫抑制作用及抗过敏作用。皮质类固醇能扩散透过细胞膜,并与特殊的细胞内受...
MIMIC数据库文献分享和复现:评估 MIMIC-IV v2.2 和 MIMIC-IV-ED 数据集中的不同诊断
原文: 《Assessing Different Diagnoses in MIMIC-IV v2.2 and MIMIC-IV-ED Datasets》
Just a moment...
关注公众号【科研收录】, 发送“addim”获取原文
摘要
本研究旨在揭示重症监护医疗信息集市 (MIMIC) 数据集中列出的不同诊断的一些重要见解。该数据集包括来自不同背景、种族、人口统计等的患者。诊断记录使用 ICD-09 和 ICD-10 代码以电子方式存储。研究发现,大多数患者至少被诊断过一次原发性高血压...
ggplot2 - Basic circle packing chart with one level 基本的一层圆形包装图
一、介绍
具有一层层次结构的基本圆形包装图。基本上,您只需用一个圆圈表示数据集的每个实体或个体,其大小取决于提供的值。
它类似于barplot,但您使用圆圈大小而不是条形长度。它接近 气泡图,但 X 和 Y 位置没有任何意义。它是树形图的圆形版本 。
计算点的排列不是一个小问题。该 packcircles库解决了这个问题并输出圆边缘每个点的坐标。
最后,ggplot2 允许绘制形状,这要归功于 geom_polygon()
# Libraries
library(packcircles)
lib...
【R语言教程-技巧篇】 在Rstudio中更换绑定的R的版本
如下图,选择Tools里的GlobalOptions选项
然后点Change,选择你的R版本,确认,重启Rstudio即可
医学数据库
中文医学
万方医学(LW) 万方医学(VQ) 知网医学(CU) 中国生物医学文献(LL) 中国生物医学文献(MT) 知网医学-首都 读秀医学 万方医学3 中国医学生物文献2 知网医学-贵州 Meta分析教程(w2jz) 万方医学 万方医学5 中国医学生物文献1 万方医学6 中国医学生物文献3 中国医学生物文献4
Pubmed
PubMed(ZV) PubMed(BT) PubMed官方(JL) Pubmed下载1 Pubmed强烈推荐1 Pubmed检索2 Pubmed下载3 Pummed下载2 PubMe...
医学影像数据集集锦
此维护集为github开源项目
前言
本项目的目标是整理一个医学影像方向数据集的列表,提供每个数据集的基本信息,并在License允许的前提下提供不限速下载。如果您想使用的数据集不在列表中我们可以提供免费代下。项目按照数据集模态或关注的器官分类。当前共收录约 20 个方向的 80+ 个数据集
医学影像数据集众多多且专业性强,众人拾柴火焰高!如果您使用过列表中没有的数据集,或发现列表中的信息有任何疏漏,我们非常希望您可以参与项目建设。
数据源地址: https://github.com/linha...
中文医疗对话数据集 Chinese medical dialogue data
数据文档
背景描述
Data_数据中有6个文件夹分别是:
<Andriatria_男科> 94596个问答对
<IM_内科> 220606个问答对
<OAGD_妇产科> 183751个问答对
<Oncology_肿瘤科> 75553个问答对
<Pediatric_儿科> 101602个问答对
<Surgical_外科> 115991个问答对总计 792099个问答对
数据说明
每个文件夹下有一个csv文件,其中的数据格式为:
department
title
ask
answer...
中医药古籍文本数据集
数据文档
背景描述
TCM-Ancient-Books,中医药古籍文本,约700项
数据说明
000:神农本草经001:吴普本草002:本草经集注003:新修本草...698:脉诀阐微699:名老中医之路700:李培生老中医经验集
数据来源
https://github.com/xiaopangxia/TCM-Ancient-Books
问题描述
该数据能解决什么问题?适用于什么场景