COX回归分析+机器学习+孟德尔随机化=BRIT J HAEMATOL(IF=8.6)

今天跟大家分享一篇2023年发表在BRITISH JOURNAL OF HAEMATOLOGY(IF=8.615)上关于循环蛋白和静脉血栓栓塞因果关系探讨的文献。

Plasma protein and venous thromboembolism: prospective cohort and mendelian randomisation analyses

《血浆蛋白和静脉血栓栓塞:前瞻性队列和孟德尔随机分析》

背景

以往的研究虽然探讨了循环蛋白和静脉血栓栓塞(venousthromboembolism, VTE)的关系,但是由于这些研究大都是基于样本量较小的病例对照,且残留混杂以及反向因果关系等问题可能会影响二者的因果关系。因此,该研究使用瑞典、美国、英国和芬兰人群的蛋白质和基因组数据进行队列和孟德尔随机化(Mendelian Randomization, MR)分析,探讨循环蛋白与VTE之间的关系,以为VTE的预防和药物开发提供证据。

方法

①数据来源:i 来自瑞士的前瞻性蛋白组学数据(SIMPLER);ii VTE相关GWAS数据:百万退伍军人计划(Million Veteran Program, MVP)+UK biobank和FinnGen数据(用于独立验证);iii 6份蛋白相关GWAS数据;

②相关性分析:COX回归分析(基于前瞻性队列);

③变量重要性分析:LightGBM;为了考虑不平衡数据对于机器学习模型的影响,分析是基于1:5的PSM匹配后的样本进行的

④因果关系推断:孟德尔随机化;

⑤蛋白成药性评估:Drugbank 和ChEMBL在线数据库。

研究设计

 

 

结果结果1 循环蛋白与VTE发生风险的cox分析结果(前瞻性队列)①总共分析了257种循环蛋白与VTE的关系,火山图可视化了cox分析后所有蛋白的HR与FDR值

 

 

②21种蛋白(FDR<0.1)的cox分析结果(model1和model2分别调整了不同的混杂)(后续的MR分析是基于cox分析中p<0.05的蛋白,一共是49种)

 

 

结果2机器学习分析比较蛋白与传统因素的重要性

 

 

结果3MR分析结果

 

 

结果4 成药性评估上述7种蛋白有5种药物已经被靶向用于药物的开发:①几种针对vWF的药物已被批准用于治疗出血和血栓相关疾病;②一些靶向SERPINE1的溶栓药物已被批准使用,但由于缺乏疗效或副作用而被停用,如尿激酶;③福坦替尼是针对TYRO3设计的药物,旨在治疗血小板减少症,于2018年4月获得了美国食品和药物管理局的批准;④靶向EPHB4和TNFRSF11A的药物旨在治疗特定的癌症。BOC和CHI3L1未见药物信息。

总结队列研究中发现了多种与VTE发生风险相关的蛋白,进一步利用MR分析发现vWF、SERPINE1、EPHB4 和 TNFRSF11A等蛋白与VTE的发生存在因果关系。结果还表明,循环 vWF 对于 VTE 预防和 BMI 一样重要。针对已确定的蛋白质的药物试验可能需要告知血栓性疾病的疗效和副作用。

这篇文献利用多种分析方法共同分析了循环蛋白与VTE的关系。先基于蛋白组学数据,利用cox回归分析筛选出49种与VTE发生风险有关的蛋白,然后基于GWAS数据,用MR分析了这些蛋白与VTE发生分析的因果关系,最后评估了蛋白的成药性。另外还利用机器学习进一步丰富了研究内容,证明了挑选出来的蛋白对于VTE发生风险的重要性。如果没有蛋白组学的数据,我们也可以从临床数据库(MIMIC和NHANES等数据库)的分析入手,先从数据库中分析出二者的相关性,然后利用GWAS进一步开展二者的因果推断。

 

微信公众号【科研收录】