1/3
2/3
3/3
5分+生信友好期刊,机器学习+干湿结合让你轻松拿下Q1区文章!
生信小记者
编辑于 2023年10月08日 18:10
收录于文集
共18篇

题目:基于生物信息学和机器学习的骨质疏松关键免疫基因的鉴定

杂志:Frontiers in Endocrinology

影响因子:IF=5.2

表时间:2023年6月

研究背景

越来越多的研究表明,骨质疏松(OP)与免疫和炎症状态密切相关。探寻炎症在OP中发挥的作用对于寻找到OP患者的诊断生物标志物和治疗有着十分重要的意义。

数据来源

研究思路

从基因表达综合数据库(GEO)和Immport数据库中获取mRNA表达谱和免疫相关基因(IRGs),筛选出与骨密度相关的免疫基因进行差异分析。利用PPI网络分析不同的免疫相关基因(DIRGs)之间的关系,并对DIRGs的功能进行基因数据库(GO)和京都基因和基因组数据库(KEGG)富集分析。构建LASSO和mSVM-RFE模型来筛选出OP中的5个候选基因,并通过ROC曲线验证GEO中预测模型和候选基因的性能。通过RT-qPCR验证外周血单核细胞中差异表达的关键基因,最后,基于5个免疫相关基因构建预测OP的nomogram模型。

图1 | 基本流程

主要结果

DIRG在OP中的差异表达分析

首先使用limma软件包在GSE7158数据集的高骨量人群(HPBM)和低骨量人群(LPBM)之间发现了1158个DEGs,并从ImmPort数据库中获得的1092个DEGs和1727个IRGs取交集后获得66个DIRGs(图2A)。然后将HPBM和LPBM之间IRG表达的差异用火山图表示(图2B),并进一步用热图显示了LPBM和HPBM中8种IRGs的差异性表达(图2C)。发现LPBM的IFNA4表达水平高于HPBM,IAPP表达水平低于HPBM。此外,KLRC1、KIR2DL5A、CCR5、IGHV3-73、REG1A、PTGER1在LPBM中表达显著降低。

图2 | IRGs的差异表达分析

PPI分析

使用STRING数据库分析筛选出的66个免疫基因的蛋白相互作用,得到相互作用评分>0.4的PPI网络。图中红色为上调基因,蓝色为下调基因(图3A)。然后使用Cytoscape软件中的cytoHubba插件对网络基因进行聚类,MCC中排名前十的节点组成集群,发现CCR5、IL13、CXCR5和CSF3下调,其他基因上调(图3B)。

图3 | PPI分析

GO和KEGG通路富集分析

为了进一步探索这66个DIRGs的富集途径和功能,作者使用ClusterProfiler进行功能富集分析,并使用ggplot2软件包进一步可视化富集结。图4A-C的结果表明这些基因的生物学功能主要与信号受体激活剂活性和受体配体活性有关。KEGG富集分析表明,66个DIRGs主要参与细胞因子-细胞因子受体相互作用、PI3K-Akt信号通路、神经活性配体-受体相互作用以及自然杀伤细胞介导的细胞毒性(图4D),从而提示LPBM与炎症密切相关。

图4 | DIRGs的功能富集

DIRGs在OP中表达水平的相关性

为了分析DIRGs表达水平之间的相关性,作者使用ggcorrplot软件包将相关分析结果绘制为热图和网络图(图5A-B)。图5C-F则展示的是与OP相关性最强的四组基因相对应的散点图。研究结果表明,KIR2DL5A与KLRC1和REG1A有很强的相关性,CCR5与REG1A和KLRC1有很强的相关性。

图5 | DIRGs的表达相关性

LASSO和mSVM-RFE模型的构建与评价

使用LASSO和mSVM-RFE算法识别op中重要的预后生物标志物,然后通过10倍交叉验证选择最佳的λ(图6A-B)。通过LASSO分析,从8个DIRGs中筛选出6个DIRGs,即IFNA4、KIR2DL5A、CCR5、IGHV3-73、IAPP和PTGER1作为候选基因。并利用mSVM-RFE模型对8个DIRGs进行筛选,选择了6个DIRGs (IGHV3-73、IFNA4、CCR5、KLRC1、IAPP、PTGER1)作为候选基因(图6C、D)。然后将LASSO回归模型和mSVM-RFE模型的候选基因相交得到(图6G),随后将其作为OP的候选基因,即IGHV3-73、IFNA4、CCR5、IAPP、PTGER1。

图6 | 模型的开发和验证

对5个重要的DIRGs进一步分析

将LASSO回归模型和mSVM-RFE模型相交所得的5个候选基因进一步分析,图7A显示了五个基因的染色体位置,并对其主成分分析(图7B),从5个IRGs的热图中(图7C)可以发现5个候选基因能够明显区分LPBM和HPBM,表明其可能在OP的诊断中发挥关键作用。此外,在训练组(GSE7158)和测试组(GSE13850)中进一步测试了5个候选基因的预测能力,证实该多基因确实比单个基因具有更强的OP预测能力(图7D-E)。

图7 | 五个重要IRGs的进一步分析

RT-qPCR验证

为了在体内验证Hub基因,作者进一步通过RT-qPCR鉴定从全血中分离的PMBC mRNA中是否存在5个Hub基因(图8),结果表明,CCR5、IAPP、IFNA4、IGHV3-73、PTGER1的表达水平与生物信息学分析结果一致。

图8 | HPBM和LPBM组CCR5、IAPP、IFNA4、

IGHV3-73、PTGER1 (A-E)的表达

文章小结

这个文章主要还是以机器学习算法为主,最后使用RT-qPCR进行了辅助验证。数据量不是很大,但整篇文章的逻辑性比较强,环环相扣,发到5分+绝对名副其实!但最后的样本验证时可能存在一些不足,即样本量较少,这可能是该篇文章能发更高分的一个限制。但利用机器学习来研究免疫炎症和OP发生之间的相关性,这对于人们后期开发OP的相关治疗方案提供了更多的启发。