关键词:
纤维肌痛综合征
生物信息学
机器学习
免疫浸润
加权基因共表达网络分析
套索回归
支持向量机递归特征消除算法
单样本基因集富集分析
基因集富集分析
摘要:
背景:纤维肌痛综合征作为常见风湿病,其发病与中枢敏化及免疫异常有关,但具体过程尚未阐明,缺乏特异性诊断标志物,不断探索该病的发病机制具有重要的临床意义。目的:基于加权基因共表达网络分析(WGCNA)等生物信息学方法和机器学习算法筛选纤维肌痛综合征潜在的诊断相关标志基因,并分析其免疫细胞浸润特征。方法:对来自基因表达综合数据库(GEO)的纤维肌痛综合征数据集转录谱进行差异分析和WGCNA分析,整合筛选出差异共表达基因,进一步采用机器学习套索回归(LASSO)算法、支持向量机递归特征消除(SVM-RFE)机器学习算法来识别核心生物标志物,并绘制受试者工作特征(ROC)曲线以评估诊断价值。最后,采用单样本基因集富集分析(ssGSEA)和基因集富集分析(GSEA)评估纤维肌痛综合征的免疫细胞浸润情况及通路富集。结果与结论:①对GSE67311数据集按照log2|(FC)|>0,P<0.05的条件进行差异分析后获得8个下调的差异表达基因;进行WGCNA分析后获得正相关性最高(r=0.22,P=0.04)的模块(MEdarkviolet)内含基因497个,负相关性最高(r=-0.41,P=6×10-5)的模块(MEsalmon2)内含基因19个;将差异表达基因与WGCNA的2个高相关性模块基因取交集,获得7个基因。②对上述7个基因进行LASSO回归算法筛选出4个基因,进行SVM-RFE机器学习算法筛选出5个基因,两者取交集后确定了3个核心基因,分别为重组1号染色体开放阅读框150蛋白(germinal center associated signaling and motility like,GCSAML)、整合素β8(Integrin beta-8,ITGB8)和羧肽酶A3(carboxypeptidase A3,CPA3);绘制3个核心基因的ROC曲线下面积分别为0.744,0.739,0.734,提示均具有很好的诊断价值,可作为纤维肌痛综合征的生物标志物。③免疫浸润分析结果显示,与对照组相比纤维肌痛综合征患者记忆B细胞、CD56 bright NK细胞和肥大细胞显著下调(P<0.05),且与上述3个生物标志物显著正相关(P<0.05)。④富集分析结果提示,纤维肌痛综合征的富集途径包括9条,主要与嗅觉传导、神经活性配体-受体相互作用及感染等通路密切相关。⑤上述结果显示,纤维肌痛综合征的发生发展与多基因参与、免疫调节异常及多个通路失调有关,但这些基因与免疫细胞之间的相互作用,以及它们与各通路之间的关系尚需进一步研究。