关键词:
糖尿病肾病
铜死亡
差异表达基因
生物信息学
机器学习模型
中药预测
摘要:
目的通过生物信息学方法分析与糖尿病肾病(DN)有关的铜死亡相关基因,并预测靶向作用于这些基因的中药。方法从GEO数据库中下载与DN相关的基因表达数据集(GSE96804和GSE30529),并从相关文献中获取铜死亡相关基因。基于GSE96804数据集,筛选DN中差异表达铜死亡相关基因(DECAGs),并分析DECAGs之间表达量的相关性;根据DECAGs的表达量对DN样本进行聚类分型分析和基因集变异分析(GSVA)。基于聚类分型结果进行加权基因共表达网络分析,获取疾病关键基因模块和核心基因。利用“limma”程序包获取GSE96804数据集中的差异表达基因,然后与核心基因取交集以获得交集基因。基于GSE96804数据集及交集基因,通过3种机器学习模型筛选疾病特征基因。通过受试者工作特征曲线,基于GSE96804数据集评估特征基因对DN的诊断价值,并基于GSE30529数据集进行验证。通过分析疾病特征基因与DECAGs之间的相关性获得关键DECAGs。在CoreMine^(TM)MEDICAL数据库,针对DECAGs进行中药预测。结果共获得7个DECAGs,其中DBT、PDHA1、FDX1表达量与GCSH的表达量呈正相关,DLAT、PDHA1表达量与FDX1的表达量呈正相关,GLS表达量与DLAT的表达量呈负相关。基于DECAGs可将DN样本可分为两簇(C1簇和C2簇)。GSVA结果显示,与C1簇相比,NOD样受体(NLR)、Notch和Toll样受体(TLR)等信号通路在C2簇中富集。棕色模块(含369个核心基因)与基于DECAGs的聚类分型高度相关。共获得114个交集基因,通过3种机器学习模型最终筛选出疾病特征基因G6PC。在GSE96804、GSE30529数据集中,G6PC表达量诊断DN的曲线下面积分别为0.987、0.900。PDHA1、FDX1、DBT、GCSH与G6PC具相关性,故作为关键DECAGs。根据DECAGs筛选出168味中药,中药四气以寒性、温性和平性为主,五味以苦味、甘味为主,常见归经为肝经、脾经和肾经,功效以补虚类、清热和活血化瘀最常见。其中,丹参、青风藤、紫草、茯神、白术、苦豆草、蛇床子、艾叶均至少靶向2个DECAGs。结论7个DECAGs及其相关的NLR、Notch、TLR等信号通路可能是DN铜死亡相关发病机制的重要环节,其中,PDHA1、FDX1、DBT和GCSH是关键DECAGs,G6PC是DN的疾病特征基因。丹参、青风藤、紫草等中药可能通过调控铜死亡治疗DN。