摘要:
确定结核病易感宿主基因对结核病的治疗与防控起着关键作用,而目前只有少数基因被证实与其相关.本文基于结核病患者外周血单核细胞基因芯片数据集GSE54992,先通过两种基于贝叶斯框架的方法:信息先验性贝叶斯检验和线性模型及经验贝叶斯方法对该数据集进行分析并筛选出正常样本与活动性结核病患者样本之间的差异表达基因,发现了319个被两种方法均识别出的差异表达基因.再利用这些基因对独立验证集GSE83456进行建模,通过朴素贝叶斯分类器验证,得出了较高的分类准确率.最后通过GO功能富集分析和KEGG通路分析,从生物学角度分析了结核病发病的分子机制.该研究突出了三种贝叶斯方法的综合应用在基因数据分析中的重要作用,为发掘结核病特异性生物标志物提出了新的综合策略,为结核病的预防、诊断和治疗提供了重要线索.
中图分类号:
张 旭, 吴佩望, 乔 峰. 基于三种贝叶斯方法的结核病基因数据挖掘及生物信息学分析[J]. 工程数学学报, 2021, 38(5): 601-609.
ZHANG Xu, WU Peiwang, QIAO Feng. Gene Data Mining and Bioinformatics Analysis of Tuberculosis Based on Three Bayesian Methods[J]. Chinese Journal of Engineering Mathematics, 2021, 38(5): 601-609.