基于TCGA数据库初步筛选预测胃癌生存期的基因

(整期优先)网络出版时间:2020-08-10
/ 1
摘要目的利用癌症基因组图谱(TCGA)中的大量胃癌基因组数据,在胃癌组织差异表达的基因中挖掘与预后相关的基因。方法在TCGA数据库中下载胃腺癌相关基因芯片数据,经R语言数据预处理及用edgeR对基因表达数据进行差异表达分析,利用R语言对差异基因进行基因本体论(GO)富集及KEGG生物通路分析。多因素逐步回归Cox分析预测影响生存期的基因,利用Kaplan-Meier Plotter(http://Kaplan-Meier Plotter.com)网站对上述得到的基因进行在线生存分析。结果TCGA数据库中共筛选胃癌标本305个,癌旁组织30个。得到3 231个胃癌差异基因,其中上调2 005个基因,下调1 226个基因。GO富集主要集中于抗原连接、丝氨酸水解酶活性、受体配体活性、丝氨酸型肽酶活性、丝氨酸型内肽酶活性、糖胺聚糖结合、细胞因子活性、激素活性、肽酶抑制剂活性、金属钛酶活性等分子功能。KEGG生物通路分析主要涉及化学致癌物、神经活性受体-配体相互作用、细胞因子-细胞因子受体相互作用、细胞色素P450对有害物质的代谢、蛋白质的消化与吸收、金黄色葡萄球菌感染、视黄醇代谢、药物代谢P450、类固醇激素生物代谢、胰液分泌等。Cox分析显示,基因GPX3和SERPINE1对胃癌患者生存期有显著影响。受试者工作特征曲线分析显示,GPX3和SERPINE1表达量的高低对胃癌患者生存期有一定的预测价值,二者临界值分别为0.46、0.68时,敏感性为60.35%,特异性为82.06%,曲线下面积为0.763(95%CI为0.828~0.936)。Kaplan-Meier分析发现,GPX3(P<0.001)和SERPINE1基因(P=0.001)高表达与胃腺癌不良预后有明显关系。结论SERPINE1、GPX3基因表达越高,胃癌患者生存期越短,二者可能作为胃癌预测预后的靶点。