2. 611730 成都,成都医学院第三附属医院(成都市郫都区人民医院): 感染管理部;
3. 400016 重庆,重庆医科大学附属第一医院肝胆外科
2. Department of Nosocomial Infection Control, the Third Affiliated Hospital of Chengdu Medical College (Chengdu Pidu District People's Hospital), Chengdu, Sichuan Province, 611730;
3. Department of Hepatobiliary Surgery, the First Affiliated Hospital of Chongqing Medical University, Chongqing, 400016, China
胆管癌(cholangiocarcinoma, CCA)其发病率和病死率在世界范围内呈上升趋势[1],新近的研究将起源于肝内或肝外胆管上皮的CCA分为肝内胆管癌(intrahepatic cholangiocarcinoma, ICC)和肝外胆管癌[2-3]。由于早期症状不典型,不少患者是在疾病已经处于进展期或发生转移时确诊的[4]。早期诊断对于改善患者的预后尤为重要。然而,大多数现有标志物诊断价值有限且特异性低[5]。探索更多对ICC具有临床诊断价值的潜在生物标志物是制定有效的诊断策略和治疗靶点的关键。微阵列和高通量测序技术已被广泛使用探索ICC的新的生物标志物和治疗靶点。由于样本量、微阵列芯片平台和分析技术不同,分析结果存在一定的差异。整合生物信息学方法[6]最近在癌症遗传学研究领域开始广泛采用。本研究从美国国立生物技术信息中心基因表达数据库(gene expression omnibus,GEO)获得3个高质量ICC数据集(GSE26566,GSE32879和GSE45001),通过R软件分析ICC组织与癌旁组织之间的差异基因。随后,采用GO和KEGG富集分析差异基因的潜在生物学功能和关键信号通路。建立PPI网络并在Cytoscape软件中鉴定出枢纽基因。通过受试者工作曲线分析枢纽基因的诊断价值,并采用Diseasemeth 2.0工具评估枢纽基因的甲基化水平。
1 材料与方法 1.1 分析数据集资料从GEO数据库下载3个肝内胆管癌数据集(GSE26566、GSE32879和GSE45001)的基因表达谱数据,共包括130个肿瘤组织样本和76个癌旁组织样本。所有数据集均符合以下标准:①所有样本均为人体ICC组织和癌旁组织; ②使用的平台可检测至少8 000个基因; ③每个数据集包含至少10个肿瘤和癌旁组织。此外,从TCGA数据库中获得包含33个肿瘤样本和8个癌旁样本的RNA高通量测序数据。数据集的特征如表 1所示。
数据集 | 肿瘤样本(例) | 正常样本(例) | 检测平台 |
GSE26566 | 104 | 59 | GPL6104 |
GSE45001 | 10 | 10 | GPL14550 |
GSE32879 | 16 | 7 | GPL6244 |
TCGA-CHOL | 33 | 8 | Illumina HiSeq |
1.2 鉴别差异基因
在R软件中采用Limma程序包[7]标准化矩阵数据,并鉴定每个数据集的肿瘤组织和癌旁组织之间的差异基因(differentially expressed genes,DEGs)。使用BH法调整P值[8]。调整后P < 0.05和|log2 foldchange|>1表示基因差异具有统计学意义。
1.3 差异基因功能富集分析及蛋白互作网络构建使用Cluster profiler[9]进行GO功能富集分析和KEGG通路富集分析。STRING(search tool for the retrieval of interacting genes)是一个在线生物数据库,提供基因分析并构建蛋白质水平基因相互作用的网络[10]。在本研究中,我们利用STRING构建了DEGs的蛋白质-蛋白质相互作用(PPI)网络,置信度评分≥0.9。然后,通过Cytoscape软件可视化PPI网络[11]。应用分子复合物检测插件(MCODE)筛选PPI网络中的重要模块。利用Cytohubba插件筛选网络中的关键基因。此外,通过Cluster profiler程序包对前三个模块中的DEGs进行KEGG通路富集分析。
1.4 枢纽基因表达验证和诊断ROC曲线分析GEPIA在线数据库包含来自TCGA和基因型-组织表达数据库(GTEx)的9 736个肿瘤和8 587个正常样本的RNA测序表达数据[12]。我们利用GEPIA工具进一步验证肿瘤组织和正常组织之间枢纽基因的mRNA表达水平。进一步对枢纽基因进行受试者工作特征曲线分析ROC曲线分析,通过pROC程序包[13]在R软件内计算ROC曲线下面积(AUC),评估枢纽基因的诊断价值。
1.5 枢纽基因甲基化相关性分析Diseasemeth 2.0版(http://bio-bigdata.hrbmu.edu.cn/diseasemeth/)包含88种疾病的32 701个样本的甲基化数据[14]。DNA启动子的异常甲基化可引起基因的异常表达。本研究采用Diseasemeth工具进一步探索枢纽基因的甲基化状态。
2 结果 2.1 差异基因的鉴定在GEO数据库中的3个胆管癌数据集(GSE26566、GSE32879和GSE45001)中,我们共鉴定出399个DEGs,包括100个上调基因和299个下调基因(图 1A~C)。进一步在从TCGA数据库下载的CHOL数据集中鉴定出DEGs(图 1D)。GEO三个数据集和TCGA的CHOL数据集分别鉴定出差异基因后,取交集共计382个DEGs,包括90个上调基因和292个下调基因(图 1E~H)。
2.2 功能及通路富集分析
通过Cluster profiler程序包对DEGs进行GO功能富集分析和KEGG通路富集分析。结果显示,上调的DEGs的生物学过程方面主要富集在细胞外基质组织、细胞外结构组织、细胞-底物黏附等生物学过程(图 2A)。相反,下调的DEGs的生物学过程方面主要富集在小分子分解代谢过程、有机酸分解代谢过程、羧酸分解代谢过程。根据KEGG通路富集分析,上调的DEGs主要参与PI3K-Akt信号通路和ECM-受体相互作用(图 2B)。下调的DEGs显著富集在碳代谢和脂肪酸降解途径中。
2.3 PPI网络、关键模块和枢纽基因分析
应用在线数据库STRING构建由289个节点和500个连接组成的DEGs的PPI网络,置信度评分>0.9 (图 3A)。对前三个模块内基因进行KEGG通路富集分析,结果显示与过氧化物酶体途径和ECM-受体相互作用途径显著相关(图 3B)。通过MCODE插件,参数设置degree cut-off=2, node score cut-off=0.2, k-core=2, max depth=100共获得11个模块,前三个模块如图 3C~E。通过Cytoscape的Cytohubba插件,选择插件内BETWEEEN、DMNC算法筛选排序靠前的基因,结合文献进一步筛选鲜有报道的作为关键枢纽基因。筛选出6个枢纽基因,即PRSS23、LGALS1、VCAN、COL5A1、ITGB1和EHHADH。
2.4 枢纽基因的转录表达水平和临床诊断价值分析
在GEPIA工具内验证6个枢纽基因的mRNA表达水平。如图 4所示,ICC组织中PRSS23、LGALS1、VCAN、COL5A1和ITGB1的表达显著增加,而ICC组织中EHHADH的表达水平较正常组织明显降低。通过受试者工作曲线(ROC)分析显示,所有的枢纽基因都可以区分肿瘤组织和正常组织。PRSS23、LGALS1、VCAN、COL5A1、ITGB1、EHHADH的AUC值分别为:0.898、0.803、0.932、0.883、0.898、1.000(图 5)。
2.5 枢纽基因甲基化相关性分析
采用Diseasemeth 2.0分析6个枢纽基因mRNA表达水平与其甲基化状态的相关性。分析结果表明,ICC组织中PRSS23的平均甲基化水平明显低于正常组织(图 6A),而LGALS1, VCAN, ITGB1和EHHADH的甲基化水平较正常组织中高(图 6B、C、E、F),两组中COL5A1的平均甲基化水平未见明显差异(图 6D)。
3 讨论
胆管癌是一种高度恶性肿瘤,由于胆管癌患者缺乏特异性临床表现,大多数患者在出现症状时已处于进展阶段或发生转移。在本研究中,我们用R软件分析了GEO数据库中3个独立的肝内胆管癌(ICC)数据集以鉴别显著差异基因(DEGs),并在TCGA数据库的CHOL数据集中进一步验证,共得到90个上调基因和292个下调基因。
本研究发现上调的DEGs的生物学过程方面主要富集在细胞外基质组织、细胞外结构组织、细胞-底物黏附等生物学过程(图 2A)。相反,下调的DEGs主要富集在小分子分解代谢过程、有机酸分解代谢过程、羧酸分解代谢过程。研究表明,ECM在疾病过程中发挥关键作用,包括纤维化、心血管疾病和癌症[15-16]。ECM重塑促进并介导肿瘤细胞的迁移和侵袭[15]。根据KEGG通路富集分析,上调的DEGs主要参与PI3K-Akt信号通路和ECM-受体相互作用(图 2B)。下调的DEGs显著富集在碳代谢和脂肪酸降解途径中。PI3K-Akt信号通路在各种癌症中被激活,被证实参与肿瘤转移和侵袭[17-18],而ECM受体相互作用途径与癌细胞增殖、侵袭和进展相关[19]。转录调节、DNA复制和DNA修复与碳代谢有关[20]。增加脂肪酸的降解可能有助于减弱癌细胞增殖[21]。
在肿瘤组织里上调的基因中,PRSS23编码一种丝氨酸蛋白酶,在乳腺[22]、甲状腺癌[23]和胰腺癌等[24]组织中过表达。PRSS23参与人胃癌的肿瘤发生和进展,对胃癌的预后至关重要[25]。LGALS1也被命名为Galectin-1(GAL-1),是β-半乳糖苷结合蛋白半乳糖凝集素家族的一员[26]。有研究表明LGALS1在胰腺癌[12]、肺癌[27]、胃癌[28]和HCC[29]中过表达,并且其表达与肿瘤发生、侵袭、进展和血管生成拟态高度相关。因此,LGALS1可能是一个潜在的治疗靶点。VCAN是ECM的主要成分之一[30],可以促进肿瘤细胞增殖、迁移和侵袭[31]。COL5A1是一种参与ECM形成胶原的家族蛋白[32]。一项研究表明COL5A1与细胞增殖、迁移和侵袭显著相关[33]。整合素介导细胞黏附,并在跨膜连接至细胞骨架中发挥关键作用[34]。ITGB1是整合素的亚基之一。ITGB1的过表达与细胞迁移和化疗耐药相关[35]。EHHADH编码过氧化物酶体双功能酶,EHHADH参与PPAR信号通路[36],对乳腺癌和肺癌的发生发展至关重要[37-38]。
在本研究中采用ROC曲线分析证明6个枢纽基因均能敏感、准确地区分肿瘤组织和非肿瘤组织。由此可见,枢纽基因作为ICC的标志物具有较高的诊断价值。我们利用Diseasemeth 2.0来进一步确定DNA启动子的异常甲基化模式是否引起了ICC中枢纽基因的异常表达。我们发现EHHADH呈高甲基化,PRSS23呈低甲基化,这与观察到的ICC中这些基因的差异表达一致。而COL5Al的甲基化水平在ICC中无明显变化。相反,LGALS1、VCAN和ITGB1在ICC中表现为高甲基化。这些差异可能是由于其他原因所致,如非编码RNA和组蛋白修饰[39-40]。
综上,通过生物信息学分析的分析,本研究鉴定了6个可能在ICC发生发展中至关重要的基因和重要信号通路。这些基因可能是诊断ICC的潜在分子生物标志物。然而,还需要更多的试验研究来验证这些结果,进一步揭示关键基因在ICC中的分子机制和生物学功能。
[1] |
BEAL E W, TUMIN D, MORIS D, et al. Cohort contributions to trends in the incidence and mortality of intrahepatic cholangiocarcinoma[J]. Hepatobiliary Surg Nutr, 2018, 7(4): 270-276. DOI:10.21037/hbsn.2018.03.16 |
[2] |
EL-DIWANY R, PAWLIK T M, EJAZ A. Intrahepatic cholangiocarcinoma[J]. Surg Oncol Clin N Am, 2019, 28(4): 587-599. DOI:10.1016/j.soc.2019.06.002 |
[3] |
RAZUMILAVA N, GORES G J. Cholangiocarcinoma[J]. Lancet, 2014, 383(9935): 2168-2179. DOI:10.1016/S0140-6736(13)61903-0 |
[4] |
BANALES J M, CARDINALE V, CARPINO G, et al. Expert consensus document: Cholangiocarcinoma: current knowledge and future perspectives consensus statement from the European Network for the Study of Cholangiocarcinoma (ENS-CCA)[J]. Nat Rev Gastroenterol Hepatol, 2016, 13(5): 261-280. DOI:10.1038/nrgastro.2016.51 |
[5] |
RAHNEMAI-AZAR A A, WEISBROD A, DILLHOFF M, et al. Intrahepatic cholangiocarcinoma: Molecular markers for diagnosis and prognosis[J]. Surg Oncol, 2017, 26(2): 125-137. DOI:10.1016/j.suronc.2016.12.009 |
[6] |
HUANG Q X, CUI J Y, MA H, et al. Screening of potential biomarkers for cholangiocarcinoma by integrated analysis of microarray data sets[J]. Cancer Gene Ther, 2016, 23(2/3): 48-53. DOI:10.1038/cgt.2015.66 |
[7] |
RITCHIE M E, PHIPSON B, WU D, et al. Limma Powers differential expression analyses for RNA-sequencing and microarray studies[J]. Nucleic Acids Res, 2015, 43(7): e47. DOI:10.1093/nar/gkv007 |
[8] |
BENJAMINI Y, HOCHBERG Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing[J]. J Royal Stat Soc B, 1995, 57(1): 289-300. DOI:10.1111/j.2517-6161.1995.tb02031.x |
[9] |
YU G C, WANG L G, HAN Y Y, et al. clusterProfiler: an R package for comparing biological themes among gene clusters[J]. OMICS, 2012, 16(5): 284-287. DOI:10.1089/omi.2011.0118 |
[10] |
SZKLARCZYK D, FRANCESCHINI A, WYDER S, et al. STRING v10: protein-protein interaction networks, integrated over the tree of life[J]. Nucleic Acids Res, 2015, 43(Database issue): D447-D452. DOI:10.1093/nar/gku1003 |
[11] |
SHANNON P, MARKIEL A, OZIER O, et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks[J]. Genome Res, 2003, 13(11): 2498-2504. DOI:10.1101/gr.1239303 |
[12] |
TANG D, YUAN Z X, XUE X F, et al. High expression of Galectin-1 in pancreatic stellate cells plays a role in the development and maintenance of an immunosuppressive microenvironment in pancreatic cancer[J]. Int J Cancer, 2012, 130(10): 2337-2348. DOI:10.1002/ijc.26290 |
[13] |
ROBIN X, TURCK N, HAINARD A, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves[J]. BMC Bioinformatics, 2011, 12: 77. DOI:10.1186/1471-2105-12-77 |
[14] |
XIONG Y C, WEI Y J, GU Y, et al. DiseaseMeth version 2.0: a major expansion and update of the human disease methylation database[J]. Nucleic Acids Res, 2017, 45(D1): D888-D895. DOI:10.1093/nar/gkw1123 |
[15] |
COX T R, ERLER J T. Remodeling and homeostasis of the extracellular matrix: implications for fibrotic diseases and cancer[J]. Dis Model Mech, 2011, 4(2): 165-178. DOI:10.1242/dmm.004077 |
[16] |
PICKUP M W, MOUW J K, WEAVER V M. The extracellular matrix modulates the hallmarks of cancer[J]. EMBO Rep, 2014, 15(12): 1243-1253. DOI:10.15252/embr.201439246 |
[17] |
JIANG J, XU Y T, REN H J, et al. MKRN2 inhibits migration and invasion of non-small-cell lung cancer by negatively regulating the PI3K/Akt pathway[J]. J Exp Clin Cancer Res, 2018, 37(1): 189. DOI:10.1186/s13046-018-0855-7 |
[18] |
SUN R J, ZHAI R R, MA C L, et al. Combination of aloin and metformin enhances the antitumor effect by inhibiting the growth and invasion and inducing apoptosis and autophagy in hepatocellular carcinoma through PI3K/AKT/mTOR pathway[J]. Cancer Med, 2020, 9(3): 1141-1151. DOI:10.1002/cam4.2723 |
[19] |
ZHANG H J, TAO J, SHENG L, et al. Twist2 promotes kidney cancer cell proliferation and invasion by regulating ITGA6 and CD44 expression in the ECM-receptor interaction pathway[J]. Onco Targets Ther, 2016, 9: 1801-1812. DOI:10.2147/OTT.S96535 |
[20] |
KONIECZNA A, SZCZEPAN ŃSKA A, SAWIUK K, et al. Enzymes of the central carbon metabolism: are they linkers between transcription, DNA replication, and carcinogenesis?[J]. Med Hypotheses, 2015, 84(1): 58-67. DOI:10.1016/j.mehy.2014.11.016 |
[21] |
CURRIE E, SCHULZE A, ZECHNER R, et al. Cellular fatty acid metabolism and cancer[J]. Cell Metab, 2013, 18(2): 153-161. DOI:10.1016/j.cmet.2013.05.017 |
[22] |
ZAJCHOWSKI D A, BARTHOLDI M F, GONG Y, et al. Identification of gene expression profiles that predict the aggressive behavior of breast cancer cells[J]. Cancer Res, 2001, 61(13): 5168-5178. |
[23] |
JARZAB B, WIENCH M, FUJAREWICZ K, et al. Gene expression profile of papillary thyroid cancer: sources of variability and diagnostic implications[J]. Cancer Res, 2005, 65(4): 1587-1597. DOI:10.1158/0008-5472.can-04-3078 |
[24] |
JONES S, ZHANG X S, PARSONS D W, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses[J]. Science, 2008, 321(5897): 1801-1806. DOI:10.1126/science.1164368 |
[25] |
HAN B, YANG Y, CHEN J, et al. PRSS23 knockdown inhibits gastric tumorigenesis through EIF2 signaling[J]. Pharmacol Res, 2019, 142: 50-57. DOI:10.1016/j.phrs.2019.02.008 |
[26] |
EARL L A, BI S G, BAUM L G. Galectin multimerization and lattice formation are regulated by linker region structure[J]. Glycobiology, 2011, 21(1): 6-12. DOI:10.1093/glycob/cwq144 |
[27] |
ZHOU X F, LI D, WANG X G, et al. Galectin-1 is overexpressed in CD133+ human lung adenocarcinoma cells and promotes their growth and invasiveness[J]. Oncotarget, 2015, 6(5): 3111-3122. DOI:10.18632/oncotarget.3076 |
[28] |
LEUNG Z, KO F C F, TEY S K, et al. Galectin-1 promotes hepatocellular carcinoma and the combined therapeutic effect of OTX008 galectin-1 inhibitor and sorafenib in tumor cells[J]. J Exp Clin Cancer Res, 2019, 38(1): 423. DOI:10.1186/s13046-019-1402-x |
[29] |
ZHANG P F, LI K S, SHEN Y H, et al. Galectin-1 induces hepatocellular carcinoma EMT and sorafenib resistance by activating FAK/PI3K/AKT signaling[J]. Cell Death Dis, 2016, 7: e2201. DOI:10.1038/cddis.2015.324 |
[30] |
FOULCER S J, DAY A J, APTE S S. Isolation and purification of versican and analysis of versican proteolysis glycosaminoglycans, 2015(1229): 587-604. DOI: 10.1007/978-1-4939-1714-3_46.
|
[31] |
LAPIERRE D P, LEE D Y, LI S Z, et al. The ability of versican to simultaneously cause apoptotic resistance and sensitivity[J]. Cancer Res, 2007, 67(10): 4742-4750. DOI:10.1158/0008-5472.can-06-3610 |
[32] |
ZHANG J J, YANO H, SASAKI T, et al. The pro-α1(V) collagen gene (Col5a1) is coordinately regulated by miR-29b with core promoter in cultured cells[J]. Connect Tissue Res, 2018, 59(3): 263-273. DOI:10.1080/03008207.2017.1370465 |
[33] |
FENG G, MA H M, HUANG H B, et al. Overexpression of COL5A1 promotes tumor progression and metastasis and correlates with poor survival of patients with clear cell renal cell carcinoma[J]. Cancer Manag Res, 2019, 11: 1263-1274. DOI:10.2147/cmar.s188216 |
[34] |
HYNES R O. Integrins: bidirectional, allosteric signaling machines[J]. Cell, 2002, 110(6): 673-687. DOI:10.1016/s0092-8674(02)00971-6 |
[35] |
LIU M Y, ZHANG Y Q, YANG J X, et al. ZIP4 increases expression of transcription factor ZEB1 to promote integrin α3β1 signaling and inhibit expression of the gemcitabine transporter ENT1 in pancreatic cancer cells[J]. Gastroenterology, 2020, 158(3): 679-692. DOI:10.1053/j.gastro.2019.10.038 |
[36] |
JIA Y Z, QI C, ZHANG Z Y, et al. Overexpression of peroxisome proliferator-activated receptor-alpha (PPARalpha)-regulated genes in liver in the absence of peroxisome proliferation in mice deficient in both L-and D-forms of enoyl-CoA hydratase/dehydrogenase enzymes of peroxisomal beta-oxidation system[J]. J Biol Chem, 2003, 278(47): 47232-47239. DOI:10.1074/jbc.M306363200 |
[37] |
REKA A K, GOSWAMI M T, KRISHNAPURAM R, et al. Molecular cross-regulation between PPAR-γ and other signaling pathways: implications for lung cancer therapy[J]. Lung Cancer, 2011, 72(2): 154-159. DOI:10.1016/j.lungcan.2011.01.019 |
[38] |
CHEN Y Z, XUE J Y, CHEN C M, et al. PPAR signaling pathway may be an important predictor of breast cancer response to neoadjuvant chemotherapy[J]. Cancer Chemother Pharmacol, 2012, 70(5): 637-644. DOI:10.1007/s00280-012-1949-0 |
[39] |
KONDO Y. Epigenetic cross-talk between DNA methylation and histone modifications in human cancers[J]. Yonsei Med J, 2009, 50(4): 455-463. DOI:10.3349/ymj.2009.50.4.455 |
[40] |
PESCHANSKY V J, WAHLESTEDT C. Non-coding RNAs as direct and indirect modulators of epigenetic regulation[J]. Epigenetics, 2014, 9(1): 3-12. DOI:10.4161/epi.27473 |