早期肝癌的发生率持续增加,其中很大一部分会复发。因此急需鉴定复发相关的marker。
CpG岛:CpG双核苷酸在人类基因组分布不均一,在某些基因组片段高于正常概率,被称为CpG岛,主要位于启动子和第一外显子区域,约有60%以上基因的启动子含有CpG岛。
CpG甲基化:70%-90%的CpG是被甲基化的,而CpG岛则是非甲基化的。当CpG岛出现甲基化时,多与肿瘤相关。
焦磷酸测序
Cox回归模型:比例风险回归模型,以生存结局和生存时间为应变量,同时可以分析众多因素对生存期的影响,能分析带有截尾生存时间的资料。多因素分析方法。
探索阶段:66个早期HCC病例被从347个HCC病人中诊断出来,通过LASSO和SVM算法筛选CpG,然后将结果取交集。
训练阶段:用281个HCC样本做惩罚性Cox回归得到风险指数
验证阶段:candidate CpGs用一个内部验证和两个外部验证进行
统计病人临床样本信息

576个病人的随访时间的中位数是55.6个月(范围:8-136个月)。52.6%的病人复发,38.9%的病人死亡。303个复发病人中,38 patients (12.5%) underwent resection, 49 patients (16.2%) underwent ablation, 139 patients (45.9%) received TACE, and 77 patients (25.4%) received no further treatments. For the entire cohort, the 1- and 5-year RFS rates were 78.8% and 46.6%, respectively, and the 1- and 5-year OS rates were 93.9% and 66.6%, respectively.
选择Candidate CpGs
先用差异基因筛选的方法,得到2550个差异CpGs,然后用lasso和SVM各自筛选差异CpGs,取交集,最终得到14个CpGs。
用筛选出的46个CpGs对66个样本进行聚类验证,看是否能区分复发和非复发。再用惩罚性cox回归继续narrow down 这些CpGs
对于Cox: risk score = (0.1043 methylation level of SGIP1) + (21.125 3 methylation level of SCAND3) + (20.085 3 methylation level of PI3).
最终挑出了三个CpGs (cg20657849, cg19406367, and cg19931348)
四个数据集的生存分析
这里的重点是训练集,内部验证和外部验证的数据集都是怎么划分的。
预测的nanogram
预测个体的复发几率 表一:多因素RFS分析 建立预测模型
在训练集中建立预测模型,将临床因素也考虑进来,如肿瘤分化,HBV,抗病毒治疗
