目的 基于基因表达综合数据库(GEO)信息,筛选与肝细胞癌(HCC)相关的核心基因,评估其在预测HCC发病方面的临床应用价值。方法 从GEO数据库下载HCC基因表达谱GSE14520、GSE63898,将数据合并后作为内部数据集。以P<0.05且|log2 FC|>3.5为条件筛选HCC的差异基因,并与加权基因共表达网络分析(WGCNA)特征基因取交集后,筛选与HCC相关的核心基因。利用基因本体论(GO)和京都基因与基因组百科全书(KEGG)通路富集分析核心基因的潜在功能。利用机器学习算法构建HCC的最优预测模型,并使用外部数据集GSE46444和GSE76427进行模型验证。通过Cytoscape和PPI软件筛选关键核心基因,开展细胞增殖和侵袭实验验证。结果 通过差异表达分析和WCGNA分析筛选出6个核心基因,分别为CYP1A2、HAMP、MT1H、MT1M、GPC3、SPINK1。通过GO和KEGG通路富集分析,核心基因与金属离子反应、无机物质反应、矿物质吸收相关。机器学习算法筛选出Stepglm[both]与XGBoost算法确定HCC的最优模型,在内部数据集的AUC值为0.996(95%CI:0.991~0.998),在外部数据集GSE46444组和GSE76427组的AUC值分别为0.808(95%CI:0.727~0.877)和0.985(95%CI:0.971~0.996)。通过Cytoscape软件分析鉴定出的3个基因分别是MT1M、MT1H、GPC3,并且MT1H为HCC的关键核心基因。细胞实验发现敲除MT1H促进了肝癌细胞的增殖能力及侵袭能力(F=261.2、37.54,均P<0.001),表明MT1H具有抑癌作用。结论 通过生物信息学筛选出CYP1A2、HAMP、MT1H、MT1M、GPC3、SPINK1可能是HCC潜在的生物诊断标志物,为HCC的临床诊疗提供思路。并且MT1H为HCC的关键核心基因,可以抑制HCC进展。