近日,上海交通大学生命科学技术学院/医学院临床研究中心俞章盛教授课题组与合作者在中科院top期刊《cell reports medicine》在线发表题为“harnessing tme depicted by histological images to improve cancer prognosis through a deep learning system”的研究成果,该研究开发了一个深度学习系统,可以通过组织病理学图像,为没有空间转录组数据的癌症患者预测肿瘤微环境信息,从而实现精确的癌症预后,大幅度地拓展了基因空间表达信息在大型生物医学病理图像公共数据库的使用。生命科学技术学院“致远荣誉计划”博士研究生高瑞恬是本文的第一作者,生命科学技术学院/医学院临床研究中心俞章盛教授、自然科学研究院王宇光教授及医学院附属瑞金医院孙晶教授为共同通讯作者。
癌症患者的预后预测一直是临床中的重要挑战。肿瘤微环境对实体肿瘤的发生、演变和转移至关重要。越来越多的研究揭示了肿瘤微环境与癌症预后和治疗选择之间的相关性。空间转录组学技术可以从空间基因表达的角度对肿瘤微环境进行表征,区分癌症患者的不同预后亚组。然而,空间转录组的高昂成本和长实验周期阻碍了其应用于大规模癌症患者队列中进行生存预测。在临床中易于获取的组织病理学图像提供了丰富的肿瘤形态学信息,如果能开发出人工智能模型基于图像预测分子层面的基因空间表达水平,进而刻画肿瘤微环境,有望实现更精确的癌症预后。
该研究致力于开发一个深度学习系统,利用组织病理学图像预测相应区域的高维基因空间表达水平,克服空间转录组数据目前存在的高成本和有限样本量等局限性,对仅有病理图像数据、没有空间转录组数据的大规模癌症队列进行肿瘤微环境刻画,提高癌症患者预后的精确性。该深度学习系统包含两个部分,第一部分是基于卷积神经网络和图神经网络的空间转录组表达水平预测模型 (igi-dl),第二部分是基于空间基因表达描绘的肿瘤微环境信息进行癌症生存预后预测。
构建的igi-dl模型集成了卷积神经网络和图神经网络的优势,充分利用组织病理学图像中的像素强度和结构特征,实现更准确的基因空间表达水平预测。模型在结直肠癌、乳腺癌和皮肤鳞状细胞癌这三种类型实体瘤中均表现出色,与五种现有方法相比平均相关系数提升了 0.171。
图1. igi模型在结直肠癌样本中的基因空间表达预测性能和可视化
进一步,应用igi-dl模型通过组织病理学图像推断基因的空间表达,构建super-patch graph,进行癌症患者的生存预后。研究结果表明使用igi-dl预测的基因空间表达作为super-patch graph中的节点特征可以提高生存预后模型在tcga数据集乳腺癌和结直肠癌队列中的性能表现,五折交叉验证c-index为0.747 和 0.725,优于其他生存预后模型。该生存预后模型对于早期患者(i期和ii期)的预后预测同样保持精度优势,预测得到的风险评分可以作为所有阶段患者和早期患者的独立预后指标。在包含一千多名患者数据的外部测试集mco-crc中,生存预后模型保持稳定的优势,具有泛化能力。
图2. 生存预后模型在内部和外部测试集上的性能表现
该研究受到国家自然科学基金、上海市科学技术委员会基金、上海交通大学“医工交叉研究基金”等项目资助。同时感谢上海交通大学网络信息中心提供的超算平台支持。
原文链接: