鼻咽癌是我国南方尤其是广东省高发恶性肿瘤之一,又称为“广东癌”。为了有针对性地进行治疗,鼻咽癌的病理确诊十分重要。
近日,南方科技大学第二附属医院(深圳市第三人民医院)病理科罗伟仁教授团队与中科院深圳先进技术研究院医工所秦文健高级工程师团队在病理学的老牌期刊 America Journal of Pathology 上发表了题为:Computer-Aided Pathological Diagnosis of Nasopharyngeal Carcinoma Based on Deep Learning 的研究论文。
通过深度学习的方法,实现了对鼻咽部慢性炎症、淋巴结反应性增生和鼻咽癌(图1)的计算机辅助诊断,且模型性能优于经验不足的病理医生。这是国际上首次报道深度学习在鼻咽癌病理诊断中的临床应用。

图1 鼻咽部三类病变:慢性鼻咽炎症(A-D)、淋巴结反应性增生(E-H)和鼻咽癌(I-L)。
本研究采用深度学习的方法来实现鼻咽癌的计算机辅助诊断,并选择Inveption-v3作为网络模型。将收集到的数据分为训练集、验证集和测试集(图3)。因为全景病理图像尺寸巨大计算机无法直接计算分析,所以在图像预处理过程中将图像切割成600 ×600大小的patch,用原病理图像的标签给每一张patch做标注(图2)。为了提升模型的性能,训练过程也采用了迁移学习策略,先在Imagnet数据库上训练模型,再使用切割好的patch进行正式训练。

图2 本研究图像预处理、模型选择及训练流程。
为了评估模型的性能并证明其临床价值,本研究也进行了对比试验。请三位病理医生对本研究测试集中的全景病理图像分别进行诊断,三位医生具有不同等级的经验积累,并分别被称为初级医生、中级医生和高级医生(图3)。对于模型和医生的诊断结果,采用AUC来评价诊断性能(图4),采用Jaccard系数、欧氏距离和Kappa系数来评价诊断一致性(图5)。

图3 本研究数据集划分及对比实验设计。
根据ROC曲线及AUC可以看出(图4),本研究中训练好的模型具有较高的性能,对鼻咽部慢性炎症、淋巴组织增生、鼻咽癌三个类别的图像的AUC分别是0.905,0.972和0.930,平均AUC是0.936。模型的综合评价要优于初级医生和中级医生,平均AUC值仅略微低于高级医生的0.956。特别是在慢性炎症的诊断上,模型的性能明显优于初级医生和中级医生。因此,在临床病理诊断中,运用模型可以给经验不足的医生起到很好的辅助作用。

模型的一致性评价同样得到了较好的结果(图5)。Jaccard系数和Kappa系数值越大,一致性越高;欧式距离值越小,一致性越高。模型的三个评价系数的结果均优于初级医生和中级医生,并略差于高级医生。在应用Kappa系数进行的评价中,本研究将三名医生的联合诊断的一致性与模型进行了对比,并得到了模型一致性较高的结果。

图5 一致性评价结果
根据AUC及一致性评价的结果,本研究中训练得到的模型可以更高效准确地做出诊断,对于一些情况较为简单的病例,可以应用模型快速诊断,这样可以帮助医生将更多的精力放在复杂病例上,且对于这些复杂病例,模型也可以提供诊断参考。为了证明提到的该模型的优点,本研究对每一个病例的诊断情况进行了统计分析(图6)。例如,对于初级医生,医生做出正确诊断的病例占82.40%,在医生诊断错误的病例中,有89.80%的病例在模型的辅助下可以做出正确诊断,而医生和模型都诊断错误的病例仅占1.80%。同样,对于中级医生和高级医生,医生和模型都诊断错误的病例分别只有1.80%和0.90%。因此,医生诊断再加上模型的辅助诊断,误诊率可以大大下降。

图6 初级医生、中级医生、高级医生分别和模型联合诊断的误诊率统计
该研究工作得到了国家自然科学基金委面上项目、广东省自然科学基金面上项目以及深圳市科学技术项目的支持。刁颂辉、侯嘉馨、喻宏为该工作的共同第一作者,中科院深圳先进技术研究院与深圳市第三人民医院为该工作的通讯单位。据网站资料介绍,该文共同通讯罗伟仁教授为教育部国家公派留美访问学者,教育部研究生学位论文评审专家,深圳市海外高层次孔雀计划人才,师从我国鼻咽癌研究的奠基人,中国科学院院士姚开泰教授,担任多家SCI期刊的Associate editor和Review editor,主持国家自然科学基金2项和广东省自然科学基金2项等课题,研究方向为EB病毒相关的鼻咽癌研究。
论文链接:https://ajp.amjpathol.org/article/S0002-9440(20)30204-2/fulltext