用人工智能挑战最致命的癌症。
日常生活中,我们经常会与人工智能进行互动,从解锁手机,使用搜索引擎到地图导航……AI 正在为我们带来越来越多的便利。不过在临床医学中,AI 技术的应用速度要慢得多,绝大多数诊断和治疗建议仍然完全基于人类判断。
直到最近,AI 在医疗影像的新突破,让事情有了变化。
上周,最新一期自然杂志子刊《自然医学》(Nature Medicine)上一个名为「PANDA」(PAncreatic cancer Detection with AI)的胰腺癌早筛 AI 模型正式亮相,成为了人们热议的话题。
该研究通过「平扫 CT+AI」的方法,让我们首次拥有了大规模早期胰腺癌的筛查手段。
据研究团队介绍,PANDA 早期筛查模型的特异性达到了 99.9%,这意味着每 1000 次测试中只出现一个假阳性;其检测胰腺肿瘤的能力可达 92.9%;鉴别胰腺癌的能力比放射科医生独立判断时的平均表现提高了 34.1%。
这或许是人类在与「癌症之王」胰腺癌的斗争中第一次掌握了主动权。《自然医学》对此还专门刊发评论文章:「基于医疗影像 AI 的癌症筛查即将进入黄金时代」。
癌症的早筛一直被认为充满挑战,人们一直期待出现一种简便通用的技术,来对大规模无症状人群进行癌症筛查。利用 AI 算法的 PANDA 或许会成为给我们带来希望。
破解「癌症之王」
关于胰腺癌, 我们可以列举两个残酷的数据:平均五年生存率不到 10%,80% 的情况下发现就是晚期。时至今日,胰腺癌已经成为中国乃至全球生存率最低的恶性肿瘤。
图片来源:http://www.china-rt.cn/special/856.html
胰腺癌早期发现困难的原因之一在于其明显症状很少,而且在癌症进展之前很难进行自愿检查。此外,由于胰腺位于身体最深处,一些影像学检查(例如腹部超声检查)可能无法显示整个胰腺。而增强 CT、增强 MRI、PET 等影像诊断,由于需要注射造影剂、辐射剂量、检查周期长、费用昂贵等原因,不太适合用于大规模胰腺癌筛查。
在体检及医院常用的平扫 CT 图像上,同样由于图像对比度低,很难识别早期胰腺病变,容易出现漏诊或误诊。
因此,胰腺癌的早筛早治具有重要的临床意义,在筛查手段上进行革新也显得尤为必要和关键。AI 技术或许能够帮助我们解决这个问题。
在 PANDA 论文中,基于阿里达摩院的医疗 AI 技术,上海市胰腺疾病研究所、浙江大学医学院附属第一医院、中国医科大学附属盛京医院、复旦大学附属肿瘤医院、布拉格查理大学第一附属医院、上海交通大学医学院附属新华医院、约翰霍普金斯大学等机构首次提出以「平扫 CT+AI」进行大规模的胰腺癌早期筛查。
PANDA 模型在这十多家顶尖医疗机构进行了大规模多中心验证,显示了稳定的泛化性能。此外,在上海市胰腺疾病研究所的体检、急诊、门诊、住院等场景中实验,仅通过最简单的平扫 CT,就在 2 万多真实世界连续病人群体中发现 31 例临床漏诊病变,至今已有两例早期胰腺癌病患已完成手术治愈。
目前,这项研究成果已向全球医生和研究人员开放。
这也是中国放射影像领域的科研成果首次登上《自然医学》杂志:
论文链接:https://www.nature.com/articles/s41591-023-02640-w
开放地址:https://g.alicdn.com/medical-engineering/d3viewer/0.0.87/index.html#/panda
在 AI 加医疗领域,我们见证过很多医疗影像的研究成果,本次登上 Nature 子刊的工作有哪些创新之处?首先,针对胰腺癌变位置隐匿、在平扫 CT 图像中无明显表征等特点,达摩院为 PANDA 设计了独特的深度学习框架,模型概览图如下所示。
上图 a 为模型开发,PANDA 以平扫 CT 为输入,输出可能发生胰腺病变(包括 PDAC 和其他 7 种非 PDAC 亚型)的概率和分割掩码。PANDA 接受了病理学确认的病患级标签和增强 CT 图像上标注的病变掩码的训练。b 为模型评估,评估 PANDA 在内部测试组、平扫和增强 CT 、外部测试组、胸部 CT 组等真实世界多场景研究中的性能。c 为模型临床转化。
达摩院医疗 AI 高级算法专家、也是这次 PANDA 项目负责人张灵进一步解释称,PANDA 并不是一个单纯的视觉分割模型,它兼具了分割、检测和分类功能,其深度学习框架(下图)包括以下三阶段,每个阶段「各司其职」。
第一,通过构建分割网络(U-Net)来定位胰腺;
第二,采用多任务网络(CNN)来检测异常情况;
第三,采用双通道 Transformer 来分类并识别胰腺病变的类型。
达摩院在 PANDA 模型的训练策略上也做了一系列技术创新,从而实现了高效、安全的大规模胰腺癌早筛。其中的关键在于如何更加准确地识别平扫 CT 图像中肉眼难以识别的细微病例特征。
同样重要的是数据,AI 筛查模型的训练需要医生手工标注大量肿瘤,但平扫 CT 图像对比度极低导致医生几乎无法标注。达摩院医疗 AI 团队先让合作医生们在增强 CT 上勾画,然后利用提出的知识迁移训练方法,通过精确的适用于腹部 CT 图像配准的算法将增强 CT 上的先验知识迁移到平扫 CT 相应位置。这样一来,以往 AI 识别癌症普遍存在的勾画难、标注难、训练难等问题得到有效解决。
同时,由于该研究主要通过腹部 CT 训练,而现实中胸部 CT 大量存在,达摩院算法团队提出一种基于模拟裁剪的数据增强方法,解决了模型泛化到胸部 CT 通常可能出现胰腺肿瘤扫描不全的问题。
得益于 PANDA 训练架构和策略的创新,该研究构建了迄今最大的胰腺癌肿瘤 CT 训练集(包含 3208 名真实病人)。该 AI 算法在一个由全球十多家医院约 6200 名患者组成的多中心队列中进行了验证,其中包括确诊的胰腺癌病例和无胰腺病变的对照病例。
随后,PANDA 进一步在包含 20530 名真实世界连续病例的多场景验证中测得了 92.9% 的敏感性(判断存在胰腺病变的准确率)和 99.9% 的特异性(正确判断无病的几率)。
截至目前,PANDA 模型已在医院、体检等场景被调用超过 50 万次,帮助医生成功发现多起临床漏诊的早期胰腺肿瘤病例,平均每 1000 次只出现一次假阳性。研究人员表示,未来还将持续进行多中心前瞻性临床验证, 以期改写「胰腺肿瘤不推荐筛查」的悲观论点。
复旦大学附属肿瘤医院放射诊断科主任顾雅佳教授表示,这篇论文提出了一种有潜力的大规模胰腺癌筛查方法,在提升检出率的同时,又不会给病人带来额外的辐射与经济负担,「设想一下,我们去体检时做个最简单的平扫 CT,就能查出有无胰腺癌,这将帮助到很多胰腺病人,减少悲剧的发生。」
达摩院医疗 AI 团队负责人、IEEE Fellow 吕乐表示,这项研究是一个重要的里程碑,在临床上证实了「平扫 CT+AI」的癌症筛查技术路径的可靠性。
构建实用的 AI 影像诊断体系
AI 加持的医疗影像技术,正在为当前的医学带来各种新的可能性。
迄今为止,美国食品药品监督管理局 FDA 已批准了 300 多种医疗影像相关的人工智能工具。通过深度学习技术,医生们可以在一些领域的病灶识别、标注、靶区勾画等任务上获得帮助,更快发现隐藏病灶,完成诊断、治疗工作。
在癌症的 AI 医疗影像工作上,此前大多数方法聚焦于协助医生进行病灶检测和诊断。此次 PANDA 研究带来的突破,则为人们在基于影像的大规模多癌筛查上开辟了一条新道路,有望提高重大癌症的早期检出率。
对于达摩院的 AI 加医疗探索来说,这只是近年来成果的一小部分。
「AI 应该解决那些尚未得到解决、而病人又真切需要的临床需求。我们需要在病人性命攸关的临床问题上,做出不可或缺的贡献。」这是达摩院医疗 AI 团队秉持的医疗技术第一性原则。
我们了解到,达摩院医疗 AI 团队长期致力于 AI 与医疗影像的融合研究,重点布局精准癌症诊疗、精准慢性病诊疗、神经退行性疾病预筛三大方向,其中研发了包括规模筛查、精准诊断、预后治疗、响应评估在内的全流程的癌症诊疗技术。
除了技术探索之外,达摩院医疗 AI 团队还与全球多家顶尖医疗机构的合作,利用 AI 技术探索低廉、高效的多癌筛查新方法,希望通过一次平扫 CT 就能查出多种早期癌症。
截至目前,相关工作已经在胰腺癌、食管癌肺癌、乳腺癌、肝癌、胃癌、结直肠癌等七种高发癌症上取得阶段性进展,相关研究成果先后登上 Nature Medicine、Nature Communications 等医学期刊及 CVPR/MICCAI/IPMI 等 AI 顶会。可以说基于医疗影像 AI 的前沿技术与癌症筛查这个领域实现了「双向奔赴」。
达摩院的 AI + 医疗影像重要研究,还包括但不限于:
2022 年 10 月,其医疗 AI 团队初步验证了 AI 与平扫 CT 结合的技术可行性,敏感性和特异性均超过专家医生水平,有望用于早期食管癌检查,相关论文发表在了 MICCAI 2022;同月基于深度学习对头颈癌 42 个危及器官进行高效精准自动规划,有效减少放射治疗并发症,研究登上 Nature Communications。
论文地址:https://www.nature.com/articles/s41467-022-33178-z
2023 年 6 月,针对 CV 领域的 OOD 难题提出全新医学图像语义分割框架,让 AI 更准确识别肿瘤中的疑难罕见案例,并已在胰腺和肝脏肿瘤上得到验证。该研究被 CV 顶会 CVPR 2023 评为 Highlight 论文。同月基于增强 CT 的胰腺肿瘤鉴别诊断也有了新进展,成果在医学图像处理顶会 IPMI 2023 上发表。
2023 年 8 月,发布多癌影像分析通用模型 CancerUniT ,利用增强 CT 实现 8 种主流癌症的辅助诊断,研究成果被 CV 顶会 ICCV 2023 收录。同月发布的首个可以分割全身 143 个器官的连续深度学习框架也被 ICCV 2023 接收。
CancerUniT 检测、分割和诊断 8 种癌症肿瘤的示例。图源:https://arxiv.org/pdf/2301.12291.pdf
不久后,达摩院免费开放 100 件 AI 专利许可,其中有 3 件是专门针对癌症的精准治疗和解决关键的医疗图像配准问题(后来在 10 月份 MICCAI 2023 Learn2Reg 竞赛上, 达摩院相关医疗图像配准技术以比较明显的优势,获得所有两个赛道的冠军)。
2023 年 10 月,基于 CT 图像的肝脏肿瘤筛查与诊断、胃癌筛查、肺结节自动检测及良恶性鉴别、胰腺癌预后等几项工作也在 MICCAI 2023 发表。
再加上胰腺癌早期检测模型 PANDA,达摩院的医疗 AI 技术,成为了一个又一个 AI for Science 的范例。
不仅如此,在达摩院的设想中,AI 不仅可以辅助医生进行多个癌症疾病筛查,同时还可以进行心脏病、腰椎、骨骼等疾病筛查,希望能在一张平扫 CT 的基础上同时检测出 8 种肿瘤和 5 种慢性病,实现基于医疗 AI 的普惠筛查。
据了解,达摩院已与浙大一院、复旦肿瘤、北医三院等多家三甲医院建立了临床科研合作关系,其医疗 AI 产品已成功对接落地 30+ 家医疗影像合作伙伴,累计落地医疗机构数超过 1000 家,为全球 2000 万人次提供了智能化医疗健康服务。
结语
有了 AI + 平扫 CT 技术,我们或许可以想象:在未来通过完成常规、有限的体检项目,我们就能在 AI 加持辅助下获得很多疾病的筛查结果。
此外,在 AI 技术进一步实用化以后,不仅是医疗影像数据,人们的就诊记录、行为模式,甚至声音等各种信息都可以作为数据进行模型的训练,并用于检测病症,为病人提供精准治疗的数据决策支持。
而这些能帮助人们获得健康的科技,会有一部分来自于阿里达摩院。
达摩院自 2017 年成立以来,一直以探索未知,以人类愿景为驱动力为目标,面向未来开展基础科学和创新性技术研究。位于科技趋势重要位置的 AI for Science,是其努力方向的重中之重。随着近年来一系列技术突破和应用的铺开,很多原本存在于我们想象中的事正在逐步实现。
「任何一家公司生命周期都是有限的,但能留下来的,是阿里巴巴的技术、经验以及对社会的担当。达摩院必须要解决社会问题,才能活得长。」正如马云在达摩院创立之初所期许的,达摩院要成为一家面向未来、以科技解决重大社会问题的企业研究机构。
迎战「癌王」,实现大规模癌症早筛的 PANDA,只是一个开始。