随着数据驱动的机器学习研究的进步,探索如何利用机器学习来分析医疗数据变得至关重要。现有方法的一个主要限制是人体生理信息的数据结构通常是不规则的和无序的,很难将这些数据网格化为易于分析处理的格式。而图表神经网络通过边连接交互节点,并可以将时间关联或解剖结构赋值给边的权重,能够很好地利用生物系统中的隐式信息做出医疗诊断,引起了广泛关注。

我们确定了传统深度学习在应用于医学数据分析时面临的许多挑战,并强调了图神经网络在克服这些挑战方面的贡献。 我们介绍和讨论为医学诊断提出的各种图神经网络框架及其具体应用。我们涵盖了使用图网络结合深度学习技术进行生物医学成像应用的工作。 我们总结了基于图的深度学习当前面临的挑战,并根据当前观察到的趋势和局限性提出医疗卫生的未来方向。
图神经网络
图卷积神经网络

时态图网络
基于 RNN 的方法:通过使用图卷积来过滤输入和传递给循环单元的隐藏状态来捕获时空依赖性。典型的模型有 Diffusion Convolutional Recurrent Neural Networks (DCRNN)和 Graph Convolutional Recurrent Network (GCRN)。 基于 CNN 的方法:以非递归方式处理时空图。使用时间连接来扩展静态图结构,以便他们可以在扩展图上应用传统的 GNN。典型的模型有 Spatio-temporal Graph Convolutional Network (STGCN)、 Temporal Graph Convolutional Network(TGCN)。

具有注意力机制的图网络
软性注意力(Soft-attention)机制:端到端的方法,通常放置在编码器和解码器之间,可以通过基于梯度的方法学习。全注意力架构可以保留原始信号的细节,并选择最关键的信息。 自注意力(Self- attention)机制:完全依赖注意力机制也可以实现可比的性能,受此启发,图注意力网络(GAT)通过修改卷积操作将注意力机制融入到传播中。在传统的 GCN 中,权重通常取决于相邻节点,而 GAT 中的权重是通过基于节点特征的自注意力机制计算得来的。
用于医学诊断分析的 GNN 案例研究
大脑中的功能连接分析




基于电波图的分析



解剖结构分析(分类和预测)


解剖结构分析(分割)


研究挑战和未来方向
七个主要挑战
图表示和估计:大多数研究中的图结构都是手动设计的,缺乏统一的结构知识;不同的属性和任务需要不同的模型架构,图结构估计就是为了找到合适的图,以将数据表示为研究所需的输入形式。 动态图和时间图:许多现实世界的医学应用是动态的,这意味着图的节点、边和权重可以随时间变化。因此,静态图在时间场景中工作表现不佳。 图模型的复杂性和训练效率:GCN 与它的变体有着相当大的复杂性,这对于不太具有挑战的应用程序来说可能是苛刻且不必要的,需要更简单的图神经网络模型。 可解释性和可解读性:缺乏透明度被认为是 AI 在临床实践中采用的主要障碍之一,迈向值得信赖的 AI 的一步是可解释 AI 的发展。 图模型的泛化:难以使用异构数据构建准确和强大的学习模型,由于患者隐私和临床数据管理要求,真正集中的开源医疗大数据集团用于深度学习十分罕见,这就需要模型具有很强的泛化能力。 数据标注效率和训练范式:由于深度学习利用高度数据驱动的分层特征表示,医疗应用有几个关键挑战,包括注释稀缺、复杂注释和弱注释,以及标签的稀疏性。 不确定性的量化:在医学应用中,不确定性可以分为偶然不确定性和认知不确定性:偶然不确定性由数据中的噪声产生;认知不确定性则可能源于模型的不完整。
三个可能的方向
面部分析:临床专家依靠某些面部特征和症状进行辅助医学诊断,并且已引入计算机视觉来提供面部特征的自动和客观评估。然而, CNN 主要关注面部各区域,没有考虑面部运动之间隐藏的相互关系,这可以用 GCN 捕获。因此,在临床环境中使用 GNN 创建互补的图表示和关系推理方法还有待探索。 潜在应用:术后疼痛管理、血管脉搏监测、面瘫评估,以及几种神经和精神疾病,包括癫痫、多动症、自闭症、双相情感障碍和精神分裂症。

人体姿势定位:人体姿势捕捉重要的健康相关指标,在评估癫痫、睡眠监测和手术恢复等医疗状况方面具有潜在价值。由于人体姿势估计与图形结构有关,因此 GCN 可以以灵活的方式处理骨架数据。 潜在应用:病床上姿势估计,以跟踪手术和疾病恢复以及其他睡眠障碍(如呼吸暂停、压疮和腕管综合征)造成的损伤。

基于姿势的动作识别和行为分析:运动评估和监测是临床观察过程中的有力工具,并有助于诊断运动和精神障碍。然而,如前所述,骨架本身是图的形式。基于图的人体骨骼表示有一个显着的特点:i)关节和骨骼信息是互补的,将它们结合起来可以进一步改进基于骨骼的动作识别;ii) 时间连续性不仅存在于关节之间,也存在于身体结构中;iii) 空间域和时间域之间存在共存关系;iv) 骨架序列的时间动态也包含识别任务的重要信息。 潜在应用:
运动障碍:癫痫、帕金森、阿尔茨海默病、中风、震颤、亨廷顿舞蹈症和神经发育障碍。
精神障碍:痴呆症、精神分裂症、重度抑郁症、躁郁症和自闭症谱系。
其他情况:呼吸障碍、住院患者跌倒预测、诸如躁动、抑郁、谵妄、异常活动或评估医院环境中的人际交往等健康状况。

论文链接:https://arxiv.org/abs/2105.13137