Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

突破性进展!浙大scNiche框架精准识别细胞生态位,助力精准医疗

图片

编辑 | 2049

随着单细胞空间组学技术的快速发展,科研人员可以在单细胞分辨率水平上系统探索组织中细胞状态、功能和相互作用。

然而,如何从这些海量的空间组学数据中精确识别和表征细胞生态位(cell niche)仍是一个重大挑战。

近日,浙江大学药学院团队开发了一个名为 scNiche 的计算框架,可以从单细胞分辨率的空间组学数据中有效识别和表征细胞生态位。

该研究以「Identification and characterization of cell niches in tissue from spatial omics data at single-cell resolution」为题,发表于 2025 年 2 月 16 日的《Nature Communications》。

图片
论文链接:https://www.nature.com/articles/s41467-025-57029-9
代码地址:https://github.com/ZJUFanLab/scNiche

研究背景

当前空间组学技术虽能获取单细胞分辨率的分子图谱,但现有计算方法多基于同质性假设,难以捕捉细胞微环境中的异质性特征。

传统方法如 HMRF 和 BayesSpace 采用 Potts 模型强制邻近细胞共享相同标签,这种简化处理导致肿瘤-免疫界面等复杂微环境识别困难。BASS 等改进方法虽引入层次模型,但在多样本整合和大规模数据处理上仍显不足。

研究团队发现,细胞自身分子特征、邻域分子特征和细胞组成特征这三个视角的信息互补性,为克服现有方法的不足提供了新思路。

scNiche框架的三维解析

scNiche 框架采用了独特的设计理念,将细胞本身及其微环境的各种特征统一定义为细胞的不同「视角」特征。具体来说,scNiche 默认在预定义的 k-nearest neighbors 范围内提取三类特征:细胞的分子表达谱、其邻域的分子表达谱以及邻域的细胞组成。

与之前大多数深度学习方法不同,scNiche 首先为不同视角的特征构建独立的图网络,然后利用图神经网络将这些多视角特征整合成一个有意义的联合表示。

这种模型架构包含三个关键组件:多图自编码器(M-GAE)、图融合网络(GFN)和多视图互信息最大化(MMIM)模块。

M-GAE 模型基于图卷积网络(GCN)构建,通过视图特定的 GCN 编码器层编码多视图数据的互补信息,GFN 捕获不同视图图之间的关系并生成包含所有视图全局节点关系的一致性图。

MMIM 模块通过提升任意视角中相邻样本表示之间的相似性来引导更适合聚类的联合表示学习。该模块采用了基于 Shannon 熵的互信息度量方法,通过最大化样本与其近邻的互信息来增强模型对细胞微环境结构的识别能力。

图片
图示:scNiche 概览。(来源:论文)

性能验证

scNiche 的扩展性通过包含 3,698,530 个细胞的小鼠全脑 MERFISH 数据集得到验证。

得益于其创新的 subgraph-based batch training strategy(通过随机采样构建子图进行分批次训练),该方法能够准确识别包括丘脑-纹状体边界在内的不同脑区结构。

基准测试中,scNiche 在空间蛋白质组学数据集(CODEX、IMC)和空间转录组数据集(STARmap、MERFISH)上均实现了最高的 adjusted Rand index (ARI) 和 macro-F1 分数,显著优于现有方法。

在 10X Visium 数据分析中,即使用 Cell2location 的反卷积结果替代原始细胞组成特征,模型仍保持较好的表现。

在基因表达随机归零的鲁棒性测试中,scNiche 在低 dropout 率时表现相对稳定,但当 dropout 率较高时,所有方法(包括 scNiche)的性能都会显著下降。

图片

图示:小鼠全脑 MERFISH 数据集的性能评估。(来源:论文)

临床应用

在 19 例混合型与 15 例区室化三阴性乳腺癌样本中,scNiche 揭示了独特的免疫微地理特征。

Niche 6 中巨噬细胞高表达 CD11b(p=0.011)和 PD-L1(p=0.016)等免疫调节蛋白,形成免疫抑制微环境;而 Niche 12 中的巨噬细胞呈现出与肿瘤细胞的高度共定位特征(proportion=0.67, p=0.002)。

研究发现 Keratin+ 肿瘤细胞在 Niche 5 与 Niche 11 呈现差异化分布:前者 CK17 表达显著高于后者(p=0.014),且特异性富集于不同患者群体,这为个体化治疗提供了潜在靶点。

图片

图示:乳腺癌微环境解析。(来源:论文)

在肝损伤研究中,scNiche 发现与正常肝脏门静脉周围区域(Niche 1)相比,肝损伤组织中的 Niche 10 显著上调了多个抗氧化基因(如 Gpx3、Gsta1、Gsta2、Gsto1)以及组织纤维化相关基因(如 Ctsl、Ctsb 等 cathepsins 编码基因),揭示了肝损伤微环境的适应性分子特征。

图片

图示:疾病特异性肝损伤的微环境。(来源:论文)

未来展望

scNiche 通过创新的多视角融合架构,在保持单细胞分辨率的同时,实现了跨样本、跨条件的微环境对比分析。其在肝损伤研究中揭示的 zonation 模式重构现象,为器官纤维化机制研究提供了新视角。

但需注意,对于低分辨率的空间转录组数据,微环境解析精度可能受限。未来研究方向包括:整合组织学图像特征以提升空间分辨率、结合单细胞空间映射(如 Tangram、CytoSPACE)或重建技术扩展应用场景,以及开发统一的空间多组学数据解析框架。

理论AI for Science生物空间组学智慧医疗浙江大学
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

特征构建技术

特征构造(也称为构造感应或属性发现)是一种数据增强形式,可将派生特征添加到数据中。 特征构造可以使机器学习系统在各种学习任务中构建更准确的模型。

批次技术

模型训练的一次迭代(即一次梯度更新)中使用的样本集。

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

图网络技术

2018年6月,由 DeepMind、谷歌大脑、MIT 和爱丁堡大学等公司和机构的 27 位科学家共同提交了论文《Relational inductive biases, deep learning, and graph networks》,该研究提出了一个基于关系归纳偏置的 AI 概念:图网络(Graph Networks)。研究人员称,该方法推广并扩展了各种神经网络方法,并为操作结构化知识和生成结构化行为提供了新的思路。

推荐文章
暂无评论
暂无评论~