
编辑 | 2049
随着单细胞空间组学技术的快速发展,科研人员可以在单细胞分辨率水平上系统探索组织中细胞状态、功能和相互作用。
然而,如何从这些海量的空间组学数据中精确识别和表征细胞生态位(cell niche)仍是一个重大挑战。
近日,浙江大学药学院团队开发了一个名为 scNiche 的计算框架,可以从单细胞分辨率的空间组学数据中有效识别和表征细胞生态位。
该研究以「Identification and characterization of cell niches in tissue from spatial omics data at single-cell resolution」为题,发表于 2025 年 2 月 16 日的《Nature Communications》。

研究背景
当前空间组学技术虽能获取单细胞分辨率的分子图谱,但现有计算方法多基于同质性假设,难以捕捉细胞微环境中的异质性特征。
传统方法如 HMRF 和 BayesSpace 采用 Potts 模型强制邻近细胞共享相同标签,这种简化处理导致肿瘤-免疫界面等复杂微环境识别困难。BASS 等改进方法虽引入层次模型,但在多样本整合和大规模数据处理上仍显不足。
研究团队发现,细胞自身分子特征、邻域分子特征和细胞组成特征这三个视角的信息互补性,为克服现有方法的不足提供了新思路。
scNiche框架的三维解析
scNiche 框架采用了独特的设计理念,将细胞本身及其微环境的各种特征统一定义为细胞的不同「视角」特征。具体来说,scNiche 默认在预定义的 k-nearest neighbors 范围内提取三类特征:细胞的分子表达谱、其邻域的分子表达谱以及邻域的细胞组成。
与之前大多数深度学习方法不同,scNiche 首先为不同视角的特征构建独立的图网络,然后利用图神经网络将这些多视角特征整合成一个有意义的联合表示。
这种模型架构包含三个关键组件:多图自编码器(M-GAE)、图融合网络(GFN)和多视图互信息最大化(MMIM)模块。
M-GAE 模型基于图卷积网络(GCN)构建,通过视图特定的 GCN 编码器层编码多视图数据的互补信息,GFN 捕获不同视图图之间的关系并生成包含所有视图全局节点关系的一致性图。
MMIM 模块通过提升任意视角中相邻样本表示之间的相似性来引导更适合聚类的联合表示学习。该模块采用了基于 Shannon 熵的互信息度量方法,通过最大化样本与其近邻的互信息来增强模型对细胞微环境结构的识别能力。

性能验证
scNiche 的扩展性通过包含 3,698,530 个细胞的小鼠全脑 MERFISH 数据集得到验证。
得益于其创新的 subgraph-based batch training strategy(通过随机采样构建子图进行分批次训练),该方法能够准确识别包括丘脑-纹状体边界在内的不同脑区结构。
在基准测试中,scNiche 在空间蛋白质组学数据集(CODEX、IMC)和空间转录组数据集(STARmap、MERFISH)上均实现了最高的 adjusted Rand index (ARI) 和 macro-F1 分数,显著优于现有方法。
在 10X Visium 数据分析中,即使用 Cell2location 的反卷积结果替代原始细胞组成特征,模型仍保持较好的表现。
在基因表达随机归零的鲁棒性测试中,scNiche 在低 dropout 率时表现相对稳定,但当 dropout 率较高时,所有方法(包括 scNiche)的性能都会显著下降。

图示:小鼠全脑 MERFISH 数据集的性能评估。(来源:论文)
临床应用
在 19 例混合型与 15 例区室化三阴性乳腺癌样本中,scNiche 揭示了独特的免疫微地理特征。
Niche 6 中巨噬细胞高表达 CD11b(p=0.011)和 PD-L1(p=0.016)等免疫调节蛋白,形成免疫抑制微环境;而 Niche 12 中的巨噬细胞呈现出与肿瘤细胞的高度共定位特征(proportion=0.67, p=0.002)。
研究发现 Keratin+ 肿瘤细胞在 Niche 5 与 Niche 11 呈现差异化分布:前者 CK17 表达显著高于后者(p=0.014),且特异性富集于不同患者群体,这为个体化治疗提供了潜在靶点。

图示:乳腺癌微环境解析。(来源:论文)
在肝损伤研究中,scNiche 发现与正常肝脏门静脉周围区域(Niche 1)相比,肝损伤组织中的 Niche 10 显著上调了多个抗氧化基因(如 Gpx3、Gsta1、Gsta2、Gsto1)以及组织纤维化相关基因(如 Ctsl、Ctsb 等 cathepsins 编码基因),揭示了肝损伤微环境的适应性分子特征。

图示:疾病特异性肝损伤的微环境。(来源:论文)
未来展望
scNiche 通过创新的多视角融合架构,在保持单细胞分辨率的同时,实现了跨样本、跨条件的微环境对比分析。其在肝损伤研究中揭示的 zonation 模式重构现象,为器官纤维化机制研究提供了新视角。
但需注意,对于低分辨率的空间转录组数据,微环境解析精度可能受限。未来研究方向包括:整合组织学图像特征以提升空间分辨率、结合单细胞空间映射(如 Tangram、CytoSPACE)或重建技术扩展应用场景,以及开发统一的空间多组学数据解析框架。