AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
结构异质性:应对图结构信息中的分布偏移。 特征异质性:处理跨图数据集的多样特征表示。 快速适配:使模型迅速适应新的不同的图学习领域,展现敏捷适应力。 大模型能力涌现:随着数据量和模型参数的增长,性能显著提升,释放模型潜能。
图混合专家(GraphMoE):采用一系列专家模型,巧妙解决跨域异质性问题。 轻量级图专家路由机制:快速适应策略,使模型能够迅速响应新的数据集和领域。 自适应且高效的图专家模型:专为处理具有广泛图结构模式和特征空间的模型而定制设计。 广泛训练和测试:在 38 个多样化的图数据集上经过严格验证,展现出卓越的泛化能力和模型扩展性,证明了其涌现能力。
论文链接: https://arxiv.org/pdf/2408.10700 项目地址: https://github.com/HKUDS/AnyGraph 实验室主页: https://sites.google.com/view/chaoh
结构异质性:不同应用领域的图数据在结构上可以存在极大的差别,例如节点的平均度数、紧密子图出现的频率、噪音和缺失边数据的比例等。图结构模式的多样性,对图基础模型的容纳能力提出了严重的挑战。 特征异质性:作为图数据的重要组成部份,节点特征在不同数据集中却存在普遍且极大的差异。例如,有的数据集采用离散的类别特征,有的可能采用连续的数值特征,有的采用文本语意 embedding,有的采用图结构的统计信息。此外,不同数据集的节点特征在向量维度这一基本特点上甚至都具有极大的差异。如何使图基础模型在零样本情况下处理不同图的异质特征,是一个关键挑战。 快速适应以实现广泛应用。有效的图基础模型的关键能力之一是能够高效地适应新的图数据集和领域。理想模型应能够迅速调整其参数和学习策略,以处理之前未见过的图数据集的结构和分布特征,而无需进行大量的重新训练或微调。 图基础模型的扩展定律与变革性能力。在计算机视觉和自然语言处理等领域中,成功的基础模型具有一个关键特性 —— 扩展定律(Scaling Law),即随着模型大小或训练数据集的增加,性能会系统地提升。探索图基础模型是否适用这一定律,也是本文研究的一个重要问题。
左:在模型参数量影响下,对未见过数据集的零样本预测性能变化 中:在模型参数量影响下,对训练过数据集的全样本预测性能变化 右:在训练数据量影响下,对未见过数据集的零样本预测性能变化
AnyGraph 的零样本能力遵循 Scaling Law:虽然模型的全样本预测能力出现了增长的饱和,但其零样本能力随着参数量和数据量的增长不断上升,这说明 AnyGraph 模型的零样本能力遵循 Scaling Law,这一观测结果有两个重要原因,首先是测试的任务需要具备一定的难度,全样本预测只需要模型在训练数据集上具备泛化能力,相对较为简单,因此容易出现性能增长的饱和;而跨数据集、跨领域的零样本预测挑战性高,仍有很大的增长空间。其次,AnyGraph 的 MoE 架构使得它更容易容纳不同数据集的多样化图数据模式,从而具备更大的潜力随着参数量和数据量的增大而提升。 AnyGraph 的涌现能力:在测试曲线中常常可以观测到,模型性能常常在经历了一定的增长停滞后,出现突变式提升。这符合在视觉和文本大模型中观测到的涌现能力特点,说明 AnyGraph 具备了产生变革式泛化能力的基础。 不足的训练数据引入 bias:在数据量增长实验中可以观察到一个典型的特征,在早起的数据量增长中,模型性能经历了一个断崖式的下跌,这是由于训练数据不足,而新引入的训练数据与测试数据集存在较大的偏离,导致模型训练存在较大的 bias。这一问题可以通过扩大训练数据量解决,这样做不仅增强了模型性能,也可以增强训练的鲁棒性。