让语言模型「轻装上阵」。
第一种策略是使用初等运算代替 MatMul,例如,在卷积神经网络 (CNN) 中,用有符号加法代替乘法; 第二种方法是使用二值或三值化量化,将 MatMul 值在累加之前要么翻转要么清零。比如脉冲神经网络 (SNN) 使用二值激活,而二值化网络 BNN 使用量化权重。
论文地址:https://arxiv.org/pdf/2406.02528 项目地址:https://github.com/ridgerchu/matmulfreellm 论文标题:Scalable MatMul-free Language Modeling