技术报告:https://sites.google.com/view/eagle-llm 代码(支持商用 Apache 2.0):https://github.com/SafeAILab/EAGLE
比普通自回归解码(13B)快 3 倍; 比 Lookahead 解码(13B)快 2 倍; 比 Medusa 解码(13B)快 1.6 倍; 可以证明在生成文本的分布上与普通解码保持一致; 可以在 RTX 3090 上进行训练(1-2 天内)和测试; 可以与 vLLM、DeepSpeed、Mamba、FlashAttention、量化和硬件优化等其他平行技术结合使用。