encoder.py:包含 OpenAI BPE Tokenizer 的代码,直接取自 gpt-2 repo; utils.py:包含下载和加载 GPT-2 模型权重、tokenizer 和超参数的代码; gpt2.py:包含 GPT 模型和生成代码,可以将其作为 python 脚本运行; gpt2_pico.py:与 gpt2.py 相同,但是代码行数更少。
gpt2 函数是本次实现 GPT 的实际代码; generate 函数实现自回归解码算法; main 函数; fire.Fire (main) 将文件转换为 CLI 应用程序,以便最终可以运行代码:python gpt2.py "some prompt here"。
文本 + 位置嵌入; Transformer 解码器堆栈; 投影到词汇表。