“gpt-from-scratch”项目,在单个JupyterNotebook

又仁看科技 2025-02-21 13:20:33

“gpt-from-scratch”项目,在单个Jupyter Notebook中,实现从零开始训练一个小型GPT风格的解码器语言模型。

github.com/kevinpdev/gpt-from-scratch

一个5.3 MB大小的Jupyter Notebook。涵盖了从文本分词、位置编码、自注意力机制到模型训练和推理的完整过程。同时每一步还有详细的讲解。读者可以通过该项目深入理解GPT模型的内部机制、训练流程等。

0 阅读:0
又仁看科技

又仁看科技

感谢大家的关注