连载教程“从零开始理解大语言模型”github.com/KaihuaTang/A

蚁工厂 2025-02-13 19:20:46

连载教程“从零开始理解大语言模型”

github.com/KaihuaTang/All-you-need-to-know-about-LLM

作者汤凯华。该系列的目的是让读者可以在基础的pytorch上,不依赖任何其他现成的外部库,从零开始理解并实现一个大语言模型的所有组成部分,以及训练微调代码,因此读者仅需python,pytorch和最基础深度学习背景知识即可。

目前刚开坑不就,只更新了前两章内容,

“大语言模型结构概览

注意力模块与KV Cache”,可以先🐎。

0 阅读:5
蚁工厂

蚁工厂

感谢大家的关注