连载教程“从零开始理解大语言模型”github.com/KaihuaTang/A

又仁看科技 2025-02-13 19:20:46

连载教程“从零开始理解大语言模型”

github.com/KaihuaTang/All-you-need-to-know-about-LLM

作者汤凯华。该系列的目的是让读者可以在基础的pytorch上,不依赖任何其他现成的外部库,从零开始理解并实现一个大语言模型的所有组成部分,以及训练微调代码,因此读者仅需python,pytorch和最基础深度学习背景知识即可。

目前刚开坑不就,只更新了前两章内容,

“大语言模型结构概览

注意力模块与KV Cache”,可以先🐎。

0 阅读:5
又仁看科技

又仁看科技

感谢大家的关注