一篇介绍DeepseekR1模型的工作原理的博文trite-song-d6

又仁看科技 2025-01-26 09:16:08

一篇介绍 Deepseek R1 模型的工作原理的博文

trite-song-d6a.notion.site/Deepseek-R1-for-Everyone-1860af77bef3806c9db5e5c2a256577d

作者尝试让所有人都能看懂(但还是有不少数学公式的)。主要围绕链式思考推理、强化学习、GRPO（Group Relative Policy Optimization）和模型蒸馏四个核心部分展开。

0 阅读：1

又仁看科技

感谢大家的关注

作者最新文章

1

发几本经典的项目供大家打发时间。之前其实都发过，这里做个汇总，从基础到往AI方向

2

开源硬件 OpenHaystack，创建自己的 AirTag 并接入苹果的 F

3

Linux内核教程linux-kernel-labs.github.io内容涵盖

4

[笑cry]deepseek在推上是被越传越离谱了..

5

第一次见deepseek这个提示。看来用户增长的速度还是超出他们预期了……

6

Qwen也赶在年前发新技术了！这次发布的是Qwen2.5-1M，具体包括 Qwe

7

经典技术系列博文 [为什么这么设计]draveness.me/whys-the-

8

实现一个DeepSeek，但是是在Excel里[淡淡的]Tom Yeh教授准备开

9

除了DeepSeek ，Kimi的推理模型k1.5也已经上线几天了。性能似乎略逊

10

smolgrad 是一个轻量级自动微分框架，为希望深入理解深度学习底层原理的开发

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

有没有注意到海尔老板的领带上都是空调、洗衣机，双开门冰箱，细节满满。

2

买iPhone16的是不是肠子都悔青了？

3

雷军到底投了多少家企业，看看这个版图，不比马斯克小了。

4

美团王兴的刀，终于砍向了京东的命门！当刘强东用“零佣金”撬走美团商家、用“五险一

5

选华为还是荣耀从参数对比来看华为的优势在于拍照，USB速度，全系北斗卫星

6

选荣耀手机，看这四款就够了❗️这四款荣耀手机绝对有代表性，从旗舰到中端，再到

7

雷军传奇的一生，寝室6人，一人不落：1、林斌现任小米集团副董事长、执行董事，

8

其实iPhone15Pro的电池也还行吧，我这个循环计数都840了电池健康还有

9

哪个记者这么牛，抓拍到雷军的这张照片。雷军是比较辛苦的，产业比较大，管着造车、造

10

之前小米出了三桶的洗衣机，现在海尔也开始“听劝”了，可惜洗衣机买早了，不然这种还

科技最新文章

1

我有种预感，科技企业接下来要大变天了！重点不是雷军的小米，也不是王兴兴的机器

2

【#原生鸿蒙正式版手机将于下周推出#】3月12日，余承东视频官宣，首款搭载原生鸿

3

3月份低价高配6款手机，换机必看整体来看个人更倾向第一款有独一份的4320H

4

宇树科技王兴兴自述：我不是学霸，高中三年英语才及格三次，10岁用废旧纸板做风力小

5

一觉醒来，又被宇树机器人“王兴兴”刷屏了！这次不是因为机器人，也不是因为机器

6

之前小米出了三桶的洗衣机，现在海尔也开始“听劝”了，可惜洗衣机买早了，不然这种还

7

麒麟9000和麒麟990可以升级HarmonyOSNEXT5.0系统？De

8

苹果AI支持中文了[汗]别整这些虚的哈，你就支持简体中文，什么时候大陆能用上A

9

苹果操作系统外观或颠覆有消息称，苹果操作系统或将迎来全面革新，苹果公司正在筹备有

10

千万别选错了！要想手机信号好，下面四款产品少不了。手机好不好用，除了基本的性能