奔跑的跳跳的文章

新手教程|如何使用 WandB 监控大模型的训练

2026-02-11 09:51

新手教程|如何使用 WandB 监控大模型的训练

Qwen3-VL 相比 Qwen2.5-VL 改进了哪些？

2026-02-11 09:51

Qwen3-VL 相比 Qwen2.5-VL 改进了哪些？

大模型面试中，跟面试官的观点不一致怎么办

2026-02-16 02:01

大模型面试中，跟面试官的观点不一致怎么办

多模态大模型的位置编码：MRoPE

2026-02-15 00:14

多模态大模型的位置编码：MRoPE

RAG正在被Agent改写

2026-02-14 00:39

RAG正在被Agent改写

多模态入门之Vision Transformer

2026-02-12 05:16

多模态入门之Vision Transformer

师妹拿到了阿里淘天的大模型录用意向书

2026-02-16 01:19

师妹拿到了阿里淘天的大模型录用意向书

从 GLM-4.6 看国产大模型的coding能力进化

2026-02-13 00:10

从 GLM-4.6 看国产大模型的coding能力进化

校招入职后发现工作内容和预期的不一样

2026-02-17 01:53

校招入职后发现工作内容和预期的不一样

DeepSeek V3.2提出的DSA相比MLA有哪些改进

2026-02-15 00:58

DeepSeek V3.2提出的DSA相比MLA有哪些改进

你觉得大模型未来的发展方向会是怎样的？

2026-02-15 00:50

你觉得大模型未来的发展方向会是怎样的？

当我们把方向盘交给Agent

2025-10-12 02:49

当我们把方向盘交给Agent

一次强化学习算法重构实践

2025-10-08 22:30

一次强化学习算法重构实践

思维链长返回慢、思维链短结果不准，怎么办

2026-02-12 05:17

思维链长返回慢、思维链短结果不准，怎么办

古法写简历还是AI写简历？

2026-02-16 00:06

古法写简历还是AI写简历？

来试试GLM-4.5加持下的Claude Code

2026-02-12 05:13

来试试GLM-4.5加持下的Claude Code

我是算法工程师，请攻击我最薄弱的地方

2026-02-13 00:10

我是算法工程师，请攻击我最薄弱的地方

没有加过n个华为hr好友的秋招是不完整的

2026-02-12 05:17

没有加过n个华为hr好友的秋招是不完整的

当GLM-4.5长了双眼睛，可以用来做什么？

2026-02-12 05:15

当GLM-4.5长了双眼睛，可以用来做什么？

更适合程序员宝宝的读repo神器：Zread

2026-02-13 00:10

更适合程序员宝宝的读repo神器：Zread

DC娱乐网