DC娱乐网

奔跑的跳跳的文章

新手教程|如何使用 WandB 监控大模型的训练

新手教程|如何使用 WandB 监控大模型的训练

新手教程|如何使用 WandB 监控大模型的训练
Qwen3-VL 相比 Qwen2.5-VL 改进了哪些?

Qwen3-VL 相比 Qwen2.5-VL 改进了哪些?

Qwen3-VL 相比 Qwen2.5-VL 改进了哪些?
大模型面试中,跟面试官的观点不一致怎么办

大模型面试中,跟面试官的观点不一致怎么办

大模型面试中,跟面试官的观点不一致怎么办
多模态大模型的位置编码:MRoPE

多模态大模型的位置编码:MRoPE

多模态大模型的位置编码:MRoPE
RAG正在被Agent改写

RAG正在被Agent改写

RAG正在被Agent改写
多模态入门之Vision Transformer

多模态入门之Vision Transformer

多模态入门之Vision Transformer
师妹拿到了阿里淘天的大模型录用意向书

师妹拿到了阿里淘天的大模型录用意向书

师妹拿到了阿里淘天的大模型录用意向书
从 GLM-4.6 看国产大模型的coding能力进化

从 GLM-4.6 看国产大模型的coding能力进化

从 GLM-4.6 看国产大模型的coding能力进化
校招入职后发现工作内容和预期的不一样

校招入职后发现工作内容和预期的不一样

校招入职后发现工作内容和预期的不一样
DeepSeek V3.2提出的DSA相比MLA有哪些改进

DeepSeek V3.2提出的DSA相比MLA有哪些改进

DeepSeek V3.2提出的DSA相比MLA有哪些改进
你觉得大模型未来的发展方向会是怎样的?

你觉得大模型未来的发展方向会是怎样的?

你觉得大模型未来的发展方向会是怎样的?
当我们把方向盘交给Agent

当我们把方向盘交给Agent

当我们把方向盘交给Agent
一次强化学习算法重构实践

一次强化学习算法重构实践

一次强化学习算法重构实践
思维链长返回慢、思维链短结果不准,怎么办

思维链长返回慢、思维链短结果不准,怎么办

思维链长返回慢、思维链短结果不准,怎么办
古法写简历还是AI写简历?

古法写简历还是AI写简历?

古法写简历还是AI写简历?
来试试GLM-4.5加持下的Claude Code

来试试GLM-4.5加持下的Claude Code

来试试GLM-4.5加持下的Claude Code
我是算法工程师,请攻击我最薄弱的地方

我是算法工程师,请攻击我最薄弱的地方

我是算法工程师,请攻击我最薄弱的地方
没有加过n个华为hr好友的秋招是不完整的

没有加过n个华为hr好友的秋招是不完整的

没有加过n个华为hr好友的秋招是不完整的
当GLM-4.5长了双眼睛,可以用来做什么?

当GLM-4.5长了双眼睛,可以用来做什么?

当GLM-4.5长了双眼睛,可以用来做什么?
更适合程序员宝宝的读repo神器:Zread

更适合程序员宝宝的读repo神器:Zread

更适合程序员宝宝的读repo神器:Zread