DC娱乐网

deephub的文章

深入理解三种PEFT方法:LoRA的低秩更新、QLoRA的4位量化与DoRA的幅度-方向分解

深入理解三种PEFT方法:LoRA的低秩更新、QLoRA的4位量化与DoRA的幅度-方向分解

深入理解三种PEFT方法:LoRA的低秩更新、QLoRA的4位量化与DoRA的幅度-方向分解
并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤

并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤

并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤
RAG 中分块重叠的 8 项隐性开销与权衡策略

RAG 中分块重叠的 8 项隐性开销与权衡策略

RAG 中分块重叠的 8 项隐性开销与权衡策略
深入RAG架构:分块策略、混合检索与重排序的工程实现

深入RAG架构:分块策略、混合检索与重排序的工程实现

深入RAG架构:分块策略、混合检索与重排序的工程实现
AI Agent技术栈:10个构建生产级Agent的核心概念

AI Agent技术栈:10个构建生产级Agent的核心概念

AI Agent技术栈:10个构建生产级Agent的核心概念
长上下文"记忆"的舒适陷阱:为什么更多记忆不等于更可靠

长上下文"记忆"的舒适陷阱:为什么更多记忆不等于更可靠

长上下文"记忆"的舒适陷阱:为什么更多记忆不等于更可靠
超越上下文窗口:CodeAct与RLM,两种代码驱动的LLM扩展方案

超越上下文窗口:CodeAct与RLM,两种代码驱动的LLM扩展方案

超越上下文窗口:CodeAct与RLM,两种代码驱动的LLM扩展方案
15 分钟用 FastMCP 搭建你的第一个 MCP Server(附完整代码)

15 分钟用 FastMCP 搭建你的第一个 MCP Server(附完整代码)

15 分钟用 FastMCP 搭建你的第一个 MCP Server(附完整代码)
Prompt 缓存的四种策略:从精确匹配到语义检索

Prompt 缓存的四种策略:从精确匹配到语义检索

Prompt 缓存的四种策略:从精确匹配到语义检索
RAG 文本分块:七种主流策略的原理与适用场景

RAG 文本分块:七种主流策略的原理与适用场景

RAG 文本分块:七种主流策略的原理与适用场景
LLM创造力可以被度量吗?一个基于提示词变更的探索性实验

LLM创造力可以被度量吗?一个基于提示词变更的探索性实验

LLM创造力可以被度量吗?一个基于提示词变更的探索性实验
Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/Aut

Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/Aut...

Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/AutoGen 都能用
软件工程原则在多智能体系统中的应用:分层与解耦

软件工程原则在多智能体系统中的应用:分层与解耦

软件工程原则在多智能体系统中的应用:分层与解耦
一分钟训练搞懂 DPPO:把扩散过程建模为 MDP 的强化学习方法

一分钟训练搞懂 DPPO:把扩散过程建模为 MDP 的强化学习方法

一分钟训练搞懂 DPPO:把扩散过程建模为 MDP 的强化学习方法
从零开始用自定义 Triton 内核编写 FlashAttention-2

从零开始用自定义 Triton 内核编写 FlashAttention-2

从零开始用自定义 Triton 内核编写 FlashAttention-2