DC娱乐网

智能体框架到产品:京东JoyAgent如何打造会自我演进的智能体系统

JoyAgent-JDGenie 是一个京东开发的通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智

JoyAgent-JDGenie 是一个京东开发的通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智能体或者工具挂载到JoyAgent-Genie 即可。它实现了从“框架”到“产品”的根本性跃迁,其核心理念是从“提供工具”转向为“结果负责”,致力于解决构建多智能体产品的“最后一公里”问题,打造一个能直接理解用户意图、自动规划任务并保证输出质量的高度自洽的智能系统。

在技术架构上,JoyAgent采用了一种融合集中式调度与去中心化协同的混合系统。其核心如同一个“交响乐团”,由任务调度引擎作为“大脑”进行集中规划和分解,形成动态任务链,同时各专业子智能体在清晰职责边界内自主决策,并通过跨任务工作流记忆模块提升整体效率。

关键技术突破体现在三大支柱:首先是多层多模式思考机制,结合了工作级与任务级的规划,并针对严肃业务场景创新性地引入SOPPlan模式,确保流程的规范性与可靠性。其次是混合记忆体系,整合了长期记忆、对话历史、任务步骤记忆及程序化技能记忆,并能同时召回服务于当前查询。最具颠覆性的是工具自进化能力,智能体可自动诊断瓶颈,并通过将现有工具拆解为原子工具后智能重组,或直接生成代码来创造新工具,形成一个感知-规划-创造-测试的完整闭环。

在应对GAIA挑战时,正是上述多层规划、跨任务记忆及工具进化机制共同作用,确保了长链条推理的稳定性和工具调用的精准性。京东开源此项目的深层战略,是期望培育一个开源、协同并能自我进化的智能体应用生态,通过与开发者共建“智能体商店”,推动技术在千行百业的深度落地。

在10月24-25日北京DACon数智大会上,京东资深算法专家李杨将会深入介绍JoyAgent-JDGenie的核心突破以及应用案例。在此之前我们采访了他,请他讲讲JoyAgent-JDGenie的研发历程。

1. 当前开源Agent领域以SDK和框架为主,JoyAgent-JDGenie则主打“端到端”和“开箱即用”。在您看来,要实现从“框架”到“产品”的跨越,最大的技术哲学和工程理念转变是什么?

李杨:JoyAgent-JDGenie产品级开源主要是为了解决大家在构建多智能体产品的最后一公里问题。当前相关开源agent主要是SDK或者框架,用户还需基于此做进一步的开发,无法直接做到开箱即用。我们开源的JoyAgent-JDGenie是端到端的多Agent产品,对于输入的query或者任务,可以直接回答或者解决。从“框架/SDK”到“开箱即用的产品”,这绝非简单的封装,而是一次根本性的技术哲学与工程理念的跃迁,其核心转变是从 “提供工具” 转向 “结果负责”。对于JoyAgent-JDGenie而言,这意味着它不能只是一个功能强大的“智能体运行时”,而必须成为一个具备“用户意图理解、任务自动规划、执行过程稳如老狗、输出质量心中有数”能力的、高度自洽的智能系统。这背后的工程挑战,远大于构建一个框架本身。

(JoyAgent-JDGenie产品:https://github.com/jd-opensource/joyagent-genie)

2. JoyAgent作为一个“通用的多智能体框架”,其核心架构是如何设计的?特别是,在协调多个专业子智能体(如报告生成、代码、PPT智能体)协同工作时,采用了哪种协作机制(例如基于LLM的集中式调度、去中心化的市场机制等)来避免混乱并保证任务高效、准确地完成?

李杨:关于JoyAgent多智能体框架的核心架构与协作机制,它并非采用单一机制,而是通过一个融合了集中式任务调度与去中心化智能体协同的混合系统来实现高效运作。其设计目标是让多个专业智能体(如报告生成、代码、PPT智能体)能够有条不紊地协同完成复杂任务。

JoyAgent的架构可以理解为以下几个核心层次,它们共同奠定了多智能体协作的基础:

智能体管理层:负责所有子智能体(Agent)的生命周期管理、能力注册与发现。每个智能体,如市场调研专员、数据分析师、报告撰写专家,都有明确的职责边界和能力描述。任务调度引擎:这是系统的“大脑”,扮演着集中式调度器的角色。它内建了高并发DAG(有向无环图)执行引擎,当接收到一个复杂任务(例如“做一份美元和黄金的走势分析”)时,调度引擎会将其动态拆解成多个有序的子任务。上下文管理与记忆模块:该系统具备跨任务工作流记忆能力。这意味着在处理新任务时,系统可以借鉴和复用历史任务的经验,从而避免重复劳动,效率越来越高。

JoyAgent通过动态任务规划(DAG引擎) 与混合式协同(集中调度+去中心化决策) 的结合,有效避免了多智能体系统的混乱。其工具进化机制(通过拆解重组现有工具自动生成新工具和跨任务记忆能力,进一步提升了整个系统的自适应能力和执行效率。

3. “思考模式”是一个非常关键的概念。JoyAgent的智能体在接到复杂任务后,其内部的推理链条(Chain-of-Thought)是如何构建的?是采用标准的ReAct模式,还是你们做了更具创新性的改进(如Tree of Thoughts, Graph of Thoughts)来提升复杂问题解决的可靠性?

李杨:JoyAgent在planandsolve模式、react模式基础上,进一步优化迭代了multi-level and multi-pattern thinking模式。此外针对比较严肃的业务场景如DataAgent的数据分析,基于用户配置的sop进一步升级plan模式为sopplan模式。

1. multi-level and multi-pattern thinking

multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考

multi-level:work level 和 task level

multi-pattern:plan and executor模式和react模式

2.SOPPlan

基于用户输入的SOP标准流程升级Plan模式为SOPPlan模式以解决严肃场景的问题

4. “Memory”是智能体拥有“持续人格”和上下文理解能力的关键。JoyAgent是如何为智能体设计memory系统的?是采用了向量数据库进行长期记忆,还是有多级memory结构?在如此多智能体协作的框架中,memory是共享的还是独立的,如何避免记忆污染?

李杨:JoyAgent的memory包含了长期记忆如用户信息、领域知识;用户对话历史信息;任务step wise memory;以及之前相似历史任务的memory,形成的程序化技能记忆的混合体系。这些memory同时召回使用服务于用户具体query。

5. “工具自进化”听起来极具颠覆性。能否详细解释一下这个概念?是指智能体能够根据历史任务和用户反馈,自动发现现有工具的不足,并自主编写或组合出新工具(Tool Creation/Tool Composition)吗?这背后依赖哪些关键技术?

李杨:什么是“工具自进化”呢,“工具自进化”指的是智能体在与环境(用户、任务、数据)的交互过程中,能够:

1.诊断瓶颈:自动识别出现有工具集的不足、低效或缺失。

2.创造新工具:通过生成代码或配置,自主编写出全新的工具来解决特定问题。

3.组合优化:将多个现有工具像搭乐高一样,组合成功能更强大的复合工具。

这个过程可以形成一个完整的闭环:感知 -> 规划 -> 创造 -> 测试 -> 部署 -> 再感知。

【背后的关键技术支柱】

实现如此高级的自主性,依赖于多项前沿技术的协同作用:

1. 基础:强大的代码理解和生成能力

这是工具创造的“执行手”。智能体需要具备顶尖的代码大模型能力,能够:根据自然语言描述或功能规约,生成可靠、安全的代码。理解和重构现有代码,以便进行组合和优化。

2. 核心:任务分解与规划与反思

(1)这是工具自进化的“大脑”,能够分解规划复杂任务,智能体必须能将一个高级目标(如“优化网站用户体验”)分解成具体的、可执行的数据分析和动作步骤。

(2)因果推理与瓶颈识别:当任务反复失败或效率低下时,智能体需要能反思失败的根本原因,并准确判断是“现有工具使用不当”还是“缺少某个关键工具”。这依赖于其内部的世界模型和推理链能力。

6. GAIA被设计用于测试模型的事实性、推理和工具使用能力。针对这个极具挑战性的基准,JoyAgent团队在解决方案上最关键的突破点是什么?是工具调用的精准性、长链条推理的稳定性,还是其他方面?

李杨:1.multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考

(1)multi-level:work level 和 task level

(2)multi-pattern:plan and executor模式和react模式

2.cross task workflow memory:跨任务级别的相似任务memory

3.tool evolution via auto-disassembly-and-reassembly of atom-tools

(1)基于已有工具迭代产生新工具,而不是从0-1直接生成新工具(减少错误工具的生成)

(2)基于已有工具隐性拆解为原子工具,并基于原子工具结合大模型自动组合成新工具(不需要花费人力预先定义和拆解原子工具)

7. JoyAgent已经开源了包括前端、后端、引擎在内的完整项目。京东开源这样一款重磅产品的长远战略思考是什么?您希望开发者社区围绕JoyAgent构建一个怎样的生态?未来,您最期待看到社区在哪些方向上对JoyAgent进行贡献和创新?

李杨:

【京东开源的深层思考】

京东开源JoyAgent这一重磅产品,背后是经过现实业务锤炼的深远战略考量。

1. 培育产业AI生态,反哺主营业务:京东的核心商业模式决定了其技术产品首先服务于自身庞大的零售、物流、金融、健康等业务体系。将这些在万亿级业务场景中锤炼成熟的技术开源,能吸引更多开发者和企业使用,共同做大行业蛋糕。当JoyAgent成为更多企业的选择时,会反过来强化京东的技术影响力,并为其主营业务吸引更多生态伙伴,形成良性循环。

2. 应对企业AI落地痛点:当前企业引入AI面临系统对接难、数据利用难、定制开发难等核心痛点。JoyAgent开源的重点,如DataAgent数据智能体和DCP数据治理模块,正是直击这些痛点。通过开源,京东希望提供一个经过验证的“精装解决方案”,让企业,尤其是中小团队,能低成本、高效率地将AI应用于核心业务。

3. 引领标准,抢占生态位:通过开源完整的端到端产品(而非仅是框架或SDK),京东展示了其技术实力,也定义了企业级智能体的一种高完成度范式。这有助于京东在起步阶段就抢占生态位,吸引开发者融入其技术体系,从而有可能成为未来AI应用开发的重要标准之一。

【期望构建的开发者生态】

京东希望围绕JoyAgent构建一个开源、协同且能自我进化的智能体应用生态。

1. 繁荣的“智能体市场”:京东希望与伙伴合力打造 “Agent Store(智能体商店)” ,为行业提供原子化的智能体服务。这类似于一个“智能体应用市场”,开发者可以贡献垂直领域的专业智能体,企业则可以像在应用商店挑选App一样,找到适合自己业务场景的智能体。

2. 从“单兵作战”到“团队协作”:未来的愿景是,不同开发者、不同企业开发的智能体能够在JoyAgent的生态中互联互通,像一支支专业的“数字团队”一样,协同完成复杂的产业任务。

3. 开放与协同:JoyAgent全面支持MCP(模型上下文协议)、A2A(智能体间交互协议)等主流协议。这意味着开发者可以将自己开发的智能体无缝接入JoyAgent平台,参与统一调度与协同工作。

【期待社区的贡献与创新方向】

对于JoyAgent社区的未來,京东和整个生态尤其期待在以下几个方向看到贡献与创新:

1.垂直行业的深度适配:

(1)期待社区能基于JoyAgent的开放能力,开发出更多针对金融、医疗、教育、工业制造等特定行业的专业智能体。

(2)利用JoyAgent深度融合工作流和深度理解企业数据的特性,解决行业内的具体痛点,例如在生产调度、新药研发等场景中创造价值。

2.工具与组件的丰富:

(1)鼓励开发者创造新的、开箱即用的原子工具和智能体组件。

(2)这些贡献可以极大地丰富JoyAgent的“工具箱”,让整个生态的能力更多元、更强大。

3.协议、标准与性能的优化:

(1)欢迎社区一同完善和演进DGP数据治理协议等开放标准。

(2)也期待开发者在部署体验、资源消耗和推理性能上进行深度优化,让JoyAgent能在各种资源环境下都运行得更高效、更稳定。

总而言之,京东通过开源JoyAgent,是希望从技术的“提供者”转变为产业智能“生态”的共建者和赋能者。这不仅是在输出一个产品,更是在输出一套经过大规模业务验证的方法论和一套开放的技术体系,最终与开发者一起,让AI技术能更顺畅地在千行百业中创造真实的价值。

8. 最后,展望未来,您认为像JoyAgent这样的端到端多智能体产品,其大规模落地应用的最大瓶颈会是什么?它又将如何重塑人机交互的范式和我们使用软件的方式?

李杨:在我看来,其大规模落地应用的最大瓶颈,短期内是技术成熟度与可靠性,而长期来看,则是用户接受度与信任的建立。 成本控制虽然重要,但随着技术迭代和规模效应,会逐渐被解决。

1. 短期瓶颈:技术成熟度与可靠性

(1)复杂任务的“幻觉”与不确定性:当前的AI,即便是最先进的模型,在处理需要多步骤推理、长期记忆和动态规划的复杂任务时,仍然会“胡言乱语”或犯错。在单机场景下,一个错误可能只是带来不便;但在一个掌管你所有数字账户(银行、社交、工作)的智能体系统中,一个错误就可能是灾难性的(例如,误发邮件、错误支付)。

(2)多智能体协作的“协调成本”:JoyAgent的核心是“多智能体”。如何让多个智能体高效、无歧义地协作,避免任务重叠、资源冲突或信息孤岛,是一个巨大的技术挑战。这就像管理一个高度专业但沟通不畅的团队。

2. 长期与根本性瓶颈:用户接受度与信任

(1)“控制权”的让渡与“黑箱”焦虑:将如此多的个人数据和操作权限交给一个“黑箱”系统,用户会产生巨大的心理门槛。“它到底做了什么?”“为什么这么做?”“我还能随时收回控制权吗?”这种对失控的恐惧是最大的障碍。

(2)隐私与数据安全:JoyAgent作为端到端的智能体,需要访问和整合用户最核心、最敏感的数据。这使其成为黑客攻击的“终极目标”。一旦发生数据泄露,后果不堪设想。用户需要绝对的信心,相信其数据是安全的。

责任归属问题:当智能体犯错并造成损失时,谁来负责?是用户、开发者,还是智能体本身?模糊的责任界定会严重阻碍其商业化落地。

这场变革的核心是从“以应用程序为中心”转向“以用户任务为中心”的智能服务。

1. 从“操作工具”到“下达指令”:交互范式从我们一步步操作图形界面(点击、拖拽、输入),转变为用自然语言向一个“目标导向”的智能体下达高级指令。我们不再关心“如何做”,只需明确“要什么”,从“司机”变为“指挥官”。

2. 从“应用孤岛”到“服务融合”:软件本身会“后台化”,其核心功能被智能体按需调用和解构。我们不再需要频繁切换不同的App,而是由一个统一的智能体接口,无缝整合所有服务来完成复杂任务。操作系统将从资源管理平台,进化为任务协调中心。

3. 从“被动响应”到“主动预见”:智能体基于对用户习惯和上下文的理解,将从被动响应请求,升级为主动提出建议、预警风险、提前规划,成为一个真正的、高度个性化的数字伙伴。

活动推荐

2025年10月24-25日,北京DACon数智技术大会将在北京丽亭华苑举办,DACon大会汇聚了顶尖互联网公司的 Agentic AI 建设先锋,内容直击企业AI落地的核心挑战与解决方案。无论您是关注AI平台建设、工程效能提升、模型应用落地,还是寻求降低开发门槛、释放创新潜力的技术决策者或开发者,都将在这里获得极具价值的启发与实践参考。

除了两天的技术干货分享,会议现场还会组织闪电演讲,闭门会,晚场圆桌交流,讲师们会围绕具体的技术点进行介绍,旨在丰富大家在参会体验,希望大家不虚此行,满载而归。

9折购票火热进行中,现在报名可享受优惠价格,咨询购票详情可联系票务经理:13311343487,也可点击「阅读原文」进行报名。