DC娱乐网

几乎都在挂羊头卖狗肉,AI Agent的泡沫现在到底有多大?(下)

除了工程和模型层面的技术问题,在行业层面,还存在几大问题,包括资本叙事泡沫、基模公司挤压、国内 ToB SaaS 的痼疾

除了工程和模型层面的技术问题,在行业层面,还存在几大问题,包括资本叙事泡沫、基模公司挤压、国内 ToB SaaS 的痼疾等。

张森森表示,“ 目前 Agent 赛道处于资本和叙事先行的阶段,VC 过于乐观。但 Agent 实际可用性仍然较差,没有看到正向 ROI 的落地,总体拥有成本( TCO )明显大于收益。”

“ 投资热和用户体验背离的原因在于,投资端和市场更追求故事性,喜欢 ‘ 通往 AGI 的必经之路 ’、‘ 下一代操作系统 ’ 这样的愿景或字眼。”

“ 特别是早期投资人,更关注潜在市场规模和抢占入口的速度,而不是急于影响盈利,所以他们愿意把钱投在某类 Agent 上。”

“ 但资本存在一种盲目的信任。”

“ 很多投资人是从 APP 市场走过来的,相信有一天会出现一个 Agent 平台,形成类似微信、iOS 级别的生态垄断。因此他们不愿意错过机会,而且存在 ‘ 你不投我就投 ’ 的竞争心理。”

“ 尤其是在当前市场环境下,资本方其实没有其它方向可以投。Agent 类项目就成了几乎唯一可以投资、还能击鼓传花的故事。”

“ 所以,有些产品即使不行也会被拿出来讲故事。因此融资估值并不与实际产出效率挂钩,而是与产品覆盖面、DAU、MAU 等指标挂钩。思路是先铺量,后续再做深。在公司内部,大家讨论的也是未来的提升,向老板讲的也是未来的故事,所以只要能带来可见的效率提升,大家都愿意试用。”

“ 在国内还有一个特点是,普通大众和客户对早期产品的 bug 和漏洞容忍度相对较高。”

“ 所以,投资端看到的是未来潜力,和当前体验之间存在时间差,这是客观存在的。但如果用户端的体验长期上不去,投资端很快会降温。这是一个动态博弈的过程。”

基模公司挤压则是 Agent 赛道乃至整个 AI 赛道过去、现在和未来都将一直面临的不确定性压力。

张森森表示,“ 大模型发展速度极快、日新月异,作为 Agent 供给侧给应用层带来的冲击很大。很多厂商,特别是千问、豆包等,每次迭代都会能力下沉,抹平通用层的一些差异,压缩了最初创造通用应用的生存空间。”“ GPT-5 也有类似趋势,比如他们希望做教育改革,用 AI 帮助用户学韩语等,而这原本是多邻国、Speaker 等平台的垂直市场。”

王文广表示,“ 通用 Agent 的通用能力其实来自于大模型本身,绝大多数非基础模型公司做出来的 ToC 产品,其实都不具备壁垒,这导致 ToC 的产品最终有很大概率是被基础模型公司收割的,OpenAI 最新的 AgentKit 就是一个现实的正在发生的例子。”

业内普遍认为,类似 Manus 这类公司,实际上处在模型层和垂直应用层之间非常薄弱的工具层,但模型厂商和垂直厂商都容易对工具层形成挤压,所以它的竞争优势会非常脆弱。

王显表示,“ 不仅如此,虽然我是 Cursor 的长期付费会员,但也感觉到它的脆弱点很明显。”

“ Cursor 的优点在于交互体验确实比较好,比如内联对话、上下文定位等,早期的 Cursor 可以借此获得用户和粘性。”

“ 但 Cursor 没有生态绑定。而大厂比如微软有自己的生态,可以通过 Visual Studio 等工具形成绑定,再加上品牌信任度,大厂的关注度只会越来越高。或者一旦 Cloud Code、CodeX 等在大厂工具的交互层做一些优化,Cursor 的针对性就会被稀释。”

“ 所以,如果 Cursor 想维持优势,就不能只停留在交互和优化层面,而是必须和上下游开发流程深度绑定,走向更完整的产品闭环。例如:针对特定编程语言、框架和行业开发场景,提供深度优化和高精度上下文处理;绑定开发流程的全链路,从规划、生产到测试、部署都做集成;做成快速迭代、全流程协同的工具。”

王文广补充道,“ 大模型本身就带来了人机交互的变革,所以当前过多探索所谓的人机交互带来的价值不大,更重要的还是用大模型来解决实际的问题。”

资本叙事泡沫、基模公司挤压是全行业面临的普遍问题,但国内实际上还面临更多的限制。

要理解这一点,就要深入探讨前面提到的国内外 Agent 泡沫差异,在大模型和 Agent 时代,这个泡沫衍生出许多新的表象,但背后藏着不少老问题。

郭炜表示,“ 在国内做垂直 Agent 与在国外相比,困难并不主要来自 Agent 技术本身,而是行业环境的老问题。这与做 SaaS 或软件是同样的逻辑。”

“ 国内本身缺乏大型软件公司,SaaS 发展也并不成熟,这使得软件的整体价值感尚未充分体现。由于人力成本相对较低,软件在提高效率方面的价值不够凸显,继而 Agent 的价值也就难以被充分认可。”

付瑞吉表示,“ 国内各行业 SaaS 普及率低、软件生态割裂,导致不同企业情况各不相同,使得 Agent 的开发也不得不做大量定制,开发成本高。”

郭炜补充道,“ 毕竟 Agent 并不是凭空出现的一种全新事物,而是原有软件形态的延续,无论是 APP、SaaS,还是其他类型的软件。

张森森表示,“ 国外 SaaS 的理念和逻辑与中国不太一样,更强调结果( result )和集成( integration ),注重整体集成度。特别是在北美、欧洲等地区的企业,更倾向于使用成熟的 SaaS 产品,很少自行研发,因此他们的接口基本都是通用的。”“ 在这种情况下,国外在做 Agent 案例时更多考虑如何使用成熟的 API 协议,比如将 MCP、A2A 协议与现有的 ERP、CRM 进行集成,这对于他们而言成本相对较低。”

“ 国内软件生态更多是企业自研,而且企业与企业之间的协议差异很大,甚至同一企业内部的协议都可能不统一,数据打通难度极高。在这种复杂环境下,很难做出标准化、可复制的企业 Agent。即使在 A 企业验证成功,迁移到 B 企业时也很难快速部署。所以可复制性和大规模扩展性在国内 ToB Agent 的发展中被严重抑制,这是目前的关键制约因素。”

“ 这种情况下,企业很多时候不得不重复造轮子。”

“ 目前来看,只有方法论层面的东西是可复制的,比如流程设计思路、Agent 架构方法论等。但真正落地到企业使用层面,差距依然很大。”

既然各家企业都需要大量做自研,自然大概率会走向全栈型或通用型方向,很难推出在垂直场景中做出有突出竞争优势的产品。“ 所以,相比之下,国内更强调速度和覆盖率,因为市场很内卷,企业更倾向于快速占领用户心智,并尽可能覆盖更多场景。”

“ 或许未来随着类似 MCP 等协议的发展,情况会逐步改善,但至少在短时间内,我个人的判断是消极的。”

扩展到 ToB、ToC 和出海市场,则呈现普遍沉重的生存压力。B 端 SaaS 基础不足,限制了 Agent 的发展,创业公司无法接入生态,只能转战 C 端,C 端虽具传播性和资本叙事优势,却竞争激烈、留存差,因而最终企业纷纷选择出海,通过海外市场借力算力、合规与融资以谋求突围。

张森森表示,“ 国内 B 端用户情绪冷静,原因在于 B 端和 C 端用户诉求完全不同。企业采购强调 ROI 要明确,流程必须可控,功能要能管控。而通用 Agent 的案例往往任务定义模糊、场景识别度低、价值难以量化,所以很难支撑持续付费。”

“ 现在 B 端的通用型 Agent 多半是销售包装出来的。你会看到很多号称‘企业端 UI’、‘企业教育智能体’等,但真正拿到企业流程里用时,问题就暴露出来:性能稳定性不足、合规性不过关、可追溯性差。”

“ 真正能活下来的,一定是垂直+深度集成 的方案。既要利用 Agent 的灵活性,又要在某个行业里做到合规,同时结合企业的需求与机制,这样才能真正落地。”

王显表示,“ 但相比国外,国内做垂直Agent是很困难的。垂直Agent要深耕某个领域做大做强,在国内很难搞,因为要穿越各种壁垒去获取数据,但国内金融、医疗、政务等行业的数据壁垒很高,合规审核很严格和复杂,即便企业愿意开放数据也要经过多次审批和脱敏。”

付瑞吉表示,“ 在国内获取高质量的垂直数据面临诸多障碍,比如高质量医疗数据分散于医院而无法共享。” 这一点知危较有体会,在与多位行业内医疗 AI 专家沟通时,经常提到的最大痛点就是数据隔离。

王显继续说道,“ 所以,国内大模型的训练速度就比国外要慢。”

“ 相比之下,国外很快就开始构建垂直 Agent。垂直领域的初创公司就可以直接使用 OpenAI 这种公共 API,但国内只能私有部署大模型,速度就进一步慢下来。”

“ 甚至可以说,国内模型厂商现在都主推的开源和轻量化大模型的策略,其实刚好是适应了国内的特有情况。”

“ 更令人担忧的是,大模型发展后期,国内大模型的发展会面临更加严峻的挑战,因为整体数据集质量太差了。”

“ 其次,客户差异、需求差异和定制化成本也比较高。”

“ 国内的同一垂直行业的不同企业,具有上述的 ToB SaaS 行业的所有缺陷,没有统一的标准化接口。比如国内的 CRM 系统到底有多少个?随便在网上搜一下,就是成千上万,甚至到了每家公司里面还要再定制,做私有化、二次开发。”

“ 而国外的 Agent 或垂直模型只要适配统一的标准化 SaaS,即可覆盖大多数企业的业务场景。在这样的环境下,Agent 的复制性和扩展性要比国内高得多。”

“ 第三是大厂作风,国内的行业生态也是封锁的,大厂都倾向于自建。头部企业也是自己做垂直 Agent,不会跟其他公司一起做,使得创业公司很难切入核心的场景,无法接入行业生态。”

“ 相比之下,国外其实有很多开放生态与第三方市场的土壤,所以小公司与中小公司是有机会去做某个垂直细分领域来生存的。”“ 最后在商业化周期上,也存在明显差异。垂直 Agent 的特点是落地初期需要长周期的行业积累和客户教育,本质上是 ‘ 慢工出细活 ’。国内投资环境,整体上缺乏耐心,更追求短期回报。这对垂直 Agent 不太友好,因为它们很难在短时间内看到显著的商业回报。”

“ 最终,因为 ToB 的场景成本和投入太高,实现的可能性太低,可复制性太低,导致整个中国市场更倾向于做 ToC,而且 ToC 是最容易跟资本讲故事的。”

“ 但我看了一堆 ToC 产品,可以说没有一个产品是真正能让人持续付费订阅的。”

而为什么国内有很多企业在做 ToC 端的出海,甚至 Manus 把公司总部也搬迁到新加坡,也就不难理解了。

王显表示,“ 为什么那么多企业选择在海外做,有多个原因。”“ 第一,国内市场竞争压力大。以 Manus 这类产品为例,国内通用型 Agent 产品很容易被竞争厂商或大厂快速复制。核心功能可能在一夜之间被模仿,导致差异化难以维持。”“ 第二,用户群体的流失和留存。国内用户更容易切换到更好的同类产品,这是国内市场的一个特点,即产品的替代成本较低。通用型 C 端 Agent 往往具有 ‘ 一次性体验 ’ 的特征,缺乏复用价值。早期如果用户主要来自国内,一旦竞争加剧、出现价格战,产品在国内的战略市场会很快消失。”

“ 第三,Manus 等公司会考虑数据隐私监管、算力供应等方面的问题。海外算力供应条件更好,国内算力会有 ‘ 卡脖子 ’ 问题。而且,要对标国际市场的话,新加坡无论是金融还是国际业务、跨境支付、多语言市场,都是一个比较好的纽带,往下走可以下沉到东南亚市场,往上走可以进入欧美市场,新加坡的国际型人才资源也是比较好的。”

“ 第四,方便做融资,迁到新加坡可以降低很多海外用户的数据安全需求。GDPR 、CCPA 等法规在新加坡对 Manus 的影响程度,肯定比在国内要好一点。虽然新加坡在东南亚市场也有相应的数据安全法规 PDPA,但也会比国内要松一点。”

“ 第五,基础模型的差距还是存在的。搬迁到新加坡后,可以跟 Amazon、OpenAI、Anthropic 等公司合作,更方便地使用他们的 API 服务。这些服务在国内目前还是远超于 DeepSeek、千问等模型 API,能形成产品能力的补强。”

虽然此举可谓 “ 机智 ”,但王文广并不认为这样做有足够意义,并指出了更为残酷的未来,“ ToC 的 Agent,我认为,除了在中国和美国,其他地区毫无意义。”

“ 并且,在美国市场,通用 Agent 的生态位已经被基础模型厂商自己提前占据了。在中国,也很快会收敛到这个状态。因为,ToC 的通用 Agent 的竞争力和护城河是大模型本身。”

“ 在我看来,实际上国内外做 Agent 都很难。国内做 Agent 更难的本质在于,硅谷现在钱多,而国内则是钱荒。”

在技术、行业限制下,往后 Agent 赛道虽然泡沫依旧,甚至还会继续膨胀。但长期来看,也将树立起更加严苛的规则,只有顺着规则走,才能继续生存下来。

这些规则包括:在自身的行业认知内构建 Agent,采用垂直大模型,权衡 workflow 和 Agent,聚焦核心场景,最终为商业化成功铺路。

郭炜表示,“ 在行业中做 Agent,难点不在于 Agent 的实现方式,因为从技术角度看,如何做 Agent 大家基本都能掌握。”

“ 无论是 To C 还是 To B,真正的 Agent 应该是在行业中具备深厚 knowhow 的也就是在该行业有丰富积累的创业者或公司来做,而不是简单加一层薄壳。”

“ 比如在 To B 端的通用 Agent 场景中,例如企业内部办公系统,已有在特定赛道深耕多年的企业具备天然优势。以飞书为例,它原本就有 Wiki,并且已经按照体系整理并长期积累了内容。这样在底层上下文已经准备好的情况下,上层无论是通过工作流还是 Agent 来进行调用和处理,都能够更高效地完成任务。”

“这和 APP 的发展类似,之前能存活下来的 APP ,都是在新兴领域和新的交互方式下,出现一些创新,颠覆了原有的 APP 和生态模式,但它的量级至少要与某个成熟 APP 相当,解决问题的场景复杂度和提供的便利程度也要相当。只有达到这种程度,才能称为真正的 Agent,目前还没有看到这样的 Agent 出现。”

“ 如果是纯粹的大模型厂商,为企业提供知识库服务,就会面临反向的挑战,需要投入大量精力将知识库按体系分类、打好标签。而像飞书这样的企业,早已完成了这些基础工作,无需重复建设。”

“ 我们做 Data Agent 也是类似的情况。我们的数据系统本身支持 300 多种数据库,原有的语言数据早已整理完毕,现在的任务是将其语义化,并让大模型能够理解。反观某些厂商在做 Data Agent 时,并没有如此丰富的数据接口和数据源,只是在上层做一层薄薄的封装,客户自然不会满意,因为数据访问受限,能力差距明显。”

“因此,未来能够在 Agent 领域做出成果的,很可能不是大模型厂商,而是原有的 SaaS 和工具型厂商。”

行业 knowhow 不仅会直接影响企业决策者的方向,也能通过沉淀到模型中,影响产品每一个细枝末节的走向。

从前述 MCP 与 A2A 的实际差异,就能看出垂直场景的模型能力对于 Agent 的重要性,ToB 企业的 Agent 也确实会更加倾向于使用垂类大模型。

薛赵明表示,“ 因为ToB 会带有很强的行业属性,当使用的不是通用 LLM 而是行业 LLM 的时候,其实反而是在降低 AI 的能力要求。在明确场景和规则下,在信息面和结果准确度上会有较大提升。 ”

张森森表示,“ 倾向使用垂类大模型的原因主要有几个点,第一是成本优势。通用大模型参数量大,而垂直大模型参数量更小,推理成本更低。”“ 第二是幻觉方面。垂类模型更精准,更贴合企业自身的生态环境。相比之下,通用大模型依赖强泛化能力,往往需要更多人工校对,增加复核成本。”

“ 第三是部署和合规的便利性。垂直大模型更容易私有化部署,更符合数据合规和隐私要求。而通用大模型通常依赖云端调用,企业会有很多顾虑,不敢使用。同时,从可控性和灵活度来看,垂类模型可以针对行业定制,比如设置 prompt、模板规则、引擎工具调用策略,从而实现更稳定的响应模式。”“ 第四,通用大模型可以通过上下文工程做一些优化,但输出依然存在不确定性和不可控性,所以在 ToB 产品中运行时会有一定风险。因此,在客服知识问答、流程自动化等场景里,垂直大模型往往更适合。做 ToB Agent时常用的策略是,让垂直大模型覆盖大约 80%–85% 的高稳定性需求,确保稳定可靠;而在剩下 15%–20% 的复杂问题上,再用通用大模型来兜底。”

从更加长期的角度来看,垂直领域肯定具备更大的商业价值,无论是直观上的经验,还是从数据规模和价值评估。

郭炜表示,“ 在数据量方面,互联网数据的规模远超企业级数据,差距达到几个数量级。但从商业价值的角度看,企业级数据的含金量更高,其信息熵或信息密度和价值远胜于互联网数据,因为这些数据直接关乎企业自身的经营命脉。”

张森森补充道,“ 关于垂类数据和互联网数据规模的比较,不同人的说法不一样。通用语料数据可能是万亿级token规模。单一的垂类数据一般在亿级或百亿级,不可能达到万亿级。但如果把所有行业的内部数据加在一起,比如金融、医疗、制造等领域,总量肯定会超过通用网络或通用语料数据。”

“ 但是,工业互联网的数据大多是垃圾数据,可用于训练的数据很少,尽管它的总量可能比通用互联网数据还多。”

当然,仅仅依靠垂直大模型是不够的。Agent 的落地面临一个非常考验工程能力的问题,就是 workflow 和 Agent 的权衡取舍。

王楠表示,“ Agent 和 workflow 有显著的差异,Agent 的核心在于利用 LLM 做决策,动态地构建 workflow。相比之下,workflow 是预先定义的、静态的。这个区别决定了两者适用的场景不同。”

“ workflow 由于缺乏灵活性和通用性,其实能够解决的实际问题有限。相比之下,Agent 更加灵活、更加通用,能够更好地解决实际生产环境中的复杂问题。”

张森森表示,“ 广泛意义上,所有存在需求组合爆炸的情况,比如行程规划、医生排班、家政服务等,都是把 workflow 改造成 Agent 的契机。如果做的好,可以完全替代人力。”“ 如果业务变量数量少、组合有限,可以穷举,就可以把流程固定下来,用 workflow。如果环境静态或变化可预期,也可以把流程固定下来,用 workflow。但如果变化维度非常多,比如几百个维度同时在变化,再用 workflow 设计、测试和维护,成本会急剧上升,这时就需要人工决策,或 Agent 的自主规划能力。另外,当环境频繁变化,比如航班延误、库存波动,Agent 可以根据上下文实时调整决策,避免预设流程失效。这时就需要自主 Agent。”

“ 因此,是否用 workflow 或 Agent,要从成本、计算调用和维护成本来考量,特别是在运行环境复杂多变的情况下。”

但在大模型幻觉问题无法完全解决,以及 Agent 当前智能有限的限制下,想要一蹴而就实现理想决策是不可能的,何况 workflow 具有更高的确定性,这对于企业而言非常重要。

郭炜表示,“ 这也是行业 knowhow 要发挥作用的地方,决策者需要在复杂系统中权衡哪些部分使用固定的工作流,哪些部分进行适当 Agentic 化。”

张森森表示,“ Agent 的落地依赖于固有流程,最适合的是小规模的局部 workflow 改造。流程高度标准化、数据流转路径清晰、任务有明确输入输出,这些都是 Agent 落地的最佳条件。Agent 的作用不是推翻重来,而是嵌入线性流程,做局部改造。这可以理解为 ‘ 低摩擦的轨道 ’,标准化流程本身就是低摩擦的轨道。”

王文广表示,“ 选择高价值、数据丰富、流程清晰、且允许一定容错( 或易于监督 )的业务环节,有助于 Agent 成功落地。”

张森森举例解释道,“ 比如,金融行业数字化水平较高,流程标准化程度很高,因此是 Agent 落地的非常好场景。”

“ 金融行业过去在风控、投研、合规等环节已经有智能化的应用,而 Agent 在这些环节里主要作为辅助模块嵌入,而不是取代整个业务系统。例如:银行在贷款审批环节使用 Agent 做资料自动提取,在合规环节做条款比对,在合同、财报数据处理中提取资料并输出审批结论、风险标签。这些环节的输入输出是固定的,比较容易嵌入 Agent。”

“ 如果考虑风险因素,在一些风险高但流程完全可控的场景,比如金融交易、医疗诊断,即便变量很多,也可以在 workflow 基础上引入半自动化或部分 Agent。这类场景对风险的容忍度低,更适合 workflow+Agent 的模式。但在一些风险容忍度较高的场景,比如旅行规划,就可以直接用 Agent,而不需要依赖 workflow。”

进一步看,Agent也分两种,工作流式的和自主式的,“ 工作流式的 Agent 是把执行规划固定下来,流程相对可控。非工作流式的 Agent则可以做自主规划和执行,能自动调用工具( tool use )与编排,能动态更新上下文,处理长尾和个性化需求。”

王楠补充道,“ 例如,只有检索-生成的 RAG 系统,就是典型的工作流式 Agent,而具有反思和可以使用搜索工具的 Deep Research 或 Agentic search 就是自主式Agent。”

从投资人视角,当前并不看好自主式的 Agent,短期也是更看好工作流式的垂直领域 Agent,张森森表示,“ 因为这类 Agent 在风险回报和落地速度上更有优势,所以这种倾向是合理的。”

付瑞吉表示,“ 在当前的发展阶段,workflow 型 Agent 更切合实际。基于强化学习的自主式 Agent 还需要更长时间的探索,也许要等前者的广泛应用,为后者的训练提供大量数据后,才能真正普及。”

而在实际工程权衡下,企业可能还会更加实在,郭炜表示,“ 幻觉控制非常重要,尤其是在 ToB 场景中。用户真正关心的是结果,并不在乎是通过哪种技术路径实现的,无论是 RAG、Agent + RAG,还是仅用 Agent。 因此未来的模式更可能是 ‘ Agent + RAG + 传统 workflow( 或 RPA )’ 的组合。”

“ 这种模式能够在保证确定性的前提下,结合利用大模型和 Agent 处理与人的交互,以及理解用户意图。”

“ Agent 的主要作用是进行分工决策,确定由哪个 Agent 执行任务,以及向其提供哪些信息。但在实际执行阶段,往往是由 workflow 来完成的,甚至不一定涉及 RAG。既然幻觉无法解决,那就尽量不用。 ”

张森森也认为,这是一个非常务实的方案,“ 目前企业里大多也是这样在用。”

郭炜继续解释道,“ 之所以如此分工,是因为意识到,大模型和Agent在场景中解决的最重要问题应该是交付。”

“ 多数情况下,人们很难准确表达自己的需求,需要通过与大模型多轮沟通,逐步明确 ‘ 到底想要什么 ’,传统软件和 SaaS 无法完成这种深度、多轮、渗透式的需求挖掘。这一能力在 To C 和 To B 场景中都同样重要。从个人感受来看,相对于传统搜索,效率提升至少是几倍的。”

“ 目前,大多数 Agent 更适合应对一些原本套路化、工程化、重复性较强的任务,并在交互上发挥更大价值,例如与客户对话、深入了解需求,并在此基础上设计完整的解决思路,然后生成 RAG 或 workflow 来执行。”

据此,郭炜认为,未来 Agent 的发展将分为两个阶段。

第一阶段,解决原本由垂直领域工具服务的业务场景,只有在这些场景中做到更高的便利性、更明显的痛点解决,Agent 才能真正兴起。 “ 毕竟 Agent 继承自原有 SaaS 软件形态,只不过在交互方式和技术能力上有了新的突破。”

第二阶段,在足够深入落地场景后,需要找到创新的切入点。“ 就像当年同样是做新闻,今日头条找到了全新的切入方式一样。”

“ 目前国内外并没有满足以上两点的 Agent 应用。”

薛赵明表示,“ 当前行业中的 Agent 产品,在人机交互方面依然很差。OpenAI 也提出了 2025 年是上下文工程的元年,交互能力本质上是上下文理解能力。当然这里面也存在路线之争,比如是更多依赖用户的上下文,还是让模型自己来解决。”

对于 Agent 的应用场景,在 ToC 类场景中,何为刚需还不存在共识,目前整体还比较盲目,更多是围绕技术更新做尝试,而 ToB 场景已经有较为明确的优先方向。

张森森表示,“ 现在企业内部最迫切的 Agent 应用场景有三个。”

“ 第一,跨系统任务编排与自动化。例如把 ERP、CRM、知识库、工单等业务系统通过自然语言连接起来。目前很多 Agent 只能做到对话式查询,没有形成完整的自动化执行链条。所以缺乏可视化编排和审批机制,企业不敢放心交付关键任务。”“ 第二,高可信度的知识问答与决策。目前企业内部大多数 Agent 平台做的还是 ‘ 文档搜索 + 大模型总结 ’。问题是没有引用和溯源机制,没有版本控制,没有访问权限分级。结果是表面上大家轰轰烈烈做了一堆 Agent,看起来很好,但最终根本无法真正投入使用。”“ 最后,也是最重要的,就是 Data Agent( 以前叫 ChatBI )。核心能力包括半自动或全自动的数据分析与报告生成;理解企业内部 BI 系统的数据模型;自动编写 SQL,或调用数据分析 API;输出可视化报表或业务报告等。”

“ 但现状是很多产品只做到了 ‘ 表格分析 + 自然语言生成表格 ’,生成的数据需要巨量人工校对,往往 ‘ 要了半条命 ’,成本极高,严重影响实用性。”“ 在这些场景应用里,都需要训练或定制垂直化模型。因为企业内部有自己的语言体系( 行业黑话、内部术语等 )、业务生态( 跨部门协作的专属逻辑 )、流程规范( 审批链条、合规规则等 )、知识沉淀( 文档、数据、经验库等 )。”

郭炜介绍道,“ 在 Data Agent 场景中,传统的 ETL 操作非常繁琐,需要大量人工拖拽配置。而通过 Data Agent,可以快速获取企业底层数据,不仅限于简单的 Chat BI 查询,而是能够直接访问更底层、更原始的数据,从而显著提升处理效率。”

“ 目前市面上大多数所谓的 Data Agent,本质上只是将传统的 BI 或数据仓库加了一个 ‘ Chat BI ’ 式交互外壳,并未实现数据在语义层面的深度转化,仍停留在 ‘ 玩具 ’ 阶段,而多数客户此时只是抱着 ‘ 尝鲜 ’ 的心态进行试用。这种模式无法充分释放数据价值,也难以支撑真正的 Agent 生态。”“ 要实现理想的 Data Agent 架构,主要面临两大挑战。”

“ 第一,数据底层处理的复杂性。底层系统存在成千上万种不同的数据源,要将其中的数据转化为可被大模型理解的上下文,是一项繁重且复杂的工作。大模型本身无法直接完成这些‘脏活累活’,这需要长期的积累与专业的处理能力。”

“ 第二,数据交互与转化。必须充分利用大模型的交互能力,让其具备推理和语言处理的能力,并将需求转化为对底层数据的精确调用。这要求在上层的自然语言需求与底层数据结构之间建立高效、准确的映射,这同样是一个高难度的技术挑战。”

“ 未来的目标是让用户能够通过自然语言快速完成任务,甚至无需自然语言输入,只需提供所需的 SQL 或数据描述,系统就能自动生成完整的 workflow。这类功能能够真正解决用户的痛点问题。”

“ Agent 产品只有能解决这一类核心场景的问题,企业才会对其有付费意愿,并推动大规模部署。”

总体来看,未来在 Agent 这个赛道,无论是ToC方向还是ToB方向,都还有很长的路要走。

王显总结道,“ 当前整体氛围上,大家还是想赚一波快钱。这其实是一个多赢局面,即资本方想赚快钱,企业等多方机构也希望帮自己讲一个AI的故事。”

“ 对于个人,在这个氛围影响下,就进入焦虑模式了,好像离开 AI 就不能活了,然后大家接下来就拼命地把工作跟 AI 结合起来。当然,这只是小赢,绝对不是大赢。等这轮泡沫消退、企业热度过去之后,大家会更加冷静地看待。我估计还需要一到两年时间。”

对于 ToC 赛道整体,张森森认为,“ 目前消费级通用 Agent 基本只能靠融资续命,商业化路径还没有跑通。”

那么,创业公司还能如何抓住机会呢?

关于创业方向选择,目前有一个理论是 “ 补足大模型的最后一公里 ”,比如等医疗、法律等流程做到 95 分的时候,让大模型接手替代人。

这或许是当前的创业取巧之选或大型企业的无奈之举,王文广认为,“ 这个选择对于创业公司并不性感,就像外卖和快递员,但总会有人做的。”

王楠表示,“ 现在的确是创业的一个黄金期,但方向选择未必一定是不足最后一公里,也许是不足最后 10 公里,也许是大模型生态中的一环。大模型接受替代人并非要人做到 95 分,再由 AI 接替。也可以是人已经处理的很好的任务,完全交给AI处理,比如对比价格、情感陪伴或者做AI教师。这里的价值在于 AI 让人的能力能够 scale。也可是人无法处理好的任务,比如写研报、写代码。”

“ 我会建议创业者去思考什么场景下 AI 能够做到十倍以上的效率提升。”

王楠还认为,创业公司仍然需要依靠速度构建护城河,同时也要认真做产品。比如 Genspark 在其产品中引入的改进策略包括:引入专业数据源、并行搜索、多代理交叉验证、专家审核内容、使用离线Agent确保准确性,并通过先发优势掌握了大量数据。“ Genspark的策略基本上是市面上认真做做 Agentic Search 和 Deep Research 产品的公司普遍的做法。对于 Genspark 和 Perplexity 这样的公司,主要市场还是在通用搜索,所以掌控数据和搜索能力是自然的选择。和传统的搜索巨头相比,在产品迭代速度和执行力方面的也是创业公司的优势。再加上大模型能力和时代浪潮的加持,我们会看到更多的小公司快速崛起,分走大公司的蛋糕。”

AI创业者李峰则认为,“ 技术层面,ToC 的 Agent 的护城河是大模型本身。要与 ChatGPT 竞争,首先要有一个跟 ChatGPT 匹敌或超越的大模型,显然,Manus 没有。要避开竞争,就只能在场景层做小做精,选择一个或几个核心场景,做到极致的可靠和高效,这才会有长期的机会。”

“ 工程层面,Genspark 确实真正在做落地的事情,并基于它所接触的需求,构建了一套高度复杂、精心编排的隐性工作流系统。它们正在利用先发优势来快速构建并完善这个复杂系统,从而形成事实上的护城河。设计、实现并调优这样一个包含众多模型、工具和数据源的复杂工作流系统,需要巨大的工程投入和时间。”

“ 即使基础模型公司要做好,也需要同样的工作。如果这个隐性工作流系统足够复杂,那就能够形成一定的竞争优势。”

张森森则认为,应用层的 Agent 创业公司,更容易从长尾产品入手。“ 写作、办公、搜索等主流场景,几乎被大厂牢牢占据,小公司很难在算力、数据、生态上正面竞争。而长尾场景虽然用户规模小,但需求独特、痛点尖锐。用户在高痛点的情况下,对解决方案的不完美有更高容忍度。哪怕只是部分缓解,也能让用户感到价值明显。”“ 只要能解决关键问题,就能迅速形成用户粘性。 而且长尾方案能够形成更强壁垒。因为这些场景需要结合高度专业化的数据,甚至涉及内部流程和工具,沉淀出的知识和技术很难被通用模型复制。经过长期迭代,还能向相似场景扩散,逐步形成护城河。”“ 比如 Figma,它最早并不是做 UI 设计的,而是解决了一个非常强的痛点:在线协作,再扩展到高频的设计需求,最终发展成行业龙头。Zoom 也是类似的路径,它最初的产品需求是解决高质量视频传输的问题,先在这个点上做深度优化,然后才逐步扩展,最终进入并占领了通用的会议市场。”

“ 当然,如果只是单纯做一个 Agent,是一定没有机会的。只是在技术或通用功能上去卷,就很容易被别人替代或干掉。”

最后,回到 Agent 泡沫本身,基于科技行业发展普遍规律,还是需要更加辩证地看待其存在意义。

郭炜认为,Agent 泡沫确实客观存在,但实际上还不够多,“ 毕竟对于 SaaS 软件和日常使用的 APP,还有大量的功能尚未实现。要真正把 Agent 做起来,还需要更多的泡沫推动,才能发展成熟。这也是早就存在的规律,每个新兴的创新领域在初期都会有大量资本驱动,最后才会有少数创业公司和想法存活下来。”

薛赵明表示,“ Agent 泡沫的存在是一定的。从远古的 NLP 阶段或人工智障时代,到 ChatGPT 时代,再到如今 AI 具备推理和工具使用能力的当下,虽然 AI 的更新很快,但是从事物的历史发展周期来说,当下还处在较为早期的阶段,这个阶段的特性就是泡沫横生,大家都在尝试做一些突破。特别是现在更多的投资还是比较前期的天使轮或者 A 轮,因此必然是一个 ‘ 百团大战 ’ 阶段。”

王文广表示,“ 这是所有颠覆性的新技术出现的必然过程,国内外没有什么不同。具体来说,新技术的应用一定会经历泡沫化,然后是幻灭与出清,紧随其后的长期、务实的渗透与融合。现在还是泡沫化的阶段,幻灭才有点苗头,出清还早。”

“ 关于 Agent 是否真正解决问题大家还无暇顾及,但必须先做起来,抢投资抢市场。”

“ 毕竟需要在这个市场活的足够久,才能找到 ‘ 在某个特定行业中,存在一个什么样的高价值、长期未被解决的难题?’、‘ AI Agent 的技术能否为这个问题提供一个全新的、比现有方案好 2 倍或者 10 倍的解法?’ 等问题的答案。”

“ 这与 ‘ 先做起来 ’ 并不完全是矛盾的。”

“ 但从长远看,唯有这种从真实、深刻的行业痛点出发的思考,才能找到真正有价值且具有护城河的落地场景。”

“ 现有的所谓的智能体的洗牌,应该会在接下来的三五年内出现。”

“ 整个行业终究将向着无处不在的 Agent 时代迈进。所以,不管怎么活着( 靠融资活着也是一种很好的活法 ),能够或者走向未来就是最重要的。未来有什么潜在的突破口,现在的你我都不知道,但只有活着走到那个时候,才有机会。”

面向更长远的未来,郭炜展望道,“ 未来,Agent 会非常普遍,几乎所有软件和 APP 都会嵌入模型,成为某种形式的 Agent。这并不局限于替代特定场景,而是整体向 Agent 化演进。”

“ 从各专业领域的 Agent 都已出现并且运行良好,再基于此形成入口级 Agent,这一过程可能需要 5 到 10 年。 在此之前,专业领域的专业型 Agent 将率先落地并发挥作用。”

王文广则提醒道,“ 在 AGI/ASI 真正到来之前,请注意,AGI 或 ASI 到来之前是个前提,基于大模型的智能体的的胜利,极大概率并不属于那些试图用一个通用 Agent 解决所有问题的 ‘ 平台 ’ 公司,而属于那些能将 Agent 作为一种能力与业务深度融合开发出该领域具备智能决策和自然语言交互的专业软件的公司。”

泡沫并非一定是坏事,真正的长期主义者反而能借助泡沫来生长。但唯有回答 “ 为谁而作、在何处用、以何种方式稳态运行 ”,才足以穿越喧嚣,走进可复用的现实。