DC娱乐网

从“连接”到“对话”:RTE+AI重塑交互,声网等抢占新赛道?

当声网创始人赵斌在Convo AI RTE 2025大会上宣布年度服务分钟数突破万亿,实时互动(RTE)技术正式确立关

当声网创始人赵斌在Convo AI & RTE 2025大会上宣布年度服务分钟数突破万亿,实时互动(RTE)技术正式确立关键基础设施地位。这场以“AI有声”为主题的盛会,揭开了RTE与对话式AI深度融合的产业新篇,标志着行业从“连接”向“对话”的决定性跃迁。

RTE的成熟已形成坚实底座。过去两年,视频高清化比例增长超10倍,海外市场720p以上分辨率流量占比超80%,WebRTC搜索热度爆发式增长,万亿分钟服务量背后是技术基建的全面完善。但基础设施的完备并未终结行业挑战,当交互从“人与人”延伸至“人与AI”,仅21%的用户满意度暴露出体验短板——人类对话中90%的信息来自语调、表情等非语言要素,现有技术在情感传递与自然交互上仍存鸿沟。

对话式AI正成为破局关键。多模态大语言模型的突破,让RTE实现从“正常对话”到“声情并茂”的跨越。市场需求已率先爆发:67%的企业将语音AI智能体置于战略核心,84%计划增加投入,声网对话式AI用量单季度环比增长151%,ARK Invest更是预测AI陪伴赛道规模将达700-1500亿美元。情感陪伴、智能硬件、在线教育三大场景已显现规模化落地潜力,AI客服的现场演示印证了技术在实时交互上的突破。

技术融合催生全球化新机遇。正如Agora联合创始人Tony Wang所言,AI出海已从“可选项”变为“必选项”,而“信任”是超越技术的核心壁垒。成功的全球化需实现“技术价值的全球化叙事”与“情感价值的本地化表达”结合,WaveSpeedAI“声西击东”的布局策略便是典型实践。在赛道选择上,Agent、AI硬件与底层基础设施构成三大机遇,巨头主导通用场景、原生企业深耕细分领域的两极格局正在形成。

微软韦青的观点为行业锚定方向:伟大技术应“融于无形”。声网发布的白皮书与AI引擎2.0等工具套件,正践行这一理念——通过降低开发门槛,推动技术落地于实际场景。而RAG等技术的应用,更让AI回答具备真实性与可追溯性,为医疗等专业领域的RTE+AI融合提供可能。

从“人人连接”到“人机共生”,RTE与对话式AI的融合正重塑交互边界。万亿分钟的基建积淀,叠加千亿级的AI蓝海市场,一个更智能、更自然的实时互动新时代已然到来。