Science China Information Sciences | 大语言模型也能指挥无人机编队？LLM辅助多机器人路径规划框架

论文信息

英文题目：Formation control and path planning of multi-robot systems via large language models

中文题目：基于大语言模型的多机器人系统编队控制与路径规划

作者：Dong Xue, Xuanjie Zhou, Ming Wang, Fangzhou Liu

作者单位：华东理工大学能源化工过程智能制造教育部重点实验室；哈尔滨工业大学航天学院智能控制与系统研究所

期刊：Science China Information Sciences

发表时间：2025年4月24日

引文格式：Xue D., Zhou X. J., Wang M., and Liu F. Z., “Formation control and path planning of multi-robot systems via large language models,” Science China Information Sciences, vol. 68, no. 5, 150205, 2025.

01 全文速览

多机器人系统的核心难点，往往不只是“每个机器人怎么走”，而是整个队伍如何形成队形、保持队形、绕开障碍，并在通信延迟或个体故障时继续完成任务。传统方法通常依赖预先定义的数学约束和规则，在静态任务中表现不错，但面对动态环境、队形变化和突发故障时，灵活性不足。

这篇论文提出一种 LLM辅助的多机器人编队控制与路径规划框架。它将机器人参数、运动目标、局部环境信息和控制约束转化为文本提示词，由LLM生成下一阶段运动目标，再通过控制器转化为无人机可执行的控制输入。换句话说，LLM在这里不是直接替代底层控制器，而是作为“高层决策大脑”，负责理解任务、选择策略和更新目标。

图1：LLM-based control framework，展示提示词生成、文本命令转换和运动执行三大模块。

✅ 亮点1：将LLM引入多机器人编队控制与路径规划，实现文本约束驱动的决策。

✅ 亮点2：提出嵌套循环控制框架，降低LLM调用频率，提高系统执行效率。

✅ 亮点3：针对障碍环境，LLM可根据障碍分布选择绕行或队形调整策略。

✅ 亮点4：考虑通信延迟与个体故障，验证LLM辅助系统的鲁棒性与重组能力。

02 研究内容

🎯 2.1 为什么要让LLM参与多机器人控制？

传统编队控制常依赖leader-follower、虚拟结构、行为法等策略。它们的优势是结构清晰、可分析，但往往需要提前写好规则。比如三角形、方形、菱形、直线队形都可以设计控制律，但如果任务中要求频繁改变队形、根据障碍选择不同策略，就需要大量条件判断和参数调节。

LLM的优势恰好在于理解复杂文本约束。研究者将队形要求、机器人状态、环境信息、避障策略等写入Prompt，让LLM输出下一阶段目标点。这样，复杂数学约束的一部分被转化为更直观的文本描述。

图2：上图展示leader-follower交互结构，下图展示编队距离约束。

🧠 2.2 系统模型：LLM做决策，PID做执行

论文以四旋翼无人机群为对象。每架无人机采用位置—姿态动力学模型，控制输入包括总推力 (f) 和三个方向力矩 ( au_x, au_y, au_z)。编队目标是使机器人之间实际距离逐渐逼近期望距离：

同时，需要满足无人机之间、无人机与障碍物之间的安全距离约束。

LLM输出的是文本形式的目标坐标，不能直接驱动无人机。因此论文采用级联PID控制：外环根据目标坐标生成参考加速度，内环根据姿态误差生成力矩输入。这样形成“LLM高层决策 + 动力学控制器底层执行”的分层结构。

图3：上图展示四旋翼结构，下图展示运动执行流程。

⚙️ 2.3 Prompt生成：把编队控制问题写成“任务说明书”

Prompt由四类信息组成：机器人物理与运动参数、下一阶段运动目标和策略、局部环境与队伍状态、模型输出格式要求。由于形成队形、保持队形、避障、故障处理的需求不同，论文没有使用单一Prompt，而是采用事件驱动的自适应Prompt选择。

例如，当系统处于编队初始化阶段时，Prompt强调“生成指定队形节点”；当检测到障碍物时，Prompt强调“选择绕行或调整队形”；当某架无人机故障脱离时，Prompt要求“剩余无人机重组为新队形”。

这种设计的意义在于：LLM不是盲目输出动作，而是在不同运动阶段被不同任务规则约束。

🚁 2.4 嵌套循环：减少LLM频繁决策带来的开销

LLM调用需要时间和资源，如果每个控制周期都请求LLM，会影响实时性。论文提出嵌套循环控制：外环由LLM生成阶段性目标，内环由无人机按固定控制频率向目标运动。只有当目标完成、检测到障碍或出现故障时，才进入下一轮LLM决策。

这相当于把LLM放在“决策层”，而不是“毫秒级控制层”。这一点非常重要，也更符合当前LLM在机器人控制中的现实定位。

🧭 2.5 避障策略：绕行还是变队形？

论文设计了两类避障实验。第一类是集中障碍，LLM选择整体绕行，优点是队形稳定、内部碰撞风险低；第二类是分散障碍，LLM选择调整队形穿越障碍区域，路径更短，但队形稳定性稍有下降。

图4：两种避障策略对比。左侧为集中障碍绕行，右侧为分散障碍下调整队形穿越。

实验结果显示，变队形策略的路径长度更短，但安全距离更接近障碍；绕行策略路径更长，但更稳健。这正体现了LLM的潜在价值：它可以根据环境分布和任务需求，在“安全优先”和“效率优先”之间做策略选择。

📡 2.6 通信延迟：LLM还能处理异步控制吗？

多机器人系统中，通信延迟会导致leader先更新目标，而followers滞后执行，进而破坏队形。论文将通信延迟建模为与机器人距离相关的泊松随机变量：

为缓解异步问题，作者提出延迟预测策略：LLM根据延迟逻辑预测followers接收指令的时间，leader不立即更新目标，而是延迟更新，使队伍尽量同步行动。

图5：上图展示延迟预测控制原理，下图展示有无延迟预测下的轨迹与编队误差。

🛠️ 2.7 故障重组：某架无人机掉队怎么办？

论文还模拟了两类故障：一类是集体推进扰动，导致队形短时被破坏；另一类是某架follower严重故障并脱离队伍。实验显示，当个体脱离后，leader可以基于剩余无人机状态重新生成三角队形，使剩余无人机继续向目标点运动。

图6：动态输入扰动和个体脱离故障下的队形重组结果。

03 创新点

🔍 3.1 用文本约束替代部分复杂规则设计

论文将队形、避障、故障处理等控制需求转化为Prompt，使复杂控制逻辑更容易调整。

🧩 3.2 构建“LLM决策 + PID执行”的分层控制框架

LLM负责阶段性目标生成，PID负责连续运动控制，避免LLM直接参与高频闭环。

🧭 3.3 支持多队形生成与动态切换

三角形、方形、菱形、直线队形可通过修改Prompt生成，而不必重写底层程序。

🛡️ 3.4 考虑通信延迟和故障重组

论文不仅做了路径规划，还进一步验证了延迟环境和个体故障下的队形恢复能力。

04 总结与展望

这篇论文的价值在于，它将LLM从“自然语言交互工具”推进到多机器人系统的“高层策略生成器”。它并不是让LLM替代控制理论，而是让LLM处理更适合语言表达的部分：任务规则、队形要求、避障策略和故障应对。底层动力学控制仍由传统控制器完成，这种分工是当前较为务实的LLM机器人控制路线。

当然，论文也指出现阶段仍存在不足：主要考虑静态障碍，对动态障碍避让验证不足；LLM存在随机性和幻觉问题；多模态数据融合尚未深入展开。

🔭 未来研究将聚焦于以下几个方向：

1. 面向动态障碍物的实时队形调整与路径规划；

2. 结合视觉、多模态语言模型降低LLM幻觉风险；

3. 引入形式化安全校验，避免LLM输出不可执行目标；

4. 扩展到地面机器人、空地协同和异构多机器人系统；

5. 研究LLM与MPC、强化学习、控制屏障函数的混合控制框架。

声明：本文仅供学术交流，版权归原作者所有。如有错误或侵权，请联系更正或删除，欢迎留言探讨。

DC娱乐网

Science China Information Sciences | 大语言模型也能指挥无人机编队？LLM辅助多机器人路径规划框架

热门分类