新闻中心

西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机

2023-11-02
浏览次数:
返回列表

超强的泛化能力,让大模型成为「通用人工智能」的一缕曙光。

然而,读万卷书,不如行万里路,在开放环境中,大模型需要真正地「走」进物理世界,才能切实地理解复杂任务、解决实际问题。

最近,李学龙教授的团队进行了关于开放环境中自主无人机集群的创新研究。他们利用国产大型模型成功实现了在开放环境中的人机和多机对话交互,打破了人类与机器之间的交互壁垒。这一研究进一步扩展了临地安防的应用场景,让大型无人机在现实生活中翱翔

受到人类认知模式的启发,我们的团队将高度自主的认知过程归纳为「思维计算—实体控制—环境感知」的三元交互,并建立了基于「书生·浦语」开源大模型驱动的自主无人机「群聊式」控制框架。我们为每架无人机搭载了智能大脑,使得无人机群体能够通过语言沟通动态协同,实现在开放环境和复杂任务中的智能交互、主动感知和自主控制。这一举措提高了无人机任务执行的自主性

总的来说,自主无人机集群的主要能力包括类人对话交互、主动环境感知和自主实体控制

类人对话交互

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机图1 无人机群聊沟通

探索人类用户与无人机的交互方式,让无人机理解复杂任务中的用户需求,是实现自主无人机的前提条件。

针对此,团队提出「群聊式」对话交互方法,将声音、图像和无人机自身状态等多种信息,通过大模型转换为自然语言的对话形式,实现了用户与无人机,以及无人机与无人机之间自主和直观的交互方式。

为了提高复杂任务的执行稳定性和安全性,团队设计了一套高效的实时反馈机制。这个机制使得无人机能够在任务执行的关键节点通过对话报告自身状态,并寻求用户确认。同时,这套机制还能够大大提高任务执行的效率

主动环境感知

西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机图2 主动发现并靠近目标

西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机图3 动态环境避障

在飞行过程中,无人机主动感知外部环境,实时调整任务规划,是完成复杂任务的关键环节。

短影AI 短影AI

长视频一键生成精彩短视频

短影AI 170 查看详情 短影AI

为了应对这个问题,团队开发了一种任务引导的主动感知机制,并提出了多传感器融合的低空搜索、动态避障和视觉定位算法

在实际任务执行过程中,根据感知信息和任务目标,我们可以动态调整无人机的飞行路径和观测位姿。我们可以尝试从不同的角度和位置感知周围的世界,逐渐降低环境中的不确定性,以实现高效的信息采集和任务执行

自主控制

西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机图4 自主目标抓取

西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机图5 异构无人机集群协同控制

重点研究是探索复合智能体形态,以增强其处理复杂任务的能力。在大模型时代,这是新型智能体的一个关键领域

为了解决这个问题,研发团队利用无人机平台设计了夹爪等末端执行器,将传统的无人机升级为“飞行机器人”,赋予其抓取能力

同时,还建立了异构无人机集群协同控制机制,并结合环境感知反馈,实时调整无人机编队的飞行状态,以便让集群能够分工合作,执行区域搜索、目标定位和抓取等任务

团队成功尝试将生物智能的「思维计算—实体控制—环境感知」三元交互模式应用于自主智能体中,形成了大型自主无人机集群。这种集群利用大型语言模型、无人机平台与多种传感器,实现了对话交互、主动感知和自主控制。该技术对于安防巡检、灾害救援、空中物流等临地安防场景下的应用具有重要意义

参考文献:李学龙, 临地安防(Vicinagearth security), 中国计算机学会通讯, 18(11), 44-52, 2025年

以上就是西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机的详细内容,更多请关注其它相关文章!


# 语言  # 生物智能  # 西工大  # 安防  # 模型  # 最好用  # 上饶网站自然优化  # 永寿企业网站推广  # 关键词排名点击询问k火16星  # 唐山网站推广机构  # 过程中  # 人对  # 实现了  # 将于  # 我们可以  # 三大  # 这一  # 文章关键词排名怎么排  # 舟山抖音seo技术公司  # 安阳网站建设厂家  # 学术营销推广简历  # 网站制作推广 宜去cidun8下拉  # 慈溪网站的建设 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 市盈率为负数是什么意思  苹果16有哪些款式的  苹果16日发售哪些机型  路由器上面的power红灯是什么意思  苹果16都有哪些型号  i5 6500怎么装win7  typescript如何标记私有方法  单片机怎么读取电流值  折叠屏手机为什么没火  羽毛球拍power9是什么意思  python和typescript学哪个  如何利用运行命令查看声音启动  linux如何跳回命令行界面  typescript用在哪里  awk命令如何对两列加分隔符  苹果16配置参数有哪些  如何通过命令系统还原  市盈率pe是什么意思  直接gmV是什么意思?直接GMV:定义和概念  命令指示符如何打开盘符  如何增加固态硬盘  命令控制台如何执行sql文件  linux环境中如何使用ping命令  如何通过dos命令  固态硬盘如何消除缓存  如何判断固态硬盘  苹果16更新了哪些软件  夸克为什么会变小  如何用命令行连接本地数据库  电动车power灯亮红灯是什么意思  春运抢票准备什么  苹果16有哪些bug  vi命令如何退出编辑模式  恋爱软件免费聊天不收费的有哪些  typescript是什么软件  j*a怎么保存到数组  春运高速高铁抢票攻略  如何看固态硬盘信息  为什么用typescript  折叠屏手机好不好,耐不耐用  如何自己加装固态硬盘  夸克前缀后缀什么意思啊  如何安装tree命令  awful是什么意思  苹果16会有哪些更新  汽车排量是什么意思  市盈率市净率是什么意思  如何使用命令行界面  nosql数据库的应用场景有哪些  台机如何安装固态硬盘 

搜索