新闻中心
基于Paddle工具链:ROS目标检测部署方案
FSACOCO数据集由北理工无人驾驶方程式车队搭建,用于中国大学生无人驾驶赛事视觉部分,含42张带标注的红蓝锥桶图像。介绍了两种基于飞桨的训练方式:PaddleDetection需克隆仓库、改参数等,PPYOLO v2训练后mAP50达99.01%;PaddleX则通过低代码完*流程。两者均涉及模型导出与部署,可参考BITFSD开源3.0。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

数据集介绍
FSACOCO 数据集由 北京理工大学无人驾驶方程式车队 进行搭建并维护,致力于中国大学生无人驾驶方程式赛事中视觉部分的应用,该项赛事使用红蓝锥桶代表赛道边界,参赛队伍需要在未知地图的条件下得到最快圈时,同类数据集可参考FSOCO ,由苏黎世联邦理工学院AMZ车队进行维护,为德国大学生无人驾驶方程式大赛视觉部分数据集。
此项目作为北京理工大学无人驾驶方程式车队FSD开源3.0中目标检测模块进行展示
解压数据集
数据集格式:
-dataset_sample
|-Annotations
|-0.xml
|-1.xml
|-10.xml
|-...
|-JPEGImage
|-0.jpg
|-1.jpg
|-10.jpg
|-...
|-eval.txt
|-labels.txt
|-train.txt
注: 此处仅提供42张数据
更多数据集可以前往https://github.com/bitfsd/FSACOCO获取
!unzip data/data126556/dataset_sample.zip -d ./dataset_sample
方式一
使用PaddleDetection训练
PaddleDetection为基于飞桨PaddlePaddle的端到端目标检测套件,提供多种主流目标检测、实例分割、跟踪、关键点检测算法,配置化的网络模块组件、数据增强策略、损失函数等,推出多种服务器端和移动端工业级SOTA模型,并集成了模型压缩和跨平台高性能部署能力,帮助开发者更快更好完成端到端全开发流程。
特性
- 模型丰富: 包含目标检测、实例分割、人脸检测等100+个预训练模型,涵盖多种全球竞赛冠军方案
- 使用简洁: 模块化设计,解耦各个网络组件,开发者轻松搭建、试用各种检测模型及优化策略,快速得到高性能、定制化的算法。
- 端到端打通: 从数据增强、组网、训练、压缩、部署端到端打通,并完备支持云端/边缘端多架构、多设备部署。
- 高性能: 基于飞桨的高性能内核,模型训练速度及显存占用优势明显。支持FP16训练, 支持多机训练。
模型性能概览
各模型结构和骨干网络的代表模型在COCO数据集上精度mAP和单卡Tesla V100上预测速度(FPS)对比图。
1.克隆PaddleDetection
由于原始仓库为github链接,下载较慢,可以更换为gitee链接
In [ ]!git clone https://gitee.com/Feng1909/PaddleDetection.git
2.安装PaddleDetection的依赖
In [ ]!pip install -r PaddleDetection/requirements.txt
3.修改各种参数,如路径等
以训练PPYOLO v2为例
同理可以训练所有PaddleDetection支持的模型
修改数据集路径
PaddleDetection/configs/datasets/voc.yaml
修改为以下路径
metric: VOCmap_type: 11pointnum_classes: 3TrainDataset:
!VOCDataSet
dataset_dir: ./
anno_path: ./dataset_sample/train.txt
label_list: ./dataset_sample/labels.txt
data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']EvalDataset:
!VOCDataSet
dataset_dir: ./
anno_path: ./dataset_sample/eval.txt
label_list: ./dataset_sample/labels.txt
data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']TestDataset:
!ImageFolder
anno_path: ./dataset_sample/labels.txt
4.训练
In [ ]# 从头开始训练,大约需要30分钟# bbox mAP50能达到99.01%!python PaddleDetection/tools/train.py -c PaddleDetection/configs/ppyolo/ppyolov2_r50vd_dcn_voc.yml --use_vdl=true --eval# 中途中断,继续训练,更改output/ppyolov2_r50vd_dcn_voc/248.pdparams为中断前的模型参数# !python PaddleDetection/tools/train.py -c PaddleDetection/configs/ppyolo/ppyolov2_r50vd_dcn_voc.yml -r output/ppyolov2_r50vd_dcn_voc/248.pdparams --use_vdl=true --eval
5.模型导出
若需使用TensorRT进行加速,则TestReader.inputs_def.image_shape为必需项目
美图云修
商业级AI影像处理工具
50
查看详情
In [ ]
!python PaddleDetection/tools/export_model.py -c PaddleDetection/configs/ppyolo/ppyolov2_r50vd_dcn_voc.yml --output_dir=./inference_model \ -o weights=output/ppyolov2_r50vd_dcn_voc/best_model # TestReader.inputs_def.image_shape=[3,640,640]
6.模型部署
参见BITFSD开源3.0
经过完整数据集训练后PPYOLO v2识别效果
方式二 使用PaddleX训练
PaddleX 集成飞桨智能视觉领域图像分类、目标检测、语义分割、实例分割任务能力,将深度学习开发全流程从数据准备、模型训练与优化到多端部署端到端打通,并提供统一任务API接口及图形化开发界面Demo。开发者无需分别安装不同套件,以低代码的形式即可快速完成飞桨全流程开发。
1.安装PaddleX
In [ ]!pip install paddlex==2.1
2.设置环境
In [18]# 设置使用0号GPU卡(如无GPU,执行此代码后仍然会使用CPU训练模型)import matplotlib
matplotlib.use('Agg')
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'import paddlex as pdx
3.设置数据集增强
In [ ]from paddlex import transforms as T
train_transforms = T.Compose([
T.MixupImage(mixup_epoch=-1), T.RandomDistort(),
T.RandomExpand(im_padding_value=[123.675, 116.28, 103.53]), T.RandomCrop(),
T.RandomHorizontalFlip(), T.BatchRandomResize(
target_sizes=[192, 224, 256, 288, 320, 352, 384, 416, 448, 480, 512],
interp='RANDOM'), T.Normalize(
mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
eval_transforms = T.Compose([
T.Resize(
target_size=320, interp='CUBIC'), T.Normalize(
mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
4.设置数据集读取
In [ ]import paddlex as pdx
train_dataset = pdx.datasets.VOCDetection(
data_dir='dataset_sample',
file_list='dataset_sample/train.txt',
label_list='dataset_sample/labels.txt',
transforms=train_transforms,
shuffle=True)
eval_dataset = pdx.datasets.VOCDetection(
data_dir='dataset_sample',
file_list='dataset_sample/eval.txt',
label_list='dataset_sample/labels.txt',
transforms=eval_transforms)
5.训练
In [ ]num_classes = len(train_dataset.labels)# model = pdx.det.YOLOv3(num_classes=num_classes)# model = pdx.det.PPYOLO(num_classes=num_classes)model = pdx.det.PPYOLOv2(num_classes=num_classes)
model.train(
num_epochs=550,
train_dataset=train_dataset,
train_batch_size=24,
eval_dataset=eval_dataset,
pretrain_weights=None,
learning_rate=0.000125,
warmup_steps=100,
warmup_start_lr=0.0,
lr_decay_epochs=[130, 540],
lr_decay_gamma=.5,
early_stop=True,
s*e_interval_epochs=20,
s*e_dir='output/ppyolov2', # resume_checkpoint='output/yolov3/epoch_430',
use_vdl=True)
6.模型导出
若需使用TensorRT加速,则--fixed_input_shape为必需项
In [ ]!paddlex --export_inference --model_dir=./output/ppyolov2/best_model/ \
--s*e_dir=./inference_model # --fixed_input_shape=[224,224]
7.模型部署
参见BITFSD开源3.0
以上就是基于Paddle工具链:ROS目标检测部署方案的详细内容,更多请关注其它相关文章!
# git
# python
# 一言
# 高性能
# 端到
# 无人驾驶
# 中文网
# coco
# type
# fig
# 飞桨paddlepaddle
# igs
# ai
# 工具
# 长春站内seo
# 抖音seo获取精准流量
# 地产seo软件
# 德语推广网站有哪些软件
# seo助手哪个便宜点
# 衢州专业seo网站推广报价
# 景洪普洱网站建设
# 中国最大的网站建设
# 最省钱的网站建设
# 伊春商城网站建设
# 官网
# 套件
# 苏黎世
# 开源
# 美图
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
单片机怎么做组合
苹果16有哪些自带配件
春运抢票如何快速抢到票
单片机计时程序怎么写
市盈率是负数是什么意思
夸克绑定设备是什么意思
通配符的用法
typescript解决了什么
苹果16有哪些可以设置
输入命令如何换行
智能锁type-c接口是什么
空调控制面板power灯一直亮是什么意思
笔记本电脑多少钱
cron表达式在线工具有哪些
单片机怎么储存和显示
如何弄坏固态硬盘
笔记本如何使用固态硬盘
手机的nfc是什么功能是什么意思
一尺是多少厘米
如何用dos命令启动u盘
typescript如何使用
typescript哪个最好
宵衣旰食是什么意思
360手机壁纸怎么改
如何去掉拍电脑的纹路详细教程
苹果16讲解有哪些功能
什么是typescript
苹果16多有哪些功能
1s等于多少ms
折叠手机内屏为什么会坏
5g手机4g卡怎么没有网络
typescript和es6先学哪个
冰柜power是什么意思这个黄灯怎么不亮
笔记本如何选择固态硬盘
车子上面nfc功能是什么意思
manager是什么意思
如何修改cad中的命令
夸克*免费吗
如何在命令提示符播放音频
如何通过命令行启动tomcat
市盈率ttm市盈动静是什么意思
如何更新苹果ios16
j*a怎么声明byte数组
移动固态硬盘如何使用
360f4怎么取消百变壁纸
开机如何运行dos命令提示符
ai显示无法找到链接的文件是什么意思
品道音响上的power键是什么意思
选哪个折叠屏手机好用
怎么关360壁纸广告


2025-07-24
浏览次数:次
返回列表
pe=[3,640,640]