admin 管理员组文章数量: 1184232
2024年6月1日发(作者:电脑文档表格制作教程)
第13卷 第8期
Vol.13No.8
智 能 计 算 机 与 应 用
IntelligentComputerandApplications
中图分类号:TP391文献标志码:A
2023年8月
Aug.2023
文章编号:2095
-
2163(2023)08
-
0045
-
08
一种基于目标检测的无人零售商品识别算法
王军祥
(福建船政交通职业学院信息与智慧交通学院,福州350007)
摘 要:随着近几年深度学习技术飞速发展,深度卷积神经网络在图像分类等任务的水准已经高于人类的水平,这为无人零
售带来了新的可能。本文通过目标检测数据集制作、基于翻转的目标检测数据扩充,基于开源目标检测框架MMDetection构
建了一种基于深度神经网络的无人零售商品定位、识别模型,并最终实现了一个基于深度学习目标检测算法的无人零售商品
识别系统。文末,依据目标检测常用性能衡量指标,采用目标检测常用度量方法,对本系统训练好的模型进行验证,结果表
明,系统对商品识别速度快,整体性能良好。
关键词:深度学习;图像处理;目标检测;数据扩充
Analgorithmforunmannedretail
productrecognitionbasedonobjectdetection
WANGJunxiang
(SchoolofInformationandIntelligentTransportation,FujianChuanzhengCommunicationsCollege,Fuzhou350007,China)
【Abstract】Withtherapiddevelopmentofdeeplearningtechnologyinrecentyears,thelevelofdeepconvolutionneuralnetwork
inimageclassificationandothertaskshasbeenhigherthanthatofhumanbeings,whichbringsnewpossibilitiesforunmannedretail.
Throughtheproductionoftargetdetectiondataset,theexpansionoftargetdetectiondatabasedonflipping,andbasedontheopen
sourcetargetdetectionframeworkMMDetection,thispaperconstructsanunmannedretailcommoditylocationandrecognitionmodel
basedondeepneuralnetwork,andrealizesanunmannedretailcommodityrecognitionsystembasedondeeplearningtargetdetection
algorithm.Therefore,accordingtothecommonlyusedperformanceindicatorsoftargetdetection,thecommonlyusedmeasurement
methodsoftargetdetectionareusedtoverifythetrainedmodelofthesystem.Theresultsshowthatthecommodityrecognitionspeed
isfastandtheoverallperformanceisgood.
【Keywords】deeplearning;imageprocessing;targetdetection;dataexpansion
0 引 言
各类新零售模式及智能服务平台的不断发展,
要求系统能精准识别出商品类型以完成销售服务,
而商品信息识别技术是这项功能得以实现的重要基
础
[1]
。传统自动贩售货柜成本较高,使用称重仪的
自动贩售柜则不支持同时贩售重量相同、但价格不
同的商品。无人零售作为人工智能技术在零售业的
典型应用场景,因其具备无人化、低成本、智能化的
应用优势,在日常生活中深受欢迎。利用人工智能
技术优势,结合国内全球领先的移动支付态势,无人
零售作为新零售的实践样本得到了极大关注
[2]
。
本文实现了一个基于深度学习目标检测算法的
使用开源的目标检测标注工具进行数据标注,介绍
了一种快速清洗数据的方法,讨论了目标检测数据
集扩充方法,提出了COCO数据集格式以及从
Labelme格式转换成COCO格式的方法。分析了训
练过程中的日志,并在介绍目标检测常用性能指标
后对训练结果进行了分析。
1 相关工具综述
1.1 深度学习框架Pytorch
Pytorch是一个由Facebook人工智能研究院研发
的开源机器学习框架,提供了既可以存在于CPU上、
也可以存在于GPU上的张量,可以极大地加快计算
速度。Pytorch基于反向模式自动微分技术,使得用
户可以构建动态的神经网络模型。用户可以像使用零售商品定位、识别模型。首先采集商品图片数据,
基金项目:福建省中青年课题(科技类)(JAT210704)。
作者简介:王军祥(1975
-
),男,教授,主要研究方向:软件技术、人工智能与大数据技术应用。
收稿日期:2023
-
02
-
09
哈尔滨工业大学主办
版权声明:本文标题:一种基于目标检测的无人零售商品识别算法 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1717247443a703564.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
更多相关文章
提升性能看这里!了解显卡硬加速、对比是否启用CPU访问显存加速的优劣
简而言之,硬件加速就是利用硬件模块来替代软件算法以充分利用硬件所固有的快速特性。硬件解码生效的时候,系统是怎么运转的呢?现在我们有两个处理器,CPU和GPU。他们通过PCIAGPPCIE总线交换数据。1。C
从入门到精通:深入解析默认网关的秘密
一、默认网关的定义 默认网关(Default Gateway)是一个网络设备(通常是路由器、防火墙或三层交换机)的IP地址,它是本地网络中的设备访问其他网络(如外网、其他子网)时,数据报文的“第一站”。简单来说,当设备需要与非
一文详解:如何通过4K对齐技术优化你的SSD性能
转载至: 一、什么是4K对齐 固态硬盘和机械硬盘不同,固态硬盘的日常流程是【读】→【擦】→【写】。简而言之就是SSD不能覆盖存储区的数据,它先把原数据擦除,然后再写入新数据。最小的读写单位被称为“页”、最小的擦除单位被
跨越边界:让Python的Pyuvc带你走进摄像头与目标检测的世界
最近想做实时目标检测,需要用到python开启摄像头,我手上只有两个uvc免驱的摄像头,性能一般。利用python开启摄像头费了一番功夫,主要原因是我的摄像头都不能用cv2的VideCapture打开,这让我联想到原来opencv也打
摄像头与深度学习的奇妙之旅:用pyuvc在Python中开启新视界
最近想做实时目标检测,需要用到python开启摄像头,我手上只有两个uvc免驱的摄像头,性能一般。利用python开启摄像头费了一番功夫,主要原因是我的摄像头都不能用cv2的VideCapture打开,这让我联想到原来opencv也打
从新手到精通:Python中临时存储用'temp'
在Python中,temp是一个常见的命名约定,通常用于表示临时变量或临时存储数据的变量。"temp"一词是"temporary"的缩写,意味着它只是用于暂时存储数据,而不是长期使用。 在编程
智慧农业的新篇章:西瓜叶片病害自动识别技术的实践探索
西瓜叶片病害识别数据集 README 往期热门主题 主题搜两字"关键词"直达 代码数据获取: 获取方式:***文章底部卡片扫码获取***覆盖了YOLO相关项目、OpenCV项目、CNN项目等所有类
Web应用中剪贴板交互的秘密武器:深入解析Document.execCommand与Clipboard API的使用
在操作系统级别,剪贴板允许应用程序之间传输数据。 在现代web应用中,提供 复制、 剪切、 粘贴等与剪贴板交互的功能已成为标配,极大的提高了用户的便利性。
一文掌握:利用Windows剪贴板与clipbrd工具提升工作生产力的实战指南
简介:Windows剪贴板是操作系统中用于不同程序间传递信息的核心组件。本文将介绍其基本概念、格式多样性、clipbrd工具的功能及使用方法,以及HTML FORMAT与剪贴板的交互。剪贴板工具对于开发者、故障排查和用户体验研究等场景
Freemarker用户求助帖:导出的Word文件为何在手机和服务器上全部宕机?”
至于流程和步骤就不写了,主要是记录我导出时粗心遇到的问题 本地导出xml格式的文件 原因是因为获取xml文件方式不同,我一开始是用的改后缀为zip格式然后找到xml文件再改成ftl文件,但是那样获取的xml文件会缺少特别
Freemarker用户心声:导出的Word文档为何会在不同设备上演异象?
至于流程和步骤就不写了,主要是记录我导出时粗心遇到的问题 本地导出xml格式的文件 原因是因为获取xml文件方式不同,我一开始是用的改后缀为zip格式然后找到xml文件再改成ftl文件,但是那样获取的xml文件会缺少特别
即时更新:厂里Flash中心的最热文章,深度剖析Adobe Flash Player的前沿技术
1 今日内容 1.1 定时计算与实时计算 1.2 今日内容 kafkaStream 什么是流式计算 kafkaStream概述 kafkaStream入门案例
硬盘坏了,数据要凉凉了吗?——硬盘坏道数据恢复,找回丢失数据的希望!
电脑硬盘坏了数据可以恢复吗?对于这种问题,还需要具体问题具体分析的,一般是可以恢复。 硬盘损坏可以分为物理损坏和逻辑损坏两种情况: 1.逻辑损坏 这通常是由于软件问题,如文件系统错误、病毒攻击、误删除、格式化等
机械硬盘损坏,数据还能起死回生吗?揭秘数据恢复秘籍
电脑硬盘坏了数据可以恢复吗?对于这种问题,还需要具体问题具体分析的,一般是可以恢复。 硬盘损坏可以分为物理损坏和逻辑损坏两种情况: 1.逻辑损坏 这通常是由于软件问题,如文件系统错误、病毒攻击、误删除、格式化等
深度解读硬盘性能排行榜,助你选购顶级硬盘!
硬盘天梯排行榜数据集成指南 引言 硬盘天梯排行榜数据为开发者和企业提供了硬盘性能的权威参考,涵盖SSD、HDD等各类存储设备的读写速度、耐用性、性价比等关键指标。通过API集成这些数据,用户可以快速获取最新的硬盘排名信
SWF硬盘测评汇总:帮你选到最合适的硬盘
硬盘天梯排行榜数据集成指南 引言 硬盘天梯排行榜数据为开发者和企业提供了硬盘性能的权威参考,涵盖SSD、HDD等各类存储设备的读写速度、耐用性、性价比等关键指标。通过API集成这些数据,用户可以快速获取最新的硬盘排名信
玩转Windows Phone 8.1应用设置:_applicationdatacontainer_localsettings全解析
最近正好有机会看到林政老师的Windows Phone 8,1的书,正好我平时都是基于用户控件之类的写写使用收获,虽然 编程中基本上都用过应用数据之类的知识,但是一直没整理过,知识越来越多,东西也越来越杂,有时候过
深入I.MX6U:Linux启动方式的实战指南
第九章I.MX6U启动方式详解 I.MX6U支持多种启动方式以及启动设备,比如可以从SDEMMC、NAND Flash、QSPI Flash等启动。用户可以根据实际情况,选择合适的启动设备。不同的启动方式其启动方式和启动要求
启动之路:深入ARM I.MX6ULL的内部机制 - 内部BOOT ROM、IVT、Boot Data、DCD与led.bin揭秘
参考:Linux之ARM(IMX6U)裸机之I.MX6ULL镜像烧写以及启动头文件的详解作者:一只青木呀发布时间: 2020-08-09 17:10:00网址:BOOT R
从易丢失到易找回,EasyRecovery助力恢复安装包
平时在工作或者学习中遇到好用的软件我都会跟朋友分享,所以电脑中也就保存了许多安装包。但是最近发现有些安装包在清理电脑的时候被误删了,这可真让人头大。之前用数据恢复软件EasyRecovery恢复过文档、照片以及音频等。于是这次我决定用
发表评论