技术标签: python识别图片对象
介绍
对象检测是一种属于计算机视觉领域的技术。它处理识别和跟踪图像和视频中存在的对象。物体检测具有多种应用,例如面部检测,车辆检测,行人计数,自动驾驶汽车,安全系统等。
对象检测的两个主要目标包括:
识别图像中存在的所有对象
筛选出关注的对象
在本文中,您将看到如何在Python中执行对象检测。
用于对象检测的深度学习
深度学习技术已被证明可解决各种物体检测问题。
我们将了解ImageAI的确切含义以及如何使用它执行对象检测。
图像AI
ImageAI是一个Python库,旨在使开发人员能够使用几行简单的代码来构建具有独立的深度学习和计算机视觉功能的应用程序和系统。ImageAI包含Python实现的几乎所有最新的深度学习算法,例如TinyYOLOv3。
ImageAI利用了几种脱机工作的API-它具有对象检测,视频检测和对象跟踪API,无需访问互联网即可调用它们。ImageAI利用了预先训练的模型,可以轻松地进行定制。
设置环境
要使用ImageAI,您需要安装一些依赖项。第一步是在计算机上安装Python。
TensorFlow
$ pip install tensorflow
OpenCV
$ pip install opencv-python
$ pip install keras
$ pip install imageAI
现在下载TinyYOLOv3模型文件,该文件包含将用于对象检测的分类模型。
使用ImageAI执行对象检测
现在,让我们看看如何实际使用ImageAI库。我将逐步解释如何使用ImageAI构建第一个对象检测模型。
第1步
我们的第一个任务是创建必要的文件夹。对于本教程,我们需要以下文件夹:
对象检测:根文件夹
模型:存储预先训练的模型
输入:存储要在其上执行对象检测的图像文件
输出:存储带有检测到的对象的图像文件
创建文件夹后,Object detection文件夹应包含以下子文件夹:
├── input
├── models
└── output
3 directories, 0 files
第2步
打开用于编写Python代码的首选文本编辑器,然后创建一个新文件detector.py。
第三步
ObjectDetection从ImageAI库导入类。
from imageai.Detection import ObjectDetection
第四步
现在,您已经导入了imageAI库和ObjectDetection该类,下一步是创建该类的实例ObjectDetection,如下所示:
detector = ObjectDetection()
第5步
让我们从输入图像,输出图像和模型指定路径。
model_path = "./models/yolo-tiny.h5"
input_path = "./input/test45.jpg"
output_path = "./output/newimage.jpg"
第6步
我们现在可以从该类中调用各种函数。该类包含以下功能调用预先训练模式:setModelTypeAsRetinaNet(),setModelTypeAsYOLOv3(),和setModelTypeAsTinyYOLOv3()。
就本教程而言,我将使用预训练的TinyYOLOv3模型,因此,我们将使用该setModelTypeAsTinyYOLOv3()函数加载模型。
detector.setModelTypeAsTinyYOLOv3()
步骤7
接下来,我们将调用函数setModelPath()。此函数接受一个字符串,其中包含预训练模型的路径:
detector.setModelPath(model_path)
步骤8
此步骤loadModel()从detector实例中调用函数。它使用setModelPath()类方法从上面指定的路径加载模型。
detector.loadModel()
步骤9
要检测图像中的对象,我们需要detectObjectsFromImage使用detector在上一节中创建的对象来调用函数。
此函数需要两个参数:input_image和output_image_path。input_image是我们正在检测的图像所在的路径,而output_image_path参数是将图像与检测到的对象一起存储的路径。此函数返回一个字典,其中包含图像中检测到的所有对象的名称和百分比概率。
detection = detector.detectObjectsFromImage(input_image=input_path, output_image_path=output_path)
第10步
可以通过遍历字典中的每个项目来访问字典项目。
for eachItem in detection:
print(eachItem["name"] , " : ", eachItem["percentage_probability"])
在输出中,您可以看到每个检测到的对象的名称及其百分比概率,如下所示:
输出
car : 54.72719073295593
car : 58.94589424133301
car : 62.59384751319885
car : 74.07448291778564
car : 91.10507369041443
car : 97.26507663726807
car : 97.55765795707703
person : 53.6459743976593
person : 56.59831762313843
person : 72.28181958198547
原始图片:
原始图像“ test45”如下所示:
带有对象检测的图像:
检测到对象后,生成的图像如下所示:
可以看到ImageAI在图像中成功识别了汽车和人员。
结论
对象检测是最常见的计算机视觉任务之一。本文通过示例说明如何使用ImageAI库在Python中执行对象检测。
如果您有任何疑问,请在下面发表评论。
文章浏览阅读7.1k次,点赞19次,收藏49次。JDK1.5之后,新增了自动拆、装箱功能,如以前创建一个Integer对象,需要 使用 “new”关键字;而现在Java中可以直接赋值如下:Integer不是new出Integer对象,而是直接赋值,就是自动装箱过程。Integer a = new Integer("100");//JDK1.5之后Integer b = 100;int x = b;再来测试如下代码:public class IntegerTest { public static void main._integer缓存范围
文章浏览阅读3.1k次。化工厂、电厂、煤矿等是生产安全重点单位,对人员定位管理需求强烈。这些企业对人员定位主要需求是:一般区域人数统计、人员轨迹、重点区域人员实时精准定位。针对这些工业企业的人员定位项目建设选取的技术方案通常有:基于蓝牙+LORA技术的定位方案基于UWB精准定位技术的定位方案3、基于RFID技术的区域定位方案但是这两种方案各有利弊。一、蓝牙+Lora技术方案分析蓝牙+Lora定位技术方案的核心设计思路是通过蓝牙作为位置信标点,人员卡片由蓝牙数据接收模块与lora通信模块构成,蓝牙数据接收模块接收发射_人员三种方案对比分析
文章浏览阅读2.6k次。一、 常用的坐标系1. Android View 坐标系2. opengl坐标系中采用的是3维坐标: static final float COORD[] = { -1.0f, -1.0f, //1 1.0f, -1.0f, //2 -1.0f, 1.0f, //3 1.0f, 1.0f, //4 };坐标原点默..._opengl 坐标后面有个f
文章浏览阅读10w+次,点赞26次,收藏79次。定时关机:Win+R 输入命令:①倒计时关机: shutdown -s -t 3600:在一小时后关机 ②取消关机命令:shutdown -a_定时关机命令
文章浏览阅读5.2k次,点赞17次,收藏46次。什么是shader?unity当中的shader是什么?_unity shader
文章浏览阅读710次,点赞8次,收藏4次。企业在选择AWS服务前,首先需要明确自身的业务特点和IT需求,包括计算资源、存储空间、网络带宽等。企业需要了解AWS提供的安全机制,如数据加密、访问控制、安全组等,并确保它们满足自身的安全合规要求。可靠的服务质量是企业选择云计算服务的重中之重。企业需要了解AWS的服务等级协议(SLA),包括可用性承诺、响应时间等指标,并评估是否符合自身的业务需求。总之,选购AWS服务需要全方位地考虑企业的业务需求、成本预算、安全合规、服务可靠性以及迁移成本等因素,只有做好这些充分的评估,企业才能选择最佳的AWS解决方案。
文章浏览阅读1k次。实现功能:创建队列的脚本,在81人行端执行#!/bin/bash#创建队列的脚本,在81人行端执行./etc/profile.~/.bashrc#运行前按需修改:队列管理器名称、机构代码、机构名称、IP!!!# 本机MQ队列管理器名称生产:QM_FTZMIS_0900_01测试:QM_FTZMIS_TEST_0900_01QMNAME=QM_FTZMIS_10000_01# 金融机构12位编码JGBM=99999# 金融机构名称JGMC=BeiJi..._shell脚本编写,创建topic
文章浏览阅读115次。简单的连接数据库类1.[文件] DBHelper.java~3KB 下载(28)package sns.team6.util;import java.sql.Connection;import java.sql.DriverManager;import java.sql.PreparedStatement;import java.sql.ResultSet;import java.sq..._java程序与mysql
文章浏览阅读5.1k次。unity3d中的物体,在Scene窗口中可以看到,而在Game窗口中看不到的原因:多半是因为物体所属Layer与照相机的culling mask不一致导致的,或者超出照相机的可视范围。如果游戏中有多个相机,每个相机都有自己的可视范围和culling mask,物体在移动的过程中,进入不同的相机,其可见性可能是变化的,取决与物体所属Layer与当前相机是否一致 转载..._物体所属layer与照相机的culling mask不一致导致的,或者超出照相机的可视范围
文章浏览阅读1k次,点赞21次,收藏20次。他们降低了基础层的对比度,同时保留了细节层。前三种方法不能很好地保留明亮区域的细节,但我们的方法不仅保留了大量的视觉内容,而且显示出良好的整体外观,这比其他方法有竞争力或更好。尽管可以从不同曝光的照片中获得包含真实场景的全动态范围的高动态范围(HDR)图像[3],但诸如普通监视器之类的低动态范围(LDR)显示设备不能处理场景的全动力学范围。引导滤波器的半径r和正则化参数ε的值与减少光晕伪影和保持局部对比度保持平衡,非线性控制参数λ的值确保了对场景内容的适当考虑,对比度控制参数η的值提供了适当的整体对比度。_hsv hdr
文章浏览阅读1.4k次。给出一个由O和X组成的串(长度为1~80),统计得分。每个O的分数为目前连续出现的O的个数,X的得分为0。例如,OOXXOXXOOO的得分为1+2+0+0+1+0+0+1+2+3。 分析:此题很简单,两个变量一个用于记录当前O的分数,另外一个变量用来累加分数。#define MAX 100#include #includeint main()_给出一个由o和x组成的串,统计得分
文章浏览阅读1.8w次,点赞14次,收藏27次。因业务需要部署分布式存储,新分配了三台RHE机器,在部署安装MFS时,make阶段出现以下错误提示:错误提示:CDPATH="${ZSH_VERSION+.}:" && cd . && /bin/sh /home/agssvYX/moosefs-3.0/moosefs-3.0/missing aclocal-1.15 -I m4/home/agssvYX/moo..._aclocal-1.15 is missing