时间:2022-05-02 05:19:48
导言:作为写作爱好者,不可错过为您精心挑选的1篇计算机视觉论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
现阶段,我国的市面上有很多不同的方法来进行机械零件尺寸的测量和研究,采取不同的测量办法,得出的结果也有着精确度的差异。原始的测量方法是人们通过借助各种测量仪器,如万能工具显微镜和三坐标测量机等,进行人工测量操作。这种方式存在着很多弊端,而计算机视觉检测技术的应用则可以很好地解决这一问题。所谓视觉检测就是检测被测目标时,把图像当作检测和传递信息的手段或载体加以利用的检测方法,其目的是从图像中提取有用的信号,它是以现代光学为基础,融光电子学、计算机图像学、信息处理、计算机视觉等科学技术为一体的现代检测技术。由于计算机视觉系统可以快速获取大量信息,而且易于与设计信息及加工控制信息集成,基于视觉检测技术的仪器设备能够实现智能化、数字化、小型化、网络化和多功能化,具备在线检测、实时分析、实时控制的能力在军事、工业、商业、医学等领域得到广泛关注和应用。
一、计算机视觉检测技术含义
计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。
二、计算机视觉检测的基本原理
要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computer vision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。
作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。
三、亚像素检测技术
随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。
边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。
四、计算机视觉检测技术在机加工零件检测中的应用要素与过程
(一)曲阵CCD相机
面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。
(二)工业定焦镜头
在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。
(三)数字图像采集卡
随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。
(四)标定板
为提高测量精度,需要进行摄像机标定。标定过程中,采用NANO公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。
(五)背光源
背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。
五、结语
随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。
摘要:随着商品种类的不断丰富和信息化管理手段的应用普及,条形码作为现代生产、物流和销售各环节的重要信息化手段之一,它的应用也日益广泛,而且,随着我国对食品和药品安全问题的重视,条码作为追溯码也开始被用于食品药品追溯领域。如何对条形码中的信息进行提取就变得非常重要了。本文在这样的背景下针对乳品企业的产品可追溯问题,设计了一套可用于乳品追溯的包装条码计算机视觉识别系统。
关键词:条码;乳品包装;条码识别;计算机视觉
本系统硬件部分采用面阵摄像机、工控机构成,软件部分采用C#语言和OpenCV软件进行开发,采用EF Model(实体框架)作为程序框架,通过搭建好的视频采集系统,利用外触发启动摄像机采集图像,经过图像预处理、识别区域的检测和定位后,提取出待识别图像,对于待识别图像中的条码和数字,分别采用相似边距离方法进行一维码识别、采用逐行扫描法进行二维码识别,并利用模型匹配进行数字识别。
本系统可综合识别条码以及数字识别,实验表明本系统具有较好的识别效率和识别精度,可以满足一般条件下的包装条码计算机识别,并且已在乳品可追溯方面取得应用。
1 概述
在数不胜数的新型计算机科学技术出现之后,条形码技术俨然已经成为了最为经济实用的一种自动识别技术。随着时代的不断发展和用户需求的不断扩展,各种各样的商品出现在我们生活中[1]。虽然条形码的技术发展的炉火纯青,但是随着条形码的不断变化和创新,识别包装条形码技术已然成为我们现在需要不断研究的课题。
条形码的出现无疑给我们的生活带来了方便,但τ谡飧隹焖俜⒄沟氖贝,对其识别的技术的效率还需要我们进行大量的研究和开发。这也是开发本系统的初衷。对于本系统来说,它既要满足对条形码的检测,图像提取,校正等功能的实现,又要实现所有程序自动化的功能。该系统主要应用于对海河食品包装的识别。该系统利用外触发器,实现将视频转化到静态图片的功能,同时通过后台处理快速地找到该静态图片中条形码的位置并对提取的条形码以图片的形式存储,然后对条形码图片进行识别。
2 条形码定位
2.1 图像采集
采集方式是利用相机和触发器采取图像,DirectX以流的方式读取播放视频。
2.2 图像预处理[2]
OpenCV现在利用Mat类来表示图像,在此基础上进行图像的灰度化处理[3],在灰度处理基础上,进行图像梯度化[4]。就是把图像作为二维离散函数。梯度化过程就是对该函数求导的过程。图像边缘的确定大多都是通过图像梯度化处理来实现的。梯度化方向[5],分水平方向梯度计算和垂直方向梯度计算,或者是振幅计算。在进行检测前,还要使用Scharr算子先确定边缘像素[6]的位置。接下来进行图像二值化,所有的像素点的像素值设置为0或者255。最后,采用开运算算法进行形态化处理。
2.3 条码检测
本系统使用Vecor容器用于存放面积;findContours函数对二值图像中的轮廓进行检测;Point用来表示坐标为整数的二维点;Rect方法:用于提取旋转的矩形图案;angle检查这个矩形的偏斜角度;将提取的矩形轮廓标记在图片上并剪截下来进行保存。
2.4 二维码提取
相对应一维码,二维码在译码之前需要先对二维码进行分割,再进行边缘检测。采用区域增长的方法修正边界。二维码是正方形形态,我们也要对其进行图形区域的旋转处理,利用Hough变换来进行处理利用二维图像的投影变换。然后对拍摄的图像进行Hough变换,根据4条边界线进行位置旋转。也可以使用仿射变换。即先对一个向量空间进行一次线性变换并根据该变化做出相对性的平移,使其变成另一个向量空间。该变化方法包括水平的平移、图像的缩放、图像的旋转等功能。
2.5 数字定位方法
商品包装上的条码一般都是预印刷的,许多商品的生成日期和使用日期也需要入库进行保存,但是由于条码印刷成本较高,所以厂家通常采用的方式是以数字形式将商品的生成日期和使用日期印刷在包装袋上。因而,本系统添加了数字识别功能。数字技术识别的主要核心字符分割技术:切割数字区域后,进行字符的切割,由于该图像还是灰度图像,所以我们在切割前还要进行一些图像处理。具体过程:灰度拉伸、二值化、倾斜校正以及字符分割。图像以海河牛奶的包装袋为例。由于信息过多,一个条形码无法将全部信息存储,所以会在包装正面的空白位置加些数字,以此来完善条形码内容不足的地方。
具体分割算法如图1所示。将截取后的整个图片进行自上而下的逐行对比,提取黑色的字符部分,直到整幅图像完毕。已列为高度基准进行扫描,进行从左到右依次排查,直到全部图片扫面完毕。由于印刷问题,数字区域可能有小圆点,采用的是比例方法运算将这些小点清除,把每个切割后的图像的宽度均除以未切割前的图像的宽度,设立一个最小的商值。如果小于该商值,将其以噪声方式清除。最后对字符进行了加框和归一化处理。上述所切割的图像大小是根据字符的最高和最低的值进行的切割,所以我们得到的结果并不是很准确,我们要将每个字符再进行进一步的确定,所以要多进行几次从第一个步骤到第三个步骤的运算。这样我们得到的才是该字符的准确范围。
3 条形码识别
3.1 一维码识别
一维码储存的信息是由条和空的宽度以及所在的位置来传递的。以EAN-13码为例。一维条形码的条和空的数量越多,它就越宽,储存的数据量就越多,由于一维码是由条和空组成的,将信息变化成二进制或者十进制的数字。
本系统对于一维码识别采用的方法是相似边距离方法,利用相似法识别一维码[6]:根据算法进行字符的扫描和识别,定义:C1和C3表示相邻条的宽度,C2和C4表示空的宽度,T表示整个字符的宽度,T1和T2为相似边的距离。用算法取得值JTj(j=1,2)来进行T1与T2的归一化处理。
3.2 二维码识别
二维码是按照一定的规律在平面上分布的黑色与白色相间的图形记录符号。识别二位码[7]需先定位图案,再是功能性数据,识别由数据码和纠错码共同组成的数据信息。
定位图案:我们通常定位二维码是根据左上角、右上角以及左下角三个位置定位的。以其中一个图形为例,我们可以将其看作分别为7*7、5*5和3*3三个模块。三个之间比例为1:1:3:1:1。扫描:用一个直线逐行扫描二维码,该线被截为1:1:3:1:1时截取。误差在0.5之间在列方向,也用相同的方法进行二维码定位扫描。我们通常定位二维码是根据图上的三个位置定位的。
3.3 数字识别
数字识别[8]部分已经超出了我们图像处理的范围依据了,属于模式识别,由于我们已经对图片进行了分割,所以我们只需通过其特征进行分类与识别。采用的是逐像素取法方法[9],具体操作就是对图片M行每行每列的依次查找,遇到的黑点时,将其像素值设为“1”,其他为“0”,全部扫描结束后,将提取的个数相同的像素,放在特征矩阵里。将特征信息,输入到分类器中,进行分类处理,从而得出结果。再进行采取模块匹配,事先做好海河包装上的图像中字符的图像采集,然后建立一个图片模板识别库。当我们进行字符识别时,就将模板取出来依次对比,把与字符特征对比的结果的矢量求出加权距离。则最小的结果就是识别的结果。如图2所示。
摘 要
近年来,经济的发展和人们生活水平的提升也使得人们的出行更加便捷,越来越多的人都是自己驾车出行,这样导致公路上的交通流量不断增加,如何保障交通的顺畅性和安全性成为人们关注的重点问题。信息技术的发展推动了计算机视觉技术的出现,为交通安全性的提升提供了一定的保障。本文主要对计算机视觉技术进行分析,进一步探讨计算机视觉技术在智能交通系统中的应用。
【关键词】计算机 视觉技术 智能交通 系统 应用
智能交通系统简称ITS,这是一种新型的交通管理系统。该系统主要结合了信息化技术、计算机技术以及数据传输技术等多种技术,用来对整个交通运输体系进行管理,可以实现人、车、路的全面监控和管理。计算机视觉艺术作为智能交通系统中的一个重要环节,受到相关工作人员的高度重视。随着计算机视觉技术的发展,不仅为交通行业的发展提供了更多的便捷,同时还能够筛选道路交通的各种信息,进一步增强了智能交通系统的灵活性和准确性。
1 计算机视觉技术的概述
计算机视觉也被称为图像分析和图解理解,其包括的理论主要有摄影几何学、概率论、图像处理理论以及人工智能理论等部分。计算机视觉技术主要是用二维投影图像实现三维物体重构。这种技术的应用范围比较广泛,不仅应用于二维图像识别方面,同时还用于三维物体的识别和重建上面。通过计算机视觉技术能够获取专业化的三维信息,对三维信息的获取一般有两种方法,其中一种是直接获取法,还有一种是间接获取法。直接获取法主要是通过计算机视觉技术的效果来确定三维运动中产生的各种参数,这一过程对摄像机运动问题的关注程度较高;间接获取的方式就是将单幅图像和摄像机焦距相结合,来判断被测量位置视觉上的信息。计算机视觉技术的关键就是实现特别匹配,在特殊情况下可以利用不同的摄像C同时收集运动信息,从而提高相关控制的精确度。
2 计算机视觉技术在智能交通系统中的应用
计算机视觉技术在智能交通系统中的应用可以实现道路交通的监控,同时还能够实现自动收费、智能导航等功能,主要应用有以下几个方面的内容。
2.1 交通监控中对计算机视觉技术的应用
基于计算机视觉技术的交通监控系统主要分为三个步骤,首先是对车辆和行人进行跟踪和分割,其次是对车流量进行分析和计算,并且计算车辆的平均速度和道路上车辆的队列长度,最后根据道路的交通状况来规划形式线路,从而有效缓解道路交通拥堵的现状,方便人们减少出行时间。车辆和行人作为道路中运动的主要目标,在监控场合下,需要对运动时间进行有效分割,常用到的分割方式包括光流法和帧差法两种,其中前一种分割方式主要是依据图像中不同的运动用映射参数正确的表达,这样可以将具有同样映射参数的光流量进行分配,从而完成参数分割。计算机视觉在交通监控中的应用主要是对车辆速度、车辆数目、车辆分类进行检测。随着计算机通信技术的发展,计算机视觉技术也是日新月异,基于计算机视觉的交通监控系统具有较强的实时工作性,能够快速的适应高度公路以及城市道路交通的监控。
2.2 车辆导航中对计算机视觉技术的应用
实现车辆的智能导航是计算机视觉技术在智能交通中应用的典型案例。这种技术主要为驾驶人员提供道路信息和车辆运行状况两大信息。通过车辆智能导航系统的运行能够对道路两边的界限进行有效的识别,将车辆引向规定的行驶车道,在车辆行驶过程中,该系统能够自动检测车辆与前方其他车辆之间的距离,从而提醒驾驶人员保持车辆的安全距离,最终实现安全导航驾驶。通过该系统的摄像机运动能够识别其他车辆的行驶状况,并且通过计算检测点的方式计算车辆的模拟匹配点。车俩智能导航系统中就使用了计算机视觉技术,可以从中提取相关信息,计算车辆行驶的安全距离和速度。
2.3 计算机视觉技术用于车辆辅助驾驶
计算机视觉技术在车辆辅助驾驶中的应用主要是帮助驾驶人员对外界的变化做出反应。具体表现为车辆在市内行驶时,计算机视觉技术的应用能够识别周边道路的标记,并且对交通标志、其他车辆和行人进行识别,然后筛选相关信息进行计算,让驾驶人清楚外界的具体状况,从而避开其他的车辆和行人,能够从根本上减少交通事故的发生,增强车辆的安全运行。辅助驾驶的形式转变为人机交互的方式,一定程度上能够满足驾驶人员对信息的需求。
2.4 计算机视觉技术用于车辆智能收费
车辆收费是车辆在公共交通位置行驶中的一个关键环节。随着科学技术的发展,车辆收费系统逐渐向着计算机技术的应用方向发展,计算机视觉技术在各地区交通发展中的应用是现代化交通发展的一个重要突破口。很多地区的智能化收费都是通过识别车牌的方式来实现收费,我国在车牌识别这方面仅仅限制于单目车牌和双目车牌的识别,其中单目车牌识别的核心就是将车牌照位置作为核心部分,我国大部分地区都是将单目系统作为核心部分来使用。采用双目系统对车牌进行识别,也可以对车辆的型号进行识别,通过大量的实践发现,双目系统进行车牌识别的实用性较强。但是这种识别方式在实际应用过程中仍然存在着信息获取难度大、车牌照定位难度大等多种问题,尤其是车辆在高速路上行驶时,对于车牌信息的获取更为困难,因此,在这方面还需要加大研究和实践。
3 结束语
随着计算机视觉技术的智能化发展,其在智能交通系统中的应用能够解决多方面的问题。该技术的应用不仅能够实现车辆的实时监控,同时还能够实现车辆导航以及车辆收费,帮助驾驶人员识别车辆行驶中存在的障碍物,这样一来,可以增强车辆行驶的安全性,同时还能够提高我国道路交通系统的整体管理水平。但是该技术应用中也存在不足之处,未来发展中需要降低视觉系统的价格,减少系统的尺寸,从而增强系统对车辆信息的处理速度,最终实现对道路交通的全面监测。
摘 要:在科技的带动下,计算机图形学、计算机视觉与可视化技术得以快速发展,并被应用到各个领域,随着它们的应用,极大的推动了现代社会发展。为进一步了解这些技术,充分发挥其应有作用,本文将对计算机图形学、计算机视觉以及可视化技术展开研究,希望能为相关人士带来有效参考。
关键词:计算机图形学;计算机视觉;可视化技术
计算机图形学、计算机视觉以及可视化技术三者均是计算机领域重要组成部分,要做好计算机知识,就要先学好计算机图形学,但计算机图形学学习相对枯燥,尤其是算法教学难以理解,为解决这一问题,计算机视觉与可视化技术被应用到计算机图形学中。可见,三者之间存在一定的联系,因此,有必要对计算机图形学、计算机视觉以及可视化技术展开研究。
1 计算机图形学概述
1.1 计算机图形学目的
所谓的计算机图形学实际上就是怎样利用计算机表示图形,并利用计算机完成图形计算与处理,而这一过程的实现需要得到相关算法的支持。学习计算机图形学的目的是利用计算机技术为人们呈现既带有美感又不缺真实的图形(如下图1所示),为实现这一目标,就需要按照图形的要求创设合适的场景,并在一些光照模型的作用下,做好光照效果设计,在这一过程中需要计算机图形学能够与其他计算机技术相配合。经过计算机图形学出来的图像,多会以数字图像的方式展示出来,总的来说,计算机图形学与图像处理之间存在着一定的联系[1]。计算机图形学的涉及范围相对宽泛,不仅有图形硬件设计,还包括动画制作,虚拟现实等多个部分。此外,计算机图形学在动画制作中的应用频率也很高,如45分钟一集的动画影片中,85%的画面都需要用算机图形学来完成,由此可见,计算机图形学的应用频率极高,并在动画制作中发挥着不可替代的作用。因此,应重视计算机图形学的应用。
1.2 计算机图形学应用
随着计算机图形学的发展,它被应用到各个领域中,并发挥着重要作用。首先,在计算机辅助设计与制造中的应用,这是计算机图形学应用最多的领域,在计算机图形学被应用以后,不仅可以设计出更精准的图形,还能做好人机交互设计,强化修改能力。计算机图形学还被应用到三维形体重建中,利用该技术可以将原理的二维信息转化为三维信息,如在某次工程图纸设计中就应用了计算机图形学,经过一系列的处理以后,三维形体逐渐形成,最终实现了重建。其次,在医学领域中的应用。计算机图形学在医学领域中的应用多以计算可视化的形式展示出来,如在脑部手术中,医生为看清患处真实情况,经常需要利用在可视化技术的作用下将复杂的数据转化为图像,这时就体现了计算机图形学在其中的应用[2]。再者,在计算机动画中的应用,人们看到的动画影片就是计算机图形学作用的结果,以动画人物的行走为例,为保证动画人物的行走与自然人不存在过大差异,就需要应用大量的计算机技术,并在计算机图形学的作用下完成设计。最后,在计算机艺术中的应用。计算机图形学在计算机艺术中也有广泛应用,它不仅可以用于艺术制作,很多场景都是通过计算机图形学来完成的,现阶段,一些人正在利用计算机图形学创设人体模拟系统,其目的是让已故人士再次出现在荧屏上,这一目标的实现就需要得到计算机图形学的支持。
2 计算机视觉技术
2.1 计算机视觉技术含义
所谓的计算机视觉技术,实际上就是用计算机取代人眼做识别、跟踪以及测量等,同时也兼顾图形处理,其目的是让图像在计算机被处理以后更适于识别。对于计算机视觉技术来说,意在实现人工智能,主要是从图像与多维数据等方面实现人工智能系统设计[3]。计算机视觉是一种在相关理论与模型基础上发展起来的视觉系统,其主要构成部分有以下几种:
(1)程序控制,这一点主要体现在机器人设计上;(2)事件检测,多体现在图像监测上;(3)信息组织,主要体现在图像数据库等方面。计算机视觉三个阶段如图2所示,通过观察图1可以发现,计算机视觉存在于图像处理始终,从早期处理直到后期结束都存在,最终实现了3D描述,可见,计算机视觉具有十分重要的作用[4]。
2.2 计算机视觉技术的应用
现阶段,现代社会已经进入信息化时代,计算机技术也被应用到各个领域,并发挥着重要作用。计算机视觉的应用促使计算机实现了智能化,在该技术的支持下,计算机可以像人一样透过视觉看待世界万物,且具有良好的适应能力,但这一目标的实现还需要很长时间,需要一系列的努力才能实现。现阶段,计算机视觉应用最多的就是车辆视觉导航,然而,这种导航还没有实现完全自主导航,这也是需要进一步研究的地方。计算机视觉技术的适应性较好,特别适合在工业领域应用,即便是存在电子在干扰或温度变化较大的地方都能很好的运行,其整体效果也不会受到影响,再者,计算机视觉技术的嵌入性较好,成本相对较低,尤其适合在PC方案中使用,同时,具有一定的非接触能力,能够获取大量信息,且不受距离限制,总的来说,计算机视觉技术总体效果较好,适合利用在各种工业环境中应用,因此,应重视计算机视觉技术的应用[5]。同时计算机视觉还被应用到移动机器人设计中,主要是利用小波模板展示人体形态,然后做图像扫描,这样就可以顺利完成小波变换,进而了解到人的存在。同样,将计算机视觉应用到机器人设计上,可以自动检测出正在行动的人或车辆,而无法检测到静止的人,之所以会出现这样情况,主要是由于其中采用率步态分析法。
3 可视化技术
3.1 可视化技术含义
可视化技术是一种综合了计算机图形学与图像处理于一体的技术,它可以将复杂的数据转化为图像并在屏幕上展示出来。在可视化技术中,融合了以上两种技术的特点,并在多个领域都有应用,随着可视化技术的应用,不仅有效实现了数据表示,还强化了数据处理能力,更对数据决策分析有一定作用[6]。现阶段,虚拟现实技术已经成为可视化技术主要发展方向。
3.2 可视化技术的应用
首先,在计算机图形学教学中的应用,计算机图形学相对枯燥,相关知识也很抽象,不便于学生理解,在计算机图形学中最重要的部分是曲线曲面,而这些曲线曲面多是与数学模型有关,具有一定的抽象性,学生理解难度较大,以往教师只能通过一系列的公式演算帮助学生理解,尽管这样依然难以让学生掌握曲线变化情况,学生依旧无法正确理解。为减少这种情况的发生,可视化技术被应用到计算机图形学教学中,教师将抽象的知识用动画的形式展示出来,学生只要观看动画,拖动一定的控制点就可以了解到曲线变化情况,这样一来不仅增加了教学趣味性,学生也可以随意变动曲线,让复杂的知识变得简单,深化学生对计算机图形学知识的深度理解,同时,利用可视化技术在一定条件下,还可以完成代码编译,如在Actoin ScriPt中做编译,这样也可以增强学生的理解能力[7]。
其次,在医学领域中的应用。医学领域对于可视化技术的应用主要体现在放射治疗与矫正手术上。通过可视化技术可以屏幕上看到手术整个过程,并将原来细节部位放大,手术医生观察的更加细致,手术成功几率也会大幅度提升,患者生命也能得到保证(如图3所示)。如在对某名患者进行身体检查的过程中需要应用到可视化技术,由于通过检查会获得大量数据,而这些数据又相对复杂,但在可视化技术下就可以通过图表、曲线图或立柱图的方式展示出来,经过可视化技术的作用,了解到患者的血糖为5.6mmol/L,医生可以根这一数据做出诊断,而不必再分析这些数据。据不完全统计,80%的医疗检查工作都是需要利用可视化技术。
地质勘探是我国最重要的工作之一,由于多数矿藏都深埋地下,即便使用探测仪受多种因素影响也无法了解到实际矿藏情况,这就需要应用到可视化技术,在可视化技术的作用下,相关工作人员可以了解到地下有无矿藏,如果存在矿藏,相关工作人员也可以了解到矿藏所在位置与实际储备量,进而为矿藏开采奠定基础。如在地质勘探中,相关工作人员利用可视化技术做地形图整理,然后从中提取地形数据,再用CATIA做导入,这样就可以完成地形模型创建,这样就完成了三维地质模型创建工作,同时在相关工作台的影响下,还可以完成地形数据导入,进而生成一定的地形云点,如果其中存在错误,可视化技术也可以将其中的错误内容删除,这些都是可视化技术所带来的好处[8]。由此可见,可视化技术已经成为地质勘探中不缺少的技术。
最后,在气象预报中的应用(如图4所示)。利用可视化技术能够将数据转化为图像,通过观察图像就可以了解到云层变化情况,同时也能了解到实际风力大小与风走向等,气象预报人员就可以根据图像做出精准分析,需要了解气象变化的人也能了解到现实情况,如果气象条件恶劣,相关工作人员也可以及时做出工作调整,减少危险事件的发生。据不完全统计,可视化技术在气象预报中的应用频率高达100%,由此挽回的经济损失高达13.2亿元,可见,可视化技术在气象预报中的应用十分有必要,因此,应重视可视化技术在气象预报中的应用。
4 结语
通过以上研究得知,计算机图形学、计算机视觉以及可视化技术三者各具特色,三者间也存在一定的关系,尤其是可视化技术综合了前两者的特点,并融合了其他技术,在很多领域中都有应用。可视化技术是现阶段应用最多的一种技术,在计算机图形学教学中也有应用,并发挥着不可替代的作用。本文分析了计算机图形学、计算机视觉以及可视化技术的含义与应用,希望能为相关人士带来有效参考,正确利用这些技术。
摘 要:用C、C++、Java等计算机语言编一个图像识别程序,常常需要借助一些图像处理的工具库,OpenCV就是其中之一,使用OpenCV要比使用计算机应用软件困难,需要前期复杂的准备工作,如果了解了OpenCV与其他图像处理应用软件的区别、学习OpenCV的基础、运行环境、图像操作原理以及OpenCV文档包含的内容,学习和使用OpenCV就会容易很多。
关键词:图像处理 OpenCV C
图像识别技术已经应用到生活中的许多方面。文字识别系统,直接把图片上的文字扫描成文本文档格式。人脸识别技术已经用到了智能手机之中,现在的手机解锁可以直接使用人脸识别。指文图像识别的应用更为广泛,如办理身份证、入学考试、驾照等用来确认身份。百度、Google、苹果等公司研究的无人驾驶汽车,将该技术用于对障碍物、路标、行人及其他车辆的判断。道路交通监控系统中,系统自动检索违规车辆,并对车辆的车牌等信息进行识别。通过车牌提取、图像预处理、特征提取、车牌字符识别等技术,识别车辆牌号,目前,字母和数字的识别率可达96%,汉字的识别率可达95% [1-2]。所有的这些都用到了图像识别功能,要编写图像识别程序使用OpenCV是一个不错的选择。
1 OpenCV简介
OpenCV是Intel公司于1999年推出的一种面向图像处理的开源计算机视觉库,其中,OpenCV是Open Source Computer Vision Library的缩写,如今由Willow Garage提供支持,其中包括了3个版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1现在很少使用外,其他两个版本已经有了很多改进的版本。OpenCV有开源的函数库,可以满足不同领域的图像处理需求,使用时以函数调用的形式提供给用户,也可以对其代码进行改进,便于用户实验教学或程序开发使用。
2 OpenCV的特点
(1)开源。OpenCV是一个开源的图像处理函数库,无论是商业应用,还是做科学研究,完全是免费的,与Linux类似它的源代码也是公开的,这样程序的安全性就得到保障,OpenCV的函数库是用C语言和C++语言进行编写的,源代码可读性比较高,发现其中不足之可以自行进行修改,避免编译后的可执行文件出现漏洞。
(2)跨平台。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Windows、Linux、Mac OS和嵌入式等操作系统上[3]。
(3)应用领域广。OpenCV图像处理可以使用到多个领域当中,包括生物医学、工业、军事安防、机器视觉、航空航天等。目前已知OpenCV编程系统在航空航天定位、卫星地图绘制、工厂大规模生产视觉检测等方面得到了广泛的应用,同时对于无人飞行器的视觉捕捉技术也有极大的帮助[4]。
(4)支持多种语言进行开发。OpenCV中包括了多种编程语言的接口,其中支持的编程语言包括C、C++、C#、Java、Python等。
3 OpenCV与图像处理应用软件
在计算机学习中也会学到一些其他的图像处理软件,如Photo Shop、Windows画图工具等在计算机中使用的图像处理工具。在手机中有一个比较流行的软件,在拍好照片后可以对个人照片进行智能美化,这些软件都是应用软件缺少编程需要的接口,这些软件处理图像后只是给出结果,无法取到程序处理所需要的中间参数,只能局限于最后的结果展示,如果只是单纯的图像制作, Photo Shop类的图像处理工具已经足够了。但是对于图像识别、机器视觉等,需要对图像内容做出判断,用类似于Photo Shop这样的图像处理软件就无法完成了,因为无法集成到所编写的程序当中。OpenCV是一个图像处理函数库,其中包涵了对于计算机操作系统和计算机语言编译平台支持的API接口以及源码库,可以在编写的程序中去处理图像,不但可以得到图像处理后的结果,还可以对图像中间的处理过程进行控制,可以对图像中的内容用自己编写的程序代码进行判定,实现识别操作。
4 学习OpenCV的基础
C和C++语言在工科类专业中一般设置必修课程,C语言常作为一门基础的编程语言来教,有的学生觉得C比较容易,有的学生感觉比较难,这个取决于每个人对计算机语言的理解能力与对计算机语言的兴趣,C和C++的区别在于C++增加了类,支持面向对象编程。新版OpenCV函数库是基于C++的,打开源代码的文件夹可以看到许多以.cpp结尾的C++代码文件,所以对于C和C++的掌握情况直接关系到对OpenCV的学习。
5 OpenCV的运行环境
在学习每种计算机语言之前都要对每种计算机语言的IDE(Integrated Development Environment,集成开发环境)进行安装和配置,集成开发环境不只是用来编辑程序代码,还包括了对代码的编译、调试与运行等。如Java语言,在Windows操作系统中Java语言最简单的编辑环境是记事本,对于Java的编译与运行需要用到命令窗调用所安装JDK(Java Development Kit,Java开发包)中的编译程序与运行环境,如果是集成的IDE,如Eclipse、MyEclipse等,点击IDE上的运行或是调试按钮,就可以在IDE中的结果输出窗口上直接查看运行结果。OpenCV是用C和C++语言所编写的图像处理函数库,它没有自己独立的IDE,所以它需要借助其他编程语言的IDE进行编写和调用,如Microsoft Visual Studio、QT Creator等。
配置开发环境是学习OpenCV中重要的一步,但是这个过程相对于初学者来说有些复杂。首先,要从网上下载并安装计算机语言的开发环境,如微软的Visual Studio、QT集成开发环境等。其次,下载并安装OpenCV的安装包,安装OpenCV是一个解压的过程。下一步,就是对开发环境的配置,其中要对系统变量、包含目录、附加依赖项进行配置。然后进行调试运行。在对开发环境配置时,为保证OpenCV库与本地开发环境兼容性更好,最好使用CMaker(Cross Platform Make)在本地环境中对OpenCV源代码重新编译。
6 OpenCV中的Hello World
在学习C或是java语言时,常常会有一个重要的标志就是‘Hello World!’,标志着系统配置完成并且整个IDE环境运行正常,编译系统成功的编译了所写的代码,并且在操作系统中执行成功。OpenCV中这个标志有所不同,它的‘Hello World!’是在IDE中写好代码后,调用OpenCV中的函数打开一幅代码中指定的图片并显示到新建的窗口中,标志着IDE中的参数是正确的,这是进行图像操作的重要一步。
7 OpenCV图像像素操作
对于数值的计算是第一步一般输出一个结果,在学任何一门计算机语言时会有一个很好的例子“计算器”,那图像如何去表示?其实图像是多个结果的一个集合,就像在C语言中打出星号所组成的菱形,每一个星号可以比喻成一个图像中的像素点。对于图像处理过程中常常见到的有3种:第一种,RGB图像,彩色的图像,每个像素点由3个数值表示。第二种,灰度图像,像以前的黑白电视机,每个像素点由一个数值就可以表示。第三种,二值图像,每个像素点由一个数值表示。在OpenCV中有多种方法可以对图像进行操作,其中比较方便的就是利用cv::Mat类,对图像进行打开、显示、修改和保存,这也是进行图像操作的重要一步。
8 OpenCV的文档
大家在OpenCV官网提供的文档中可以得到更多帮助。在OpenCV的文档中包括了对组件结构的介绍,了解OpenCV的组件结构对学习OpenCV是十分有利的,该介绍包括了一系列的动态或静态库,如矩阵数组的定义、图像处理模块包含的内容、视频分析所需要的算法、基本的多视觉算法、外部特征的检测类、物体的检测类、UI类的使用、图像算法的硬件加速等,在编写代码时可以查找其类中对象所包含成员和方法。一些OpenCV图书所带的光盘中或互联网上网友提供的图像处理代码,由于编程使用的操作系统或编译环境不同,有些代码会包含未知的头文件或者缺少头文件,代码本身并没有错误,但总是编译出错,了解了这些知识后在编程时,有利于定位在程序中所引用的文件所属的位置,从而有效地处理文件引用出现的问题。
无论对什么样的物体进行识别,图像识别过程基本是不变的,包括:图像预处理、图像分割,特征提取、判断匹配、输出结果。图像预处理中会用到图像的灰度化、图像的二值化、去除图像的噪声等算法。特征提取中会用到图像变换、图像边缘检测等算法。判断匹配中用到直方图、投影等算法。图像分割有3种:基于阈值的分割、基于区域分割、基于边缘的分割[5]。在OpenCV的文档中都详细提供了基本算法类的定义与方法,通过OpenCV的代码库中的基本算法类或几个基本算法类的组合可以实现以上所列算法的所有功能。
9 结语
据统计,一个人获取的信息大约有75%来自视觉。在工业4.0的时代里机器也需要有自己的视觉系统,基于图像处理的机器视觉在人工智能领域会得到更广泛的应用,如:无人驾驶汽车、智能机器人、智能安防系统等。OpenCV是一个进入这些行业的重要工具之一,图像处理的学习过程是一个循序渐进的过程,希望学习者在OpenCV的基础上提高对于图像处理的认识及对图像处理的技术水平。
摘 要: 在对比了传统运动车辆实时检测方法的基础上,提出了一种新的G?C二重差分法,将视频流中的某一当前帧与背景帧进行边缘检测,将两帧的结果相减,得到梯度差分,再将此结果与背景颜色差分结果进行“或”运算,提高了车辆存在判断的准确度,此算法可以准确检测出路面运动车辆存在同时有效消除车辆阴影的影响,为后续车辆运动速度的实时检测提供了有力保证。基于运动车辆检测的结果,在VC环境下进行了编程实现,自动检测出运动车辆的实时速度,测试结果表明该算法效果很好。
关键词: 计算机视觉; 车辆检测; 速度检测; 消除车辆阴影
0 引 言
计算机视觉(Computer Vision)主要研究如何运用照相机和计算机获取被拍摄对象的数据与信息,形象的说,就是给计算机安装上“眼睛”(照相机)和“大脑”(算法)。目前,计算机视觉技术的应用领域十分广泛,其在道路交通管理中的应用更是取得了很好的效果。随着科学技术的飞速发展,现代交通在经济发展中所起的作用越来越大,而交通现代化带来的问题也越来越多,诸如交通拥挤、交通事故频发、交通环境恶化等。在这样的大背景下,智能交通系统(Intelligent Traffic System,ITS)作为一种强有力的交通管理手段应运而生,其高效率的管理特点使其成为当今世界道路交通管理的发展趋势,而计算机视觉技术则是ITS的重要技术支持。
实时车辆运动速度检测是ITS对交通实施监测和管理的重要一环,对车辆速度的检测一方面可以监控超速等违章问题,减少交通事故的发生,另一方面可以根据车速判断道路拥挤程度,进而迅速采取措施,保证道路交通的安全和畅通,从而实现智能交通管理的目的。在上一代ITS中,实时车辆运动速度检测的方法主要有线圈检测、激光检测、雷达检测等,这些速度检测方法多多少少都存在一定的问题,如容易受路基状况、自然环境等的影响精度降低,而在新一代ITS中基于计算机视觉的车辆速度检测法则大大提高了测速的精度,这有赖于计算机有一个“超强大脑”,即好的算法。
1 运动车辆的检测
运动车辆的检测是实时运动车辆速度检测的基础,使计算机能够自动的把相机摄取的视频里的静止物体与运动物体区别开,并且自动提取出运动物体。所以,在研究实时车辆速度检测算法前,先要研究运动车辆的检测算法。
1.1 现有运动目标检测方法比较
目前,常用的运动车辆实时检测方法主要有帧间差分法和背景差分法。
1.2.2 预处理帧的颜色差分
由于无论车身像素值是否低于路面像素值,其梯度边缘必然存在,而交通路面一般都很平坦,除了车道线外检测不到边缘,将当前帧与路面背景模型均进行边缘检测,再将两个边缘图像按式(8)做差得到运动物体的边缘梯度差分图像:
3 实验结果与分析
笔者用实际拍摄的视频图像对上述算法进行了试验测试,实验时模拟实际交通摄像机的安装情况,使其固定不动,计算机处理的速度约为20 f/s。首先将视频中的某一帧进行边缘检测,与背景做梯度差分,并与背景颜色差分的结果进行“或”运算,最后对图像去噪并二值化,通过测试多种路况、天气和光照条件,试验结果显示该算法可以在阳光充足、遇到物体阴影明显的情况下准确地将运动车辆从视频的背景中提取出来,并能准确检测出车辆的速度,如图3所示。
4 结 语
计算视觉的应用提高了智能交通系统的准确性,本文在对比了传统运动车辆实时检测方法的基础上,提出了一种新的运动车辆实时速度检测算法,此算法与传统的算法相比,可以更加准确地检测出路面运动车辆的存在,同时有效消除车辆阴影的影响,为后续车辆运动速度的实时检测提供有力保证。基于运动车辆检测的结果,进行编程实现,可以自动检测出运动车辆的实时速度,测试结果表明该算法效果很好。
[摘 要]石材大板表面轮廓提取是石材加工生产过程中的重要步骤和关键工序。它对于实时优化切割不规则石材以及优化排版和下料具有决定性的作用,对于提高生产效率和石材利用率、节约石材资源具有重要意义。本文基于计算机视觉理论,研究了石材轮廓提取的算法。通过分析石材目标图像的灰度、颜色和纹理等特征,提出了石材轮廓提取算法,较准确的提取出石材目标轮廓。
[关键词]石材大板;轮廓提取;图像处理
1、 引言
图像处理是在线测量系统中很重要的一部分,本文就是利用图像处理技术提取石材大板的轮廓信息,然后利用其目标点的间距最终求得石材大板尺寸。本文对图像处理的相关算法进行研究,提取石材大板的轮廓信息,最终计算其尺寸。提取过程主要包括图像预处理和图像分割两部分。图像处理过程如图1所示。
2、图像处理
2.1 图像预处理
通过CCD摄像机获取的石材大板图像在其传输、接收和处理的过程中,由于受多种因素的影响,如系统噪声、曝光不足或过量、传输过程中的误差以及人为因素等等,均会对石材大板图像产生一定的噪声干扰。噪声会恶化图像质量,有时会使提取的信息减少甚至淹没某些有用特征,给分析带来困难。因此,对图像进行预处理是非常必要的,这样可以去除噪声,使其更接近真实图像,更有利于对石材大板图像进行后续处理。图像预处理主要包括滤波和增强。
2.1.1 图像灰度化
图像的灰度化是图像增强处理技术中一种非常基本、直接的图像处理方法。图像的增强用于调整图像的对比度,为了获得对后续计算机处理、分析过程更有利的图像,需要对采集的原始图像进行图像增强,从而淡化背景,消除噪声干扰,提高对比度,突出图像中的重要细节[1]。
本文采用的是加权平均值法:R=G=B=aR+bG+cB。考虑到图像的合理性,取a=0.11,b=0.59,c=0.30,即采用公式(1)进行灰度转换:
其中:为转换后的灰度图像在点处的灰度值;、和分别为彩色图像在点处的红色分量值、绿色分量值和蓝色分量值。
在OpenCV函数库中,图像的灰度化可以通过cvCvtColor(const CvArr* src,CvArr* dst,int code)函数实现,其中src为原彩色图像,dst为处理后的图像,code为色彩空间转换方式,在这里code定义为CV_RGB2GRAY。彩色石材大板图像经过式(1)转换后,变成灰度图像。图2所示为4个彩色石材图像灰度化后的结果。
2.1.2 图像平滑
图像的平滑处理技术即图像的去噪声处理,它是将输入的图像进行滤波去除噪声。图像平滑一是平滑非边缘区域,二是使图像边缘得到保护。一个较好的平滑方法应该是既能消掉这些噪声效应又不使图像的边缘轮廓和线条模糊。在滤波方法中,最常用的有均值滤波和中值滤波两种,本文采用此两种方法分别对石材大板平滑处理,效果如图3所示。
这里仅选取了其中的一幅图像进行处理。从图中可以看出均值滤波和中值滤波对含有高斯噪声的图像都能够有效地抑制噪声的干扰,对含有椒盐噪声的图像也能抑制部分噪声。但通过比较明显可以看出,,中值滤波在椒盐噪声处理方面的能力是均值滤波无法比拟的,因此,本文采用中值滤波对图像进行滤波去噪。
2.2 图像分割与边缘检测
图像分割是图像处理和计算机视觉中基本而关键的技术之一,其目的就是将目标物体与背景分离开来,为后续的处理提供坚实的基础。图像分割的方法主要包括阈值法、边缘检测法、区域跟踪法等。本论文采用的是边缘检测法。
2.2.1 边缘检测
检测石材大板边缘是其轮廓提取的基础。边缘检测实现的难点在于边缘检测的精度和抗噪声的能力。边缘检测有很多算法,例如Roberts算子、Sobel算子、Prewitt算子、拉普拉斯算子等[2]。
(1)Roberts算子
Roberts算子采用的是对角方向相邻的两个像素之差。从图像处理的实际效果来看,边缘定位准,对噪声敏感。Roberts算子是一种利用局部差分算子寻找边缘的算子,该算子对具有陡峭边缘且含噪声少的图像效果较好。
(2)Sobel算子
Sobel边缘检测算子是先做加权平均,再微分,然后求梯度。以下两个卷积核形成了Sobel边缘检测算子,图中的每个点都用这两个核做卷积,其中一个对垂直边缘影响最大,而另一个对水平边缘影响最大。边缘检测算子的中心与中心像素相对应,进行卷积运算。两个卷积核的最大值作为该点的输出位。运算结果是一幅边缘幅度图像。在边沿检测中,Sobel算子对于像素的位置的影响做了加权,加权平均边宽2像素,因此效果更好。Sobel算子都对噪声具有很好的抑制能力,但仍然不能完全排除检测出来的边缘中存在虚假边缘的情况。
(3)Prewitt算子
Prewitt算子与Sobel算子基本相同,只是没有加权,所有系数全为1。Prewitt算子产生一幅边缘强度图像。
(4)拉普拉斯算子
拉普拉斯(Laplacian)算子是一种二阶导数算子,对一个连续函数, Laplacian算子是不依赖于边缘方向的二阶微分算子,对图像中的阶跃型边缘点定位准确。该算子对噪声非常敏感,它使噪声成分得到加强。这两个特性使得该算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘,同时抗噪声能力比较差。
图4为不同边缘检测算子对石材大板边缘进行检测的结果。
从图4中可以看出,不同的边缘检测算法应用到石材大板图像上会有不同的检测效果,通过比较可以发现Sobel和Prewitt算子的处理效果相对较好。经多次试验比较,而且由于Sobel算子对于水平和垂直边缘的检测有更好的效果,因此效果相对较好。
2.2.2 图像二值化
图像的二值化处理就是将图像上每点的灰度值变为0或者255,也就是将整个图像呈现出明显的黑白效果。在数字图像处理中,二值化是一种简单有效的方法。设定某一阈值,可以用将图像的数据分成两部分:大于的像素群和小于的像素群。因此图像二值化可按公式(5)进行:
式中,是原始图像中位于处像素的灰度;是二值化后该处的像素值,它只能取0或1。
图5所示为用二值化方法提取的石材大板轮廓,通过这组图像处理过程我们可以发现,这类提取石材轮廓的方法适用于石材大板和图像背景图案有很大的区别的图像,而且我们也可以看出这种方法的提取效果很好。
2.2.3 数学形态学处理
数学形态学(Mathematical Morphology)是由一组形态学的代数运算子组成的,它的基本运算有4个:膨胀(或扩张)、腐蚀(或侵蚀)、开启和闭合,它们在二值图像和灰度图像中各有特点。数字图像处理中的形态学处理是指将数字形态学作为工具从图像中提取对于表达和描绘区域形状有用处的图像分量,比如边界、骨架以及凸壳,还包括用于预处理或后处理的形态学过滤、细化和修剪等[3]。
本文采用的是闭运算,先膨胀,反复膨胀后得到需要的状态,如图6(2)所示。很明显边界得到了扩张,于是逐步进行腐蚀,以恢复原始边界,如图6(3)所示。最后提取石材大板轮廓,如图6(4)所示。轮廓提取是接下来计算石材大板尺寸的基础,最终实现在线测量尺寸。
3、结论
本文介绍了石材大板在线测量系统的重要阶段,先后介绍了图像的灰度化处理、平滑处理、二值化、图像分割和数学形态学处理的相关原理及算法,提取了石材大板的边缘轮廓信息。本文的设计为石材领域的发展提供了一个创新点,将其应用到现有石材加工设备上可以实现石材加工自动化水平,解决了国内石材企业针对不规则外型的石材大板不能进行实时测量的困扰,提高了生产效率和经济效益。
摘 要: 针对传统四轮定位仪精度不高、操作复杂的问题,设计了一套基于图像处理与计算机视觉的车辆四轮定位仪,给出了该仪器基于2D平面靶标的摄像机定标方法及摄像头拍摄连续图像的处理方法。最后分析了该车辆四轮定位仪的工作过程及工作原理,并与手工测量的车辆四轮定位参数进行了对比实验,实验结果表明基于图像处理与计算机视觉的车辆四轮定位仪的设计理论和方法都是正确的。
关键词: 计算机视觉; 摄像机定标; 图像处理; 四轮定位
0 引 言
随着汽车行驶速度的加快,影响车辆安全性的车轮定位参数就越发的重要。当车轴、转向机构和车架发生磨损和变形[1]后,车轮定位将会失准从而影响车辆的安全性。但现有的四轮定位仪精度不高、操作复杂,严重的影响了车轮定位调校的效率[2?4]。
针对上述问题,设计了一套基于图像处理与计算机视觉的车辆四轮定位仪。给出了该仪器基于2D平面靶标的摄像机定标方法及摄像头拍摄连续图像的处理方法,并分析了该四轮定位仪的工作原理,最后通过实验证明了该仪器设计理论和测量方法的正确性。
1 基于2D平面靶标的摄像机定标
1.1 图像坐标系、摄像机坐标系与世界坐标系
摄像机拍摄的图像采用标准电视信号的形式存储于计算机中,然后计算机使用数模板转换为数字图像。在图1所示的直角坐标系[(u,v)]中,各像素的坐标[(u,v)]表示该像素在整个数组中的列数编码和行数编码。但并没有物理单位能够表示出该像素在整幅图像中的具体位置,所以还需创建以物理单位为刻度的图像坐标系。图像坐标系以图像内一点作为坐标原点,其中[x]轴 与[u]轴平行,[y]轴与[v]轴平行,具体如图1所示,[(u,v)]表示以像素作为单位的图像坐标系,[(x,y)]表示以物理单位毫米作为单位的图像坐标系,两个坐标系均为图像坐标系,但所采用的坐标单位不同。
摄像机的光心为[O]点,摄像机的光轴为[zc]轴,垂直于图像平面,[xc]轴与图像坐标系的[x]轴平行,[yc]轴与图像坐标系的[y]轴平行。图像坐标系的坐标原点为图像平面和光轴的交点,[xc]轴,[yc]轴和[zc]轴与点[O]组成的坐标系即为摄像机坐标系,[OO1]即为摄像机焦距。
1.2 基于2D平面靶标的摄像机定标
由于3D立体靶标加工精度受到一定的限制且制作成本较高,此处采用2D平面靶进行摄像机定标[5]。在定标过程中,摄像机以多于两个方位对同一个平面靶标进行拍摄,平面靶标和摄像机均能够自由移动且无需知晓其运动参数。在定标过程中,摄像机内部参数始终为定常数,仅外部参数发生变化。
2 图像处理
为了降低图像的噪声干扰,靶盘为黑底,上面有若干个白色圆斑,并以圆心作为特征点,为了取得特征点(白色椭圆中心)的二维图像坐标,首先进行图像阈值分割,然后完成边缘检测,最后寻找特征点坐标[6]。四轮定位系统工作中拍摄的靶盘图像如图3所示。
2.1 图像阈值分割和边缘检测
根据实际观测,将阈值设置为150,则阈值分割处理后的结果如图4所示。
2.2 Hough变换求取椭圆参数
对于平面上的任意椭圆,设椭圆圆心为点[c,]在平面上任取一点[p,]则点[p]距椭圆上任意点的最大距离必然大于点[c]距椭圆上任意点的最大距离。根据椭圆的该性质,可以通过寻找平面内距椭圆上任意点的最大距离数值最小的点来确定椭圆圆心,而且找到的这个最大距离的最小值即为椭圆的长轴长度。通过该方法,可以得到椭圆长、短轴长,椭圆圆心点横、纵坐标和旋转角度5个参数中的3个,剩下的2个椭圆参数就能够通过Hough变换的方法求得,算法的具体实现步骤如下:
(1) 首先对需处理的图像完成边缘检测,取得二值化的图像边缘轮廓,将边缘轮廓图上的各点数据存入数组[A;]
(2) 针对二维平面上的所有点,分别计算与上步中得到的数组[A]中点的距离,得到所有点与数组[A]中点的最大距离,在计算的最大距离中的最小值对应的点就是椭圆圆心的横纵坐标[p,q,]该最大距离就是椭圆长轴的长度[a;]
(3) 将第一步中数组[A]所有点的数值与椭圆参数[p,q,a]代入椭圆方程[E,]椭圆方程为:
然后在二维空间内对参数[b,θ]进行统计分析,得到一组峰值大于一定阈值的参数即为椭圆的参数。
2.3 特征点三维坐标求取
通过前面的分析可知,当靶盘上圆的实际大小与图像上椭圆长、短轴尺寸都知道时,摄像机与圆心间的距离为:
式中:[F]表示摄像机镜头的焦距;[P]表示圆半径;[A]表示椭圆长轴长度,[A=μ×N,][μ]表示像元尺寸,[N]表示图像中椭圆长轴的长度,单位为像素。
根据式(3)世界坐标系与图像坐标系的关系,可以通过求解该方程得到特征点坐标[(xw,yw,zw)。]此处选取测量靶盘中相距0.075 m的两圆心的距离进行实验,摄像机拍到的照片如图6所示。
3 四轮定位仪的工作流程及原理
3.1 工作流程
基于图像处理与计算机视觉的车辆四轮定位系统由两台数字摄相机、计算机主机和四个靶盘组成,具体如图7所示。
摄像机仅能获取单侧靶盘的图像,红外线由特制的光源发射,靶盘接收到红外线后,将其反射至高性能数字摄像机成像,摄像机依据获取的图像通过计算得出相机与目标之间的距离,然后将数据处理后就能够得出车轮的定位参数,车轮定位参数的测量流程具体如下:将汽车放置于举升机上,使汽车进入摄像机的拍摄视角范围;打开摄像机,固定方向盘后推动汽车行驶,然后拍摄行驶中的靶盘;根据摄像机拍摄到的图像(三幅以上)计算出车轮的外倾角和前束角;将汽车整体固定使其无法前后移动,转动方向盘,获取车轮转动过程中靶盘的图像,然后计算出主销后倾角和内倾角。
3.2 建立测量基准平面?车身平面
在汽车行驶过程中,靶盘本身是倾斜的,车辆前轮两个旋转中心点即为汽车前轮定位平面;同样,车辆后轮两个旋转中心点即为后轮定位平面。这两个面作为整个四轮定位测量系统的基准平面,其优点是该平面无需依赖于重力和重力传感器。所以,在车辆行驶过程中,不论车辆是前后倾斜还是左右倾斜,都不会影响车轮定位参数的测量[7]。
3.3 汽车定位参数数学模型的建立
靶盘固定于车轮,所以可将靶盘和车轮当做一个刚体来分析,车轮的运动可分解为平动和旋转两个分运动。由于车轮的旋转轴与车轮轮面垂直,所以可将车轮前束角和外倾角看作是车轮旋转轴与各坐标轴间的夹角。
由于汽车前轮上安装的两靶盘是完全相同的,且其能够与车轮共同当做一个刚体处理[8],汽车车轮运动驱动靶盘运动,将靶盘的运动分解成平移运动和旋转运动,同时假设靶盘先平移后旋转。在靶盘的旋转过程中,车轮滚动一圈,则靶盘上所有白色圆心的运动轨迹均是圆。但在四轮定位仪的实际测量中,车轮滚动轨迹达不到一圈,靶盘圆心轨迹是一段弧,但仍能够通过圆弧上任意三点求出轨迹圆心。在车轮的平动过程中,左右靶盘上同一位置的白色圆心的连线随车轮平动形成前轮定位平面,后轮则形成后轮定位平面。
在汽车转向过程中,车轮绕主销旋转,通过旋转前后靶盘特征点的坐标变化就能够得出主销轴线本身与[X,Y,Z]轴间的夹角[α,β,γ,]进一步就可求出主销后倾角和内倾角,具体求解示意图如图9所示。
4 实 验
为了验证本文所设计的车轮定位仪的准确性,选取车轮外倾角和前束角进行了实验。实验通过车轮外倾角和前束角的变化,从四轮定位仪中输出各定位参数的变化,同时选取手工测量作为对比数据。各组实验数据如表2~表4所示。
5 结 论
针对传统四轮定位仪精度不高、操作复杂这一问题,设计了一套基于图像处理与计算机视觉的车辆四轮定位仪。给出了该仪器的设计方法并进行了测量精度实验,实验结果表明所设计的四轮定位仪操作简单并具有较高的精度。但为了进一步提高仪器的测量精度,后续还要对图像质量和图像处理算法进行改进,并提高摄像机的定标精度。
时展日新月异,人们的生活也瞬息万变。人们每天会接受到很多视觉信息,随着时间的流逝,城市中的每一处光影、每一个街角,都定格着属于它的美好。“衣+” (北京陌上花科技有限公司)人工智能计算机视觉引擎将AR(增强现实)和AI(人工智能)融合,会让你眼中的世界完全不同,它更智能化、更懂你的需求,把你所看到的视觉信息经过人工智能“大脑系统”处理后,通过AR展现和交互,带给你更多全新的惊喜与感动。
小时候,我们都有过这样的梦想:生活实景都变成游戏,随时随地看到的场景、人物、好看的好吃的好玩的都能动起来,穿越时空,虚拟和现实世界梦幻叠加。“衣+”将AR技术和人工智能技术深度结合,使用复杂的计算机视觉技术和深度学习算法,去理解场景,然后增强场景,帮你达成这个愿望。仿佛拥有一双慧眼+超强大脑,而且这只是“衣+”暂时制定的一个小目标而已。
AR技术是通过计算机系统提供的信息叠加用户对现实世界感知的技术,将虚拟的信息应用到真实世界,并将计算机生成的虚拟物体、场景或系统提示信息叠加到真实场景中,从而实现对现实的增强。更通俗一点的说法是,它是一种全新的人机交互技术,利用摄像头、传感器、实时计算和匹配技术,将真实的环境和虚拟的物体实时地叠加到同一个画面或空间。用户可以通过虚拟现实系统感受到在客观物理世界中所经历的“身临其境”的逼真性,还能突破空间、时间,以及其他客观限制,感受到在真实世界中无法亲身经历的体验。
“衣+”是世界领先的人工智能计算机视觉引擎,致力于让计算机看懂世界,属于人工智能中的感知和认知智能,在图像视频中对场景、通用物体、商品、人脸的检测、识别、理解、搜索及推荐均达到领先水平。陌上花自主研发的深层次多属性深度学习网络,是人工智能在云和端上计算的核心基础。在国际顶级计算机视觉竞赛ImageNet2015和ImageNet2016中,先后获得五项和三项世界第一。
“衣+”技术团队正在做这样一个尝试,利用AR技术结合人工智能大数据技术感知认知世界,并增强了交互方式,这将大大改变人们的生活,将深度学习的人工智能科技和AR技术相结合应用到视频、直播、时尚、购物、美食、出行、运动、旅行等生活体验的各个方面,提供全生活场景智能服务,打造前所未有的智能视觉体验。
增强现实技术,不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。在视觉化的增强现实中,用户利用AR设备,把真实世界与电脑图形合成在一起。“衣+”AR技术结合人工智能,以计算机视觉技术为基础实现感知认知,能将人眼看到的所有信息,包括商品、物体、食物、服饰、汽车、建筑等,都精准匹配出同款及相关商品。它的展现方式更加生动、立体、多样化,能够带给用户高品质、高时效、一站式的服务体验。
“衣+”AR技术和人工智能的结合实现了对现实世界的感知和认知的能力,可以在图像视频中完成对场景、通用物体、商品、人脸的检测、识别、理解、搜索等。如今,每个月有上亿次的商品推荐通过“衣+”边看边买引擎来完成,帮助用户搜索、识别他们所看到的物品。目前“衣+”支持服饰、3C数码、商超、家居、日用品、交通工具等超过几百类商品的检测和识别。
通过对海量数据进行深度学习,“衣+”视觉引擎能够检测识别视频或图像中的商品,并通过分析商品特征,准确判断商品类目等商品信息。在餐饮方面,当用户用不同的手持终端对餐厅的食品进行拍摄后,餐厅的位置以及菜品的食材等将即刻呈现在手持终端上,使就餐体验的科技含量越来越高。
此外,“衣+”利用技术手段可以实现对视频和图像中的物体的位置、名称、运动轨迹、轮廓等属性的实时分析。目前已支持超过10000类常用物体、大于400类室内外场景的识别。
利用深度学习技术,“衣+”还可以在视频、图像中实现人脸关键点检测,可用于相机、直播等多种娱乐场景。让场景营销变得更自然、更直观、更有趣味。“衣+”人脸属性识别,可以准确识别出人物的性别、年龄、种族、情绪、颜值、性感、时尚等属性信息,平均准确率超过93%。基于深度学习的人脸对比技术,实现人脸相似度测量,可用于人脸聚类、敏感人物监控等场景。这一切,都是在人工智能计算机视觉搜索引擎中实时完成。
目前,AR技术越来越火热,并将全面融入人们的日常生活。目前,“衣+”和阿里云、华为、优酷土豆、微博、360、华数、京东、天猫魔盒、CIBN、英伟达、趣拍、花椒等数十家顶级机构深度合作,通过提供边看边买引擎、图像视频内容分析引擎、人脸属性分析引擎服务海量用户,同时帮助用户实现场景营销、智能分析和内容互动。AR技术与人工智能相融合的市场将快速增长。“衣+”也将不断利用无处不在的AR技术和人工智能技术,创造一个智能世界,将生活中的美好愿望变为现实。
摘 要
在我国市场经济不断发展的盛况下,我国科技发展水平也紧随其后,成为世界上的科技强国之一。在计算机水平的不断提高下,计算机视觉技术应运而生。其中,计算机视觉技术被应用与各个领域,并在各个领域都得到广泛有效的应用,比如军事领域、医疗领域、工业领域等。本文针对计算机视觉技术在交通领域中的应用进行分析。
【关键词】计算机视觉 交通领域 探究
近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。
1 计算机视觉的概述及基本体系结构
1.1 计算机视觉概述
通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。
计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。
计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。
1.2 计算机视觉领域基本体系结构
提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。
2 计算机视觉在交通领域的应用
2.1 牌照识别
车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。
2.2 车辆检测
目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。
2.3 统计公交乘客人数
城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。
2.4 对车道偏离程度和驾驶员工作状态判断
交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。
2.5 路面破损检测
最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。
3 结论
本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。
【摘要】由于计算机技术的不断发展,计算机视觉技术也得到了很大的发展。从产生的时间来看,计算机视觉产生于上个世纪中叶,当时它的主要工作内容是进行统计模式识别,较为简单,目前为止已经经过了长时间的发展,工作内容明显增加,依然发展为一门独立的学科,而且在多个领域都得到了广泛的应用。对于人们的生活产生了很大的影响。本文主要是简单介绍计算机视觉技术的发展历程,并分析它在那些社会生产领域中得到了推广以及应用。
【关键词】计算机视觉技术 推广 应用
在人工智能领域的研究中,计算机视觉是主要的研究对象之一,目前它已经发展为一门独立的科学学科,主要是对相关的理论以及技术进行研究,从而建立一个完善的人工信息系统。
一、计算机视觉技术的产生与发展历程
计算机视觉产生于20世纪50年代,其当时主要的工作内容为统计模式识别,尤其是需要进行分析二维图像的特点和作用,例如对航空图片进行研究、对显微图片进行分析等。直至60年代初,Roberts使用计算机从大量的数字图像当中选取出棱柱体、长方体等物体的三维图形,并且分析物体空间的主要特点。在70年代初期,视觉应用系统开始得到应用,然后过了几十年之后,专家们已经了解了机器视觉的特点,并且开设了对应的课程。到了80年代中期,计算机视觉已经逐渐被人们应用与工作和生活当中。计算机技术的不断发展,使得计算机视觉系统的实用性得以提升,现已被大量使用于机器人学、几何计算等领域,直接影响着人们的生活。
二、计算机视觉技术的推广与应用领域
2.1应用于工业生产领域
目前为止计算机视觉技术已经普遍应用于工业生产领域中,除了在工业探伤、检测方面得到了推广,而且还在办公以及生产自动化等各方面都得到了广泛的应用。一般来说在工业生产中推广计算机视觉技术,能够在很大程度上提高自动化程度,从而提高产品生产的效率,同时还能防止人工的失误,导致不必要的损失。
2.2应用于农业生产领域中
从农业生产领域的角度来看,计算机视觉技术的应用也越爱越普遍,一方面主要是利用该技术全程监测农作物的生产过程,已达到预防病害虫的作用,另一方面利用该技术对农产品进行检测,以便对其进行分类与分级。由于在农业生产领域中利用计算机视觉技术能够实现自动化管理,因此能够减少大量的劳动力,降低生产的人工成本,进一步提高管理生产效率。
2.3应用于社会公共安全领域中
社会公共安全是人们非常重视的一个问题,计算机视觉技术在这方面也得到了有效的应用,不仅应用于侦查、犯罪侦破工作中,而且还应用于指纹配比、人脸合成等工作中。应用这种技术能够进一步提高犯罪案件的侦破效率,避免更多的犯罪行为发生,从而影响人们的正常生活。
2.4应用于视觉导航领域中
通过对计算机视觉技术进行长时间的研究后,当前已将之推广于视觉导航领域中,主要是应用于太空探测、航天飞行等方面,在此基础上还应用于巡航导弹制导、智能交通等方面。在视觉导航领域中,应用计算机视觉技术可以解放大量的劳动力,避免工作带来的危险,而且还能有效提高工作效率。
2.5应用于人机交互领域中
一般来说在人机交互领域中应用计算机视觉技术,可以通过人的肢体语言、人脸表情进行测定,进一步分析人的意愿,从而按照要求认真完成指令,这样不仅可以有效增加交互的方便性,而且还可以有效增加临场感,具有其他技术不可替代的作用。
2.6应用于虚拟现实领域中
当前计算机视觉技术在虚拟现实领域中得到了推广,利用这种技术可以进行不同的军队战场场景模拟,在此基础上还能对飞行员飞行、医生手术等现场进行模拟。总之,利用这种技术能够带给人们一种身临其境的感觉,从而进一步提高工作效率。
2.7应用于卫星遥感领域中
从卫星遥感领域的角度来看,计算机视觉技术的应用并不少见,不仅应用于矿藏勘探、资源探测等方面,而且还应用于气象预报、自然灾害监测等方面。一般来说卫星遥感涉及的信息量非常大,而且类别也很多,分析识别工作稍不注意,就会出现错误,而利用这种技术后,能够快速、有效的进行信息的收集以及分析工作,进一步提高信息的准确性。
三、结语
计算机视觉技术发展到现在,已经在多个领域得到应用与推广,在虚拟现实、工农业生产等众多领域中随处可见。而随着社会的不断进步,市场对于计算机视觉技术的需求也越来越大,具有很大的发展潜力。为了能够满足市场增长的需求,使计算机视觉技术得到更广泛的应用,需要研发人员通过不断的努力研制出更加完善的计算机视觉技术系统,这是当前科研工作的主要课题。
摘要:该文基于OpenCV的计算机视觉技术进行研究,探讨了视频中计算机对运动物体视觉检测的原理,并对OpenCV的应用情况进行说明,阐述了基于OpenCV的计算机视觉技术体系,最终重点叙述了计算机视觉三维模拟技术,以期能为相关工作提供参考。
关键词:OpenCV;计算机视觉技术;三维模拟技术
21世纪是国际计算机技术高度发展的时代,人们生活中的每个角落都可以看到计算机技术的身影,尤其是现代计算机视觉技术和图像处理功能发展更加迅猛,各技术分支也逐渐趋于成熟。计算机视觉技术主要指的就是利用智能计算机系统来代替人类的眼睛对现实三维世界进行辨识和理解,整个过程均是计算机自我学习的过程,而随着这项技术研究的不断深入,其不再仅仅包含计算机技术科学,同时还涉猎了包括生理学、神经学、物理学、应用数学等多门学科,为人类科技的进步提供了有效的动力。
1 计算机对视频中运动物体检测的原理概述
在现代计算机技术基础下,对视频当中的运动物体检测原理主要包括两种,分别是从微观和宏观的角度出发。其中宏观检测技术指的是当计算机截取了视频中的某一个图像,其以整幅图像为对象进行检测;微观检测技术是指在截取图像后,根据实际需求对某一区域内的图像内容进行检测。在计算机视觉技术实际应用时,其第一步就是对图像的采集,第二步是对已经采集的图像进行预分析处理,如果采用宏观检测技术则对图像整体进行分析;如果采用微观检测技术则首先将图像进行分割,然后对分割后各图像内容中出现的运动物体影像进行分析。在图像数据获取过程中应用的是背景差分法,这一技术主要是将背景和运动物体进行分离提取,以获取没有背景图像的运动物体影像数据。还可以利用帧间差分法,这种方法主要是对一个视频图像的逐帧画面进行差别比较,从而获得各帧图像上的差值,而将这些差值帧图结合起来就是一个物体在计算机视觉下的运动轨迹。现代研究者更倾向于将背景和帧间差分法进行结合运用,这样可以获得无背景下的运动物体轨迹,进而提升计算机视觉系统捕捉数据的准确性。
2 OpenCV的应用概述
OpenCV是现代计算机视觉技术当中具有开源性的视觉库,其最早是由俄罗斯Intel分公司所研发,不仅高效,而且具有兼容的优势。同时与传统IPL图像处理系统相比,OpenCV所处理的图像数据等级更高,例如在对运动物体进行特征跟踪、目标分割、运动轨迹分析以及三维模型重建等方面都有着巨大的优势。
OpenCV本身编辑的源代码是开放式的,编写过程简洁且方便,并且程序中大多数函数已经通过了汇编的最优化,使其能够更加高效地被应用。在使用OpenCV的摄像机标定模块已经为用户设计了实用性较强的接口,并且能够支持Windows界面的操作平台,使得这一技术的操作更加简便。这一技术本身操作简便,对于编程人员和检验人员个人技能素质要求并不高,视觉技术系统研发人员可以利用简便的操作来检验其设想是否能够实现,这就使得现代计算机视觉技术开发团队能够形成更好的协作研发关系,进一步提升技术研究效率。目前已知OpenCV编程系统在航空航天定位、卫星地图绘制、工厂大规模生产视觉检测等方面得到了广泛的应用,同时对于无人飞行器的视觉捕捉技术也有极大的帮助。最为重要的是OpenCV编程语言的兼容性较强,编程人员可以根据自己的意愿对源代码进行披露,并且国内也已经形成了规模较大的交流社区,给更多同行业者提供答疑解惑的场所,进一步扩大了OpenCV的应用范围。
3 基于OpenCV的计算机视觉技术
3.1 基于OpenCV下的运动物体检测技术
在常规运动物体检测技术下,均是直接通过图像背景和运动物体的区分来实现运动物体的捕捉。而基于OpenCV下的运动物体检测技术则不仅能够针对于图像背景的分离实现运动物体的观察,还可通过物体本身特定的信息来进行检测,主要包括形状、轮廓以及颜色等。这样就能够实现在复杂的背景当中将特定的运动物体完整抽离出来。其基本流程包括:首先,对影像数据当中某一时间点的图像进行捕捉,然后对这一视频图像的格式进行转化;其次,对转化格式后的视频图像进行早期处理,并将运动物体和复杂的背景区分开,降低周围各环境因素对运动物体主体图像的影响;第三,根据完成提取后的运动物体图像进行辨识,然后再从视频当中捕捉拥有相同特征的物体,并对该物体进行跟踪识别。而这一过程的实质则在于先利用图像捕捉技术对画面进行截取,然后同时利用背景差分法和帧间差分法对图像进行分割,逐帧地将运动物体完成提取出来,以供计算机进行视觉跟踪处理。
3.2 基于OpenCV的图像预处理技术
一般情况下,计算机视觉处理技术应用的环境情况较为复杂,大多数应用环境当中均有光照的变化,并且部分计算机视觉处理设备还需要在露天环境下进行工作,此时周围环境中的风、温度、光照、气候以及运动物体数量等对视频图像的采集均有着极大的影响。环境因素会使图像采集的质量大幅度降低,同时图像当中的噪点问题也难以避免,而噪点是视觉捕捉和图像处理当中最大的影响因素。因此,在基于OpenCV下的计算机视觉技术在捕捉视频图像之后先对其进行预处理,然后再由系统对运动物体进行分离、检测和跟踪。一般的预处理过程主要包括平滑度滤波、图像填充、背景实时更新等。
1)图像的平滑度滤波预处理技术
由于在实际计算机视觉捕捉过程中图像噪点是难以避免的问题,以此在对图像中运动物体进行检测前,应该相对这些噪点进行预处理,降低环境噪声对图像的影响。图像的平滑度滤波处理共分为两种方式,分别为线性和非线性。其中线性处理方式就是通过计算机处理设备的简单运算,对图像当中的噪点进行直接清除,但这一技术使用后会造成截获图像模糊不清的情况,因此仅对噪点较少的图像采用该处理方式;非线性滤波处理则是利用复杂的图像处理运算,将截获图像当中的噪点无限缩小,使其不对图像整体造成影响,并且可以有效保证图像的局部调整,但这种处理方式在运算时速度没有线性滤波处理快,因此需应用在噪点较多,图像信息较复杂的处理当中。
2)图像的填充预处理技术
这一处理技术在使用过程中运算速度较慢,主要是由于其需要对逐帧的图像均进行处理,也包括两种处理方式,分别为边缘填充和腐蚀膨胀处理。其中边缘填充处理主要指的是在确定运动物体之后,利用计算机系统自身的边缘检测处理技术,对物体的轮廓进行辨识,并利用形态学上的漫水填充方式对运动物体周围的噪点进行颜色填充,减小其对画面整体元素的影响。而腐蚀膨胀处理与边缘填充处理原理相类似,但这种处理技术主要是针对于噪点进行腐蚀和膨胀,使其在画面当中所占比例扩大,但对运动物体本身不造成影响,这使运动物体和噪点之间的差异就会更加明显,就可以将噪点的影响降到最低,但这种处理方法的效果和摄像机本身的性能、质量等有着密切的关联。
3)背景的实时更新预处理技术
在进行运动物体和背景分离过程中,计算机系统需要对图像上的背景元素进行辨识,并对其开展初始化处理,这样就能够为后期实时背景图像的差异进行凸显,以增加前景图像的效果,降低噪点对图像的影响。在运用这一技术时,首先要先对第一帧的图像进行确定,并将第一帧图像当中的背景图像元素进行辨识,然后在后期图像更新和运动物体检测过程中对背景进行实时更新处理。在更新的过程中其流程主要包括:首先,系统要对所读取的画面进行有效的判断,了解该图像是否为第一帧;其次,将Opencv处理的图像转变为单通道灰度值;第三,对转变后的图像进行高斯平滑度滤波处理,将图像当中的噪点进行去除;第四,采用形态学噪点填充技术对图像当中的噪点进行二次处理,以获得所需要更新的背景图像。
3.3 前景运动物体的提取技术
在计算机视觉技术进行运动物体的检测时,只有有效保障检测流程的准确度,才能够有效保障对前景运动物体的跟踪效果。其主要分为两大步骤,其一是对二值化后的图像数据进行分割处理;其二是在图像分析前对其进行充分的填充处理,保证前景图数据的完整性。同时,在前景图像提取的过程中也分为多个步骤,其包括:首先,对所提出的前景图像和背景图像进行差分处理;其次,将差分处理后的图像二值化处理;第三,对背景当中前景物体的轮廓或边缘进行辨识,根据前景图像的轮廓对其进行填充。由于在实际操作过程中,摄像头所处环境的变化较大,并且会在不同场所内的不同角度捕捉画面,因此就需要在前景图像提取时有效提高背景图像实时更新的效果。
利用阀值二值化的分割方式能够有效将前景图像和背景图像分离开,从而使目标运动物体能够呈现独立化,并且阀值分割方式开展前要相对每个像素点进行确定,判断其是否位于灰度值的范围内。而将该图像的像素灰度和阀值进行对比后会出现两种结果,分别是灰度值低于或高于阀值。在实际应用过程中,有效确定图像的分割阀值T,就能够降低环境当中光照因素对图像质量的影响。
4 计算机视觉技术当中的三维重建技术
1)三维重建的视觉系统
计算机视觉技术在对图像进行捕捉时可以视为是对大量的图像信息进行处理,从摄像机的视觉角度出发,其所输入的图像一般为二维属性,但输出的信息确是三维数据,而这种三维空间数据能够提升对运动物体所处空间位置、距离等描述的准确性。在三维重建视觉系统工作过程中,其相对基本的图像数据框架进行确定,然后利用一个坐标点建立2.5D图像数据,即以此点为视角能够观察到的图像数据,再将2.5D图像数据进行整合从而建立三维图像。
2)双目视觉系统
当人体利用双眼在不同角度、同一时间内观察同一个物体时,就可以利用算法来测量该物体和人体之间的距离,而这种方法也被称为双目立体感,其应用的原理主要是人体视觉差所带来的影响。同时利用两台摄像机对同一图像从不同角度进行观察,就能够获得人体双目观察后的效果,因此这一三维重建技术也被称为“双目视觉系统”。两台不同的摄像机即可代表人体双眼,其对图像进行逐帧捕获,但由于角度不同和环境影响因素的差异,因此造成了图像差异,必须对其捕捉的图像进行预处理。
3)三维重构算法
在计算机视觉技术中对于视频流的采集主要依靠的是彩色摄像机、红外摄像机、红外接收摄像头等设备。还可以利用微软所提供的Kinect设备,在进行运动物体检测前能够对NUI进行初始化处理,将系统内函数的参数设定为用户信息深度图、彩图、骨骼追踪图等数据。在使用Kinect设备对视频流进行打开时,其可以遵循三个步骤,其一是彩色和深度数据的处理;其二是根据数据的索引添加颜色信息,并将其引入到深度图数据当中;其三是骨骼追踪数据。
5 结束语
计算机视觉捕捉技术是现代计算机应用当中较为先进的内容,其应用范围较广,对于运动物体的捕捉准确度较高,能够有效推进现代计算机模拟技术的发展。
摘 要计算机视觉具有实时、客观、无损的优点,能对马铃薯的表面外部品质进行快速有效的检测。本文阐述了应用计算机视觉技术对马铃薯进行外部品质检测的必要性,并对基于计算机视觉的马铃薯的大小检测、形状检测以及表面缺陷检测的应用进行了研究。
【关键词】计算机视觉技术 马铃薯外部品质 检测
随着计算机技术的不断发展,计算机视觉技术应运而生并在工业自动化以及农产品检验检测等领域成功应用。其中,将计算机视觉技术用于以自动化采集和品级分级为代表的果蔬商品化处理具有非常广阔的发展空间。我国政府将“农产品深加工技术与设备研究开发”列为我国“十五”重大科技攻关项目的第一项,这标志着计算机视觉技术在果蔬外部品质检测中会发挥越来越重要的作用。
马铃薯是世界上仅仅排在小麦、水稻和玉米之后的第四种主要农作物,种植区域非常广泛。马铃薯品质检测是马铃薯深加工的一个关键步骤,目前,该检验过程多数采用人工检测,不仅成本高、效率低,而且与检验员的专业素质有密切的关系,受到人为因素影响的程度较大,严重制约的马铃薯加工企业的发展。计算机视觉技术能对农产品的某些特性变化和缺陷进行识别,具有客观、无损害等特点。本文对基于计算机视觉的马铃薯外部品质检测的应用进行了研究。
1 应用计算机视觉技术对马铃薯进行外部品质检测的必要性
随着“麦当劳”、“肯德基”的餐饮服务业的快速发展,炸薯条、炸薯片已经成为一种休闲食品深受消费者的喜爱,推动了我国马铃薯产业的发展。然而,情况并不十分乐观,与国外的马铃薯企业相比,我国马铃薯加工企业生产规模小、生产产品单一、技术设备落后、产品质量不高的现象导致我国的马铃薯产品销售困难,经济效益逐渐下滑。
基于以上现状,对马铃薯的加工研究还有很长的一段路程。企业要扩大生产规模,针对中国的消费趋势与消费水平开发出新的马铃薯产品,从而提高我国马铃薯产品的竞争力。这就要求马铃薯加工企业要对马铃薯的加工技术进行创新,保证产品质量。其中,马铃薯外部品质检测对马铃薯产品的最终品质起着决定性作用。当前的人工检测方式已经不再适应社会发展的要求,利用计算机视觉检验代替人工检验成为社会发展的必然趋势,这是因为计算机视觉技术具有以下优点:
(1)精度高,能够进行定量测量。
(2)自动化程度高,一次就可完成包括大小、形状、颜色以及缺陷在内的检测和分析,并能进行综合识别。
(3)无损检测,计算机视觉检测过程不需要接触产品,是通过传感器扫面获取图像的,不会造成产品的损伤。
(4)信息量大,可对大量信息进行采集,对光谱的敏感范围也很广。
2 基于计算机视觉的马铃薯外部品质检测的应用研究
2.1 马铃薯大小的检测方法
马铃薯的大小检测不仅影响马铃薯深加工的商业价值,在在遗传和育种方面也有很高的应用价值。
利用计算机视觉技术对马铃薯大小的检测步骤如下:先从摄像机中获取马铃薯的图像信息,在图像信息的基础上对马铃薯三维空间的几何信息进行计算,并由此重建和识别马铃薯。而马铃薯物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的,这些几何参数成为摄像机参数。要想准确的获取这些摄像机参数,就必须将实验与计算相结合,此过程成为系统定标。
系统定标的基本步骤:根据设定好的摄像机模型和特定的实验条件包括形状、尺寸等已知的定标参照物,经过对马铃薯图像的处理,并利用一系列的数学转换和计算方法将摄像机模型的内部和外部参数计算出来,从而建立照片与实物的联系推算出马铃薯的真实尺寸。
2.2 马铃薯形状的检测方法
根据《中国马铃薯栽培学》中的知识,我们可以把马铃薯的块茎形状分为三类,分别是圆形、长筒形和椭圆形,除了这三种形状,其余都是这三种形状的变形。此次研究将马铃薯分为圆形、椭圆形和长筒形,并且采用椭圆的短长轴比来模拟马铃薯的纵横直径之间的关系。
2.2.1 马铃薯形状特征参数的提取
将马铃薯椭圆的短长轴比R作为形状特征参数,并按照R的大小将马铃薯进行分类。当R小于0.67时,称之为长筒马铃薯;当R大于0.85时,称之为圆形马铃薯;当R介于0.67到0.85之间时,称之为椭圆形马铃薯。
2.2.2 结果与分析
随机抽取114块马铃薯,对抽取的马铃薯进行正反两面拍照,挑选清晰度最高的228张图片。人工分类后进行计算机视觉分类,操作步骤具体如下:
(1)用DIPS预处理:B通道灰度化,中值滤波和Otsu分割;
(2)通过计算机视觉技术提取马铃薯图片的短长轴比R;
(3)将人工分类与计算机视觉分类进行对比,并得出正确率。
根据图表,我们可以看出在228张仅有两张图片被分类错误,正确率高达99.1%,而这两个分类错误的马铃薯的短长轴比处于0.67周围,分别为0.667604 , 0.67193和0.671887, 0.661063,又因为对马铃薯形状的分类不需要类似工业生产那样精密,所以,当正反两面短长轴比接近时都可看作是椭圆形。
2.3 马铃薯的缺陷检测
计算机视觉技术具有实时、客观、无损的检测特点,能对马铃薯的表面缺陷和某些特征要素进行快速检测。基于此,国内外很多研究学者进行了大量的实验研究,在1998年开发了利用PC机辅助的实时马铃薯检测系统,能够对马铃薯的重量、颜色以及形状进行快速检测;2000年,相关研究者在此基础上建立了计算机视觉检测系统,不仅能实现大小、形状的检测,还能对马铃薯表面的生长裂缝、机械裂缝、绿皮等表面缺陷进行检测。当前对马铃薯表面缺陷进行检测的主要计算机视觉技术包括缺陷分割法和缺陷识别法两种方法。
3 结论
本文应用计算机视觉技术对马铃薯的大小、形状和表面缺陷等外部品质进行了检测,但是还未能实现利用计算机视觉技术对马铃薯的表面缺陷进行分类这一技术。因此,相关部门要加大研究力度,争取早日完善计算机视觉技术,从而推动我国马铃薯加工企业快速高效的发展。
摘要:为解决通讯机壳部件测量中遇到的圆拟合和边缘提取不准确的问题,提出了利用加权函数进行修正的方法。首先,针对圆拟合过程中容易受到干扰点影响的情况,提出采用双平方形式的加权函数对圆拟合过程进行修正,去除了离群值较大的点,从而使圆拟合更准确。为了准确的定位边缘,提出了利用三角形模糊隶属函数作为加权函数,对边缘选取过程进行修正,从而达到准确提取边缘的目的。同时,本文采用了鲁棒性强的字符提取算法及支持向量机的字符检测算法,实现了字符提取和识别。
关键词:加权函数;圆拟合;边缘选取;字符检测
通讯天线设备的电性能直接与设备的各个零部件的精度相关,通讯天线零部件的高精度是保障通信质量的基本条件。通讯机壳零部件的尺寸精度、几何形状精度、相互位置精度、表面粗糙度等都有严格规范和公差范围。在检测过程中不但要高精度地测量几何尺寸、几何形状和相互位置精度,同时还要识别零部件表面的各种符号、数字和字母等。本文以通讯机壳零部件测量为例,以满足精度、提高可靠性为目的,研究了基于单目计算机视觉条件下满足亚像素精度的检测方法,其关键检测技术主要有标定技术、复杂轮廓的基元拟合技术、模糊测量技术和字符提取技术等。文中针对机壳部件测量中,存在圆拟合与边缘提取不准确的问题,提出了利用加权函数进行修正的方法。该方法的基本思想是:圆拟合不准确主要是由于受到较大的离群点影响,因此采用一种双平方模式的加权函数来去除这些离群点,从而得到准确的拟合圆。边缘提取不准确也是由于提取到了不需要的边缘,因此采用三角形模式的加权函数对不需要的边缘进行抑制,只允许正确的边缘输出,从而达到正确检测目的。检测结果表明,所提出的方法能够满足测量要求。由于机壳部件表面的字符也要求识别,因此本文根据字符及其背景,选择了鲁棒性强的动态阀值分割算法和支持向量机分类器实现了字符的检测和识别。
1 摄像机标定技术
本文采用传统的摄像机标定方法,利用一个标定板与其图像的对应约束关系来确定摄像机的内参数和外参数。测量中,采用的是远心相机模型。从三维空间坐标到二维图像坐标的映射关系可以使用一个固定数量的参数来表示:
2 最小二乘法的加权拟合
由于部件的边界点组成的轮廓会产生大量的数据,而我们所关心的是确定部件轮廓的位置信息,因此需要将轮廓拟合成直线、圆、椭圆等基元,进而确定被测部件的形状精度、相互位置精度等关键参数。本文提出一种圆拟合算法,该算法基于各个拟合点的权重值的大小对圆进行拟合,使得到圆更为精确。
3 模糊测量
相对于经典标准的测量方法,模糊测量对边缘选择更加灵活。它可以依据图像的对比度、位置、尺寸及灰度值等信息实现测量。
设模糊集合记为;并在[0,1]闭区间的特征函数称为隶属函数,记为,它表示对于的隶属程度,用它来描述“亦此亦彼”的模糊概念。在经典集合论中,集合元素要么属于或不属于集合,该集合的边界是清晰的。模糊集理论则允许有关集合元素模糊渐进评估,这就是通过隶属函数来描述的。模糊集合的定义式为:
由于在图像中的灰度值存在模糊性,其主要体现在物体的边缘,因此适合用模糊理论对图像边缘的不确定性进行描述。对单一不确定性测量,在量化的区域内,包含准确的值,即在gray zone范围内[6]。对物体进行测量前,要选择模糊隶属函数。常用的有Triangular、S-curve function、Z-function和Pi-function四种。其他隶属函数可由这四种组合而成[7]。在实际的测量中,由于光照等因素影响,常导致边缘检测不准确,进而影响测量结果,图2(a)所示为由于检测出多个边缘,其测量结果有多个。
5 结论
本文研究了基于单目计算机视觉的机壳测量方法。针对测量中圆拟合不准确的问题,提出了圆拟合算法的改进,即对拟合过程中,先计算各个点的加权值,对大于指定值的视为离群点,将其忽略已达到去除离群点的目的,从而得到更准确的圆。对检测到多个边缘的问题,根据其正确的边缘位置信息,设计相应的加权函数,只选择需要的边缘输出,从而得到正确的测量结果。加权函数的方法的优点是使检测结果更准确;其缺点是增加了计算量,从而使检测时间加长。因此,对于检测时间要求比较苛刻的场合,该方法还有进一步改进的空间。另外本文还根据检测要求,运用动态阀值分割算法和SVM分类器对机壳表面的字符进行了提取和识别。