当前位置: 首页 > 范文大全 > 办公范文

计算机视觉研究的目的(6篇)

时间:

计算机视觉研究的目的篇1

关键词:计算机;视觉检测技术;原理;应用

中图分类号:TP391.41

受到CIMS的推动和影响,诸多企业的发展趋势逐步趋向于个性化以及自动化,这种大的发展趋势间接的对我国的计算机辅助技术提出了更高的要求,计算机相关技术的发展面临着更加严峻的挑战。就现阶段分析来看,计算机辅助检测技术在现代诸多企业中得到了广泛的应用。随着柔性制造系统的不断进步与发展,驱动图像处理软件、现场总线技术的日趋成熟,检测系统的灵敏性、智能化特点愈发受到人们的关注,在这种大的发展趋势之下,计算机视觉检测技术得到了较快的发展。基于计算机视觉系统现已经广泛应用于现场监控、工况监视等诸多环境之中。

1关于对视觉技术的相关研究

1.1基于计算机的视觉检测技术的原理分析和探究

图像技术主要指的就是通过各种途径所实现的对图像的获取以及进一步的深入加工和处理技术。根据视觉检测技术的抽象程度以及对图像处理方式的不同,可以大致将图像的处理和加工技术划分为三个最主要的层次,这三个层次分别是图像的加工处理、图像的分析以及对于图像的理解。将这三个层次进行进一步的结合,便是图像工程。计算机视觉检测技术是一门新兴的计算机检测技术,该技术建立在对计算机视觉研究的基础之上,吸收和借鉴相关的研究成果,借助于传感器来实施三维测量,进而有效获得被测物体的空间具置信息,故而可以很好的满足当代制造业的发展需求。区别于一般的图像处理系统,计算机视觉检测技术所获取的相关数据信息更为精准和迅速,其环境适应性更强。

基于计算机的视觉检测技术注重计算理论的辅导作用,以应用为目标进行视觉技术分析。自上世纪七十年代以来,我国关于对计算机视觉检测技术的研究又取得了显著的进步,并且逐步迈入更为实质性的研究阶段,在该阶段中,逐步开始从通过从多个角度(诸如光学角度、生理学角度以及投影射影角度等等)对其成像问题加以分析。以Marr为代表的专家更是建立了一些一般性的视觉性处理模型来辅助该技术的研究。

1.2视觉检测技术中传感器的作用

在计算机的控制下配有相关的视觉检测系统,在该视觉检测系统中,主要有三个主要方面的主要作用:第一,对于视觉传感器模型的分析以及确定;第二,进行图像数据分散与整理的相关工作;第三,CAD模型的建立。传感器的主要作用就是对测量棒材的多个截面进行分析,将所收集得到的数据经由图像采集卡采集后,传到相关的图像处理系统中,进而进一步辅助准确的模型的建立。

2基于计算机的视觉检测技术的应用研究分析

2.1基于计算机的视觉检测技术的发展状况研究

在研究的初步阶段,相关技术人员借助于数字化的图像处理技术,主要就是为了进一步提高所获得的数字照片的清晰度和质量要求,进而更为精准、科学、规范的对照片所提供的信息加以辨别,为航空卫星图片的读取、识别和分类做准备。在这一系列的视觉工作中,其中最为主要和常见的工作主要是包括分类、识别判读以及三维结构的构建。

基于计算机的视觉检测技术借助于对计算机视觉技术,将所获得的被观察物品的相关信息加以信号转换,并传递给图像处理系统,图像处理系统通过甄别和判断不同照片像素的分布和亮度等讯息,将其进一步转换成为数字化信号,接下来由计算机的图像系统抽出符合目标特征的信号加以运算,对下一步的设备动作加以决定和执行。

就现阶段而言,我国的计算机视觉检测技术系统在诸多领域均有所应用,最为典型的领域诸如医学的辅助诊断、机器人的感应系统、智能化的人机接口等均是建立在该技术的基础之上。借助于计算机视觉技术这一手段,可以有效提高对产品检测的效率,提高精准度,这种新型的视觉检测技术相比较于传统的人眼在流水线上的跟进,其具有显著的优越性,其获取测量结构迅速、检测结果可以直接被观察、可以进行自动识别以及定位准确和实时性的特点,这就很好的避免了由于人的一些主观性因素所导致的误差出现。

二十世纪以来,基于生物特性的计算机视觉检测技术得到了空前的发展,具体表现在人脸识别、生硬识别、指纹识别以及虹膜的识别中,形式日趋灵活和复杂多变。借助于计算机的视觉检测技术,可以有效对用户的身份进行鉴定和识别、判定用户的特殊信息等。除此之外,还可以将基于计算机的视觉识别技术逐步推广到其他领域,如海关的安全检查以及出口、入口的安全控制等领域。

2.2基于计算机的视觉检测技术的相关应用分析

2.2.1数码相机中所采用的图像采集技术

视觉检测技术的一个显著特点就是有效提高了生产的柔性和自动化程度,本世纪以来,数码相机凭借其高分辨率,快速成像、显像,功能丰富多变以及性价比较高的特定风靡全球,逐步取代了传统的照相机,传统的照相机主要采用的是CCD摄像头,其主要的核心及时采集卡,显然这种采集系统已经逐步落后于时展的脚步,现已逐步被淘汰。

2.2.2微文字识别系统的相关研发和设计

随着科学技术的不断进步与发展,大规模集成电路得到了较快的进步,基于计算机的视觉检测系统的成本得到了极大的降低,基于计算机视觉检测技术的微文字识别系统的研发也被提到了日程中来。微文字识别系统的处理芯片大多是借助于数字信号处理芯片来实现图像的识别,进而借助先进的语音合成技术将朗读变为可能。此外,为了便于使用,该系统的体积被尽可能的缩小,并且可根据美观度和实用性等设计为各种形状。

2.2.3特殊用纸水印在线检测系统

基于计算机的视觉检测技术可以在某一特定领域代替人的主观判断,诸如水印质量的自动检测方面。区别于普通的工作人员,计算机可以实现长时间工作,对于误差范围的控制可以通过设置等实现,而且在计算机执行任务期间,所受到的客观和主观因素相对较少,这就极大程度上避免了由于人的因素所导致的失误性操作,进而有效提高了工作效率以及检测的精准度。这一优点,在水印质量标准的认定中具有十分重要的意义和作用,通过研发一定的程序和软件,可以制定出一套操作性强、权威性较高的水印清晰度量化标准。

3基于计算机的视觉检测技术的发展展望

综合分析来看,计算机视觉检测技术现已有大约四十年的历史,作为一种新兴的检测技术,该技术的显著优越性不言而喻,该检测技术以其高精度、反应灵敏迅速、智能化、自动化等特点被广泛应用于诸多领域和行业之中,并取得了显著的成,可以说,该技术具有十分广阔的发展前景。但是,不可否认,基于计算机的视觉检测技术并不是十分的成熟,在其设计和研发过程中仍然存在着诸多不足,而且视觉检测技术是一项设计到心理、生理等多方面知识的复杂性技术,涉及领域众多,更强大功能的实现需要人类知识的不断拓展和延伸,因此,必须意识到该检测技术发展道路上的困难和挑战。

4结束语

随着科学技术的不断进步与发展,经济的发展对于新技术的研发提出了更高的挑战,再者由于广大人民群众生活质量的不断提高,对于生活水平也有了进一步的认识和了解。基于计算机的视觉检测技术的研发和进步,无疑更好推动了高速发展的经济,不断满足了人民群众日益提高生活需求。由此来看,深入对视觉检测技术的研究和探究无疑具有十分重要的作用,笔者衷心希望,以上关于对我国基于计算机的视觉检测技术的相关探究能够被相关负责人合理的吸收和采纳,进而更好的推动科学技术的创新和进步,推动经济的不断进步与发展。

参考文献:

[1]李旭港.计算机视觉及其发展与应用[J].中国科技纵横,2010(06):42.

[2]张江明,张娟.浅谈制造业中计算机视觉检测技术的应用与发展[J].科技创新导报,2011(24):1.

计算机视觉研究的目的篇2

在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。

人机交互:从呆板到员活

人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?

于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。

计算机怎样识别手势?

从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。

手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。

了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。

计算机识别手势的手段主要有两种:

1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。

2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。

目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。

更好地为人服务

日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。

Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。

手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。

计算机视觉研究的目的篇3

1计算机视觉概述

1.1计算机视觉学概述

从某种意义上说,计算机视觉学是一门在20世纪60年代兴起的新学科。它是一门边缘学科,融入了很多学科的特点,具有很强的工程性特征。比如,图像处理、应用数学、光电技术。换个角度来说,计算机视觉同属于工程领域、科学领域。

1.2计算机视觉的应用

计算机视觉的应用能够使计算机具有和人一样的视觉功能。在生活和生产过程中,照片资料、视频资料的处理是计算机视觉应用的主要方面。比如,在航空事业方面,对卫星照片的翻译;在医学领域中,主要用于辅方面的诊断;在工业生产方面,由于各种复杂因素的影响,计算机视觉在这方面的应用显得特别简单,有利于相关系统的实际构成。

2目标图像检索存在的问题

从某种角度来说,目标图像检索需要分为特征匹配、特征提取两个方面。它们表达了不同的含义。对于特征提取来说,它是图像进行检索的第一步,其提取结果会对进一步的研究造成直接的影响。而对于特征匹配来说,其匹配的准确度会直接影响图像检索系统的返回结果。但在目标图像检索完善的过程中,遇到一些问题阻碍了这两个方面的完善。因此,本文作者对其中的一些予以了相关的探讨。

2.1环境因素不断变化

对于目标图像来说,环境因素是影响其准确率的重要因素。同时,在复杂混乱的环境中,由于受到众多干扰物的影响,加上部分目标图像区域被遮盖,致使目标图像信息不够全面,使目标物体特征的提取难度进一步加大。

2.2图像噪声的影响

子为了更好地模仿生活中的图像检索,数据库中的图像也会随之发生一系列的变化。比如,尺度、角度、光照。而其中图像噪音的影响会使目标物体的外观发生对应的变化。在此基础上,严重降低了目标图像信息获取的准确度。

2.3目标图像检索训练数据的自动标注

由于处于网络中的图像资源信息过于繁多,需要采用手工的方式对它们进行标注。但这种方法非常浪费时间,准确率也比较低。很显然,这就需要目标检索图像能够具有自动标注的能力。实际上,图像检索方法过分依赖人工标注信息。而这些信息很多收到来自各方面因素的影响。比如,认识差异因素、个人经验。以至于对图像产生误解。

3基于计算机视觉下的目标图像检索技术

3.1以多尺度视觉为纽带的目标图像检索方法

该种目标检索技术的应用主要是为了提高目标图像检索的准确率,能够实现目标图像训练数据的自动化标注。该类技术主要是用于那些没有遮挡,不需要进行监督的目标图像检索方面。具体来说,它需要经过一系列的训练。在训练的过程中,以统计学习为纽带,对相应多尺度的目标检测模型进行适当的训练。在此基础上,以该模型为基点,对图像中那些显著性的区域进行合理地提取。比如,该区域的亮度、颜色。最后,需要对用于该实验研究中的概率潜在语义分析模型进行合理地利用。总之,利用这种检索方法可以对图像中那些显著目标所处的区域自动进行检测。同时,对其中目标图像的显著性进行合理地排序,能够提高检索引擎所返回图像结果的准确度。

3.2以彩色LBP局部纹理特点为媒介的目标图像检索方法

这种目标图像检索方法能够有效地解决图像信息采集过程图像噪声以及其它相关因素对所提取纹理特征的影响,提高了图像目标的准确率。对于这种图像目标检索方法来说,它把图像彩色空间特征和简化的LBP特征有机地相融合。在此基础上,该类方法增加了光照的不变特性,却保留了LBP局部的旋转特点。在提高图像检索速度方面,主要是利用原来的LBP特征来丢失其中的彩色信息。以此,使其中的特征维度能够在一定程度上降低。同时,这种目标图像检索方法的应用可以使对应计算方法的难度得以降低,还能对角度等变化状态下的目标图像进行准确地识别以及检索。

3.3以视觉一致性为桥梁的目标图像检索方法

从某个角度来说,它的应用主要是为了提高图像搜索引擎的返回效果,使局部噪声图形具有更高的显著性特征。一是:站在客观的角度,对搜索引擎返回结果的目标显著图予以准确的计算。此外,还要对其中的目标显著系数进行适当地过滤。二是:以所有图像为基点,以显著目标为导向,采取视觉一致性的模式。三是:以视觉一致性为基础,对其中的不同目标图像信息进行客观地分类。这种以视觉一致性为核心的方法能够有效地提高图像检索结果的准确率。更重要的是,在提高图像搜索引擎检索性能的同时,能够及时为用户选出最优的图像信息。而这些信息资源和用户寻找的主题信息密切相关。

4结语

计算机视觉研究的目的篇4

1计算机视觉定义

人类天生具有五感,视觉便是其中之一,而计算机视觉,就是让计算机网络能够睁开眼看世界。让计算机有一定的视觉能力,可以从各个方面帮助人们进行监督、检验检测。利用计算机视觉科学可以使工作变得更加简便。计算机视觉主要应用于对二维码、条形码、照片、视频资料如片段等进行智能处理。

2计算机视觉研究在医疗、交通中的作用

随着医学成像技术的发展与进步,图像处理在医学研究与临床医学中的应用越来越广泛。最常见的有癌细胞显微图像分割与识别、基于多特征融合的血红细胞识别和乳腺癌细胞计算机的自动识别等。计算机视觉技术的迅猛发展,为医疗诊断带来了很大的方便,同时促进了临床医学的发展。另外,在各大综合医院慢慢发展起的体检体系中,计算机视觉技术起到了决定性因素。随着体检的人数上升,对医院体检的管理、速度、准确性都提出了更高的要求。视觉识别轻而易举的解决了这个问题,只需要去识别体检人员的身份证,就可以将体检人员对号入座,检查过的项目,没有检查的项目一目了然。理化指标的检验,只需要在采血试管或采尿瓶上粘贴与体检者对应的条形码即可,利用视觉技术对号入座,方便而准确的确定每一位体检人员的血样及尿样。及提高了医院的工作效率,又将错误率降到最低。

计算机视觉在交通上同样得到了广泛的应用及发展。交通安全是交通运输中的重大问题,随着近年来机动汽车数量的迅猛增长,交通事故的发生也随之越来越频繁,给人类社会带来的危害也日趋严重,使很多的家庭失去亲人,甚至家破人亡。全国一线城市例如:北京、上海、广州、深圳等交通道路供需的矛盾日趋严重,交通安全、交通堵塞及环境污染已成为困扰我国交通领域的三大难题。基于图像处理的计算机视觉技术是通过摄像机获取场景图像,并借助于计算机软件构建一个自动化或半自动化的图像、视频理解和分析系统,并提供及时准确的图像、视频处理结果,以模仿人的视觉功能。主要功能如下:

一是基于计算机视觉技术的车辆牌照自动识别:车辆牌照是车辆的唯一身份,对车辆牌照的有效检测与识别在车辆违章检测、停车场管理、不停车收费、被盗车辆稽查等方面有着重要的应用价值。尽管针对车牌识别技术的研究相对成熟,然而在实际的应用场景中,受到天气、光照、拍摄视角、车牌扭曲等因素的影响,车牌识别技术仍然有一定的改善空间。

二是基于计算机视觉技术的车辆检测与流量统计:目前城市交通路口的红路灯间隔时间是固定的,而不同路段、不同时间段交通流量是随机变化的。若能根据各个交通路口的交通状况辅以计算机进行自动分析,并判断与预测交通流量,无疑为交通警察出警,红绿灯时间间隔的动态设置等提供技术支持。

三是基于计算机视觉技术的公交专用道路非法占道抓拍:公共交通是每个城市交通的重中之重,城市的公共交通为老百姓提供了便捷的出行方式。公共交通的发展,有利于城市的节能减排,有利于降低城市的空气污染指数。由于城市公共交通具有运量大、相对投资少、人均占有道路少等优点,解决城市交通问题必须优先发展城市公共交通。然而目前拥挤、缓慢的公交出行方式已成诟病,因此发展“快速公交”将是未来公交的一种运行模式。道路畅通则是发展“快速公交”的前提,相应地,公交专用车道的设定必不可少。为防止其他社会车辆的驶入,并对违规驶入的其他社会违规车辆进行抓拍与惩罚是保证公交车道公交车专驶的一种重要手段。因此在公交车前部装置摄像头并辅以其他处理设备,从而可以使得每一辆公交车成为了一个流动的监控设备。

3计算机视觉在条形码检测中的应用

条形码是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。在中国,由中国物品编码中心赋予制造厂商代码。那么最常见的计算机视觉应用与条形码检测就是在超市中。超市中每样产品都有自己的条形码,当人们选择了自己需要的物品后,来到收银台进行结账,我们会看见收银人员会用扫码器对物品的条形码进行扫描,扫描后就会出现产品的信息及价钱。记录以及扫描条形码的技术就是计算机视觉技术。

4计算机视觉重要技术——智能识别

近年来,基于生物特征的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。指纹、人脸功能已经大范围在生活中应用,其中很多单位的打卡制度就是依据面部识别、指纹识别来实现的。社会飞速发展的今天,很多的单位都实行了上下班打卡制度,这一制度已经被作为单位管理制度中的重要一条。购买的打卡机就是采用计算机视觉的重要技术——智能识别来实现的。利用打卡机的储存功能,记录每个职工的指纹或面部容貌,规定在某一个时间范围内对应识别指纹或面部容貌,视为打卡。在上下班打卡的过程中,员工将面部或指纹对应在打卡机的制定位置上,让打卡机进行识别,当识别的结果与存储结果相同时,打卡成功。这样看起来十分简单的打卡机可以使单位的工作有序化,制度化,而实现这个功能的技术就是计算机视觉技术中的重要技术之一:智能识别。

5计算机视觉技术的发展过程及未来

计算机视觉技术研究经历了近40年的过程,20世纪50年代的统计模式识别、60年代的Roberts的三围积木世界、70年代的Marr为代表的计算理论、80年代的主动视觉,但是仍然面临许多的问题。主要由于计算机视觉是一个逆问题,视觉信息多种多样,视觉知识的表达很困难,图像数据量巨大,信息存储于检索困难,对生物学、神经生物学等的研究有待深入。

计算机视觉技术的未来必定会朝着高科技发展,航空遥感测控地形地貌、电影特效制作、工业生产自动化检测、医学影像检测,再到天文领域等,在这些科学领域中计算机视觉将无法取代,成为主流的技术之一。

作者简介

计算机视觉研究的目的篇5

1.1自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。

2.1计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3计算机视觉技术在检测食品中微生物含量的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3检测性能受环境制约

计算机视觉研究的目的篇6

关键词:计算机视觉系统工业机器人探究

中图分类号:TP242文献标识码:A文章编号:1007-9416(2015)05-0000-00

计算机视觉系统主要是为了工业机器人更好的工作而研发出来的,是一套装有摄像机视场的自动跟踪与定位的计算机视觉系统。近年来,机器人已经广泛使用于工业生产,但是多数机器人都是通过“示教-再现”的模式工作,在工业机器人工作是都是由操作员进行操作示范再由机器人跟着示范进行工作。由于机器人缺乏对外界事物的识别能力,工作中经常发生偏差或者位移等情况。由于工作环境的恶劣以及各种阻碍,为了提高工业机器人的工作效率、灵活性、适应性等,让机器人更好的识别外部环境并及时调整运作方向,能更好的发挥其作用,在原有的机器人系统中添加了一套计算机视觉系统,利用计算机视觉图像装置的信息,通过图像使机器人进行外部环境的识别处理,采用三维的重建,通过作业中利用三维图像的信息进行计算,采用Motocom32软件和机器人控制柜通讯等设备,对工业机器人进行控制,更好的实现机器人对空间特点的跟踪与定位。

1系统的结构与原理

本文主要针对MotomanUP6工业机器人系统的二次研究,在原有的工业机器人的系统中,增加了一套计算机视觉系统,使工业机器人更好的识别外界环境的系统。计算机视觉系统主要包括:PanasonicCCD摄像机、MotomanUP6工业机器人系统、工控机、OKC-50图像采集卡等外部设备。工业机器人的整个系统由原有系统与计算机视觉系统组成,在原有的系统中包含了YASNAC-XRC-UP6机器人控制柜、MotomanUP6工业机器人本体、示教编程器、Motocom32系统以及相关的外部设备等[1]。计算机视觉系统的设备主要有PanasonicCCTV摄像机、AVENIRTV镜头、OK系列C-50图像采集卡、工控机、AVENIRTV镜头、PanasonicCCD摄像机、OK系列C-50图像采集卡形成的视频采集系统主要是捕获物体的图像,该功能主要是分三个层次进行图像处理、计算、变换以及通信等功能来实施工控机。利用远程控制来对工业机器人进行Motocom32系统进行通信。

2计算机视觉系统的构建

2.1硬件的组成

CCD摄像头:选用的CCD摄像机采用PAP-VIVC810AOZ型彩色摄像头,如图1。摄像机的像素为P:500(H)x582(V),N:510(H)x492(V),摄像机的分辨率为420。摄像机的成像器使用1/33"CCD,信噪>48dB,同时摄像机具有自动背景光补偿、自动增益控制等功能。

图像采集卡:图像采集卡主要采用CCD摄像头配套的MV-200工业图像处理。如图2所示。MV-200图像采集卡的分辨率、图像清晰度具有较高的稳定性,其真彩色实施工业图像采集卡,该图像采集卡的硬件构造、地层函数都具有稳定性,同时在恶例的环境中都可以稳定运行[2]。图像采集卡的图像采集效果非常好,画面效果非常流畅。

MV-200图像采集卡性能特点:其分辨率为768x576,具有独特的视频过滤技术,使图像质量的采集、显示更加清晰流畅。主要支持的系统为Win98/2K/XP,主要用于人工智能、事物识别、监控等多种领域。

工控机:工控机以奔4系列为主。

2.2软件组成

图像匹配软件。

图像处理与获取软件。

定标和定位算法软件,功能分布如图3所示。

3视觉系统的原理及流程图

工业机器人的主要系统包括是由工业机器人本体、相关的外部设备、控制器(供电系统、执行器等)计算机视觉系统主要由三部分组成:图像处理和获取、图像匹配、摄像机的定位等组成。通过借助OpenCV的视觉库进行VC++.NET实行,流程如下图表4所示。

在本视觉系统运行中,需要对摄像机实行定标,建立实际空间点和摄像机的对应点。在定标的过程中,就需要标记基准点,使摄像机在采集图像时可以准确的把这些基准点投放到摄像机的坐标上[3]。同时在采集卡的图像中,对图像进行处理并计算出该基准点图像的坐标,通过定标计算法,从而得出摄像机的参数。

在机器人系统中的反馈,计算机通过C语言的调节图像采集卡进行动态链接来控制函数[4]。同时,对摄像机中的数据、视频信号进行采集,构成数字化的图像资料,采用BMP格式存储进行计算,在计算机上显示活动视频,然后系统对获取的图像进行分析处理,以及对噪声的去除、图像的平滑等进行处理,利用二值化处理对那些灰度阀值的图像进行处理,同时检测计算机获取图像的特征量并计算[5]。在完成图像的处理后,就需要确立图像的匹配特征,对图像进行匹配[6]。如果两个图像不重叠,就需要建立3D数据库进行模型重新选择,再把模型进行计算、投影计算、坐标更换等指令,直到找到与图像相匹配的数据模型,才能真正得到真实有效的图像。重叠时,要获得有效的图像,以工业机器人识别物体为目的,才能建立机器人系统之间的通信。同时,通过三维图像重建,进行机器人空间定位[7]。如下图表5所示。

4结语

综上所述,计算机视觉系统主要是为了工业机器人更好的工作而研发出来的,是一套装有摄像机视场的自动跟踪与定位的计算机视觉系统。通过3D数据模型指定目标,机器人系统利用计算机视觉图像的采集装置来识别外界环境的数据,经过图像的姿态预算、影像的投影计算产生图像,通过图片的合成比较,以此来实现机器人在工作中对物体的识别。利用计算机系统对机器人进行有效的控制,在工业机器人工作中对事物目标的搬运、跟踪、夹持等指令。计算机视觉系统具备清晰的视觉功能,有利于提高工业机器人的灵活性以及适应性。

参考文献

[1]夏群峰,彭勇刚.基于视觉的机器人抓取系统应用研究综述[J].机电工程,2014(06):221-223.

[2]华永明,杨春玉.机器人视觉系统在立体编织自动铺纱过程中的应用研究[J].玻璃纤维,2011(01):189-191.

[3]王培屹.基于多传感器多目标实时跟踪视觉系统在全自主机器人上的应用[J].软件导刊,2011(01):263-264.

[4]谭民,王硕.机器人技术研究进展[J].自动化学报,2013(07):123-125.

[5]鲍官军,荀一,戚利勇,杨庆华,高峰.机器视觉在黄瓜采摘机器人中的应用研究[J].浙江工业大学学报,201(01):93-95.