计算机视觉方法(6篇)
计算机视觉方法篇1
关键词:计算机处理技术;图形图像;视觉传达
中图分类号:TP391.41
计算机技术在多媒体设计领域的应用使得人们的思维与创作理念发生了重大改变,应用计算机相关技术和软件对图形图像构建模型并进行虚拟效果添加与展示极大地提升了科学与艺术之间的沟通,为传统的图形图像设计方式带来了全新的魅力和视觉效果。
相较于传统的平面设计而言,计算机设计出的图形图像所包含的内容和元素更多更丰富,所传达的意思和概念也更全面更突出。其不仅代表着现代图形设计的目的还蕴含着视觉传达的未来发展趋向。
计算机图形图像相关技术可以通过相关的数据分析与信息处理手段呈现出设计者希望的艺术表现力,更为突出的是,计算机能够在很大程度上满足设计者的设计需求,将多种设计细节量化到非常具体的数值,允许其对比和修改,故基于计算机绘制出的图形图像更能够体现作者所希望传达出的设计意图和设计理念。
1基于计算机的图形图像设计与视觉传达效果概述
1.1计算机相关技术的作用分析
计算机技术在图形图像领域的设计属于定量式设计,其可以将图形图像中的色彩信息与结构信息分解为若干个相互独立的,可用数值来衡量与评估的元素。因而基于计算机所开展的图形图像设计目的更加明确,各内容之间的搭配更加合理、突出,设计者可以从传统的手工绘制过程中解放出来,将自己的创作灵感转化为具体的可实现的创作流程,让计算机辅助设计师达到和完成传统的创作方式所无法达到的精确度和设计效果。总体来看,基于计算机的图形图像相关内容设计速度更快,定位更精确,配色配图更准确,所带来的视觉冲击力更强。
对图形图像进行设计的目的在于进行有效的视觉传达。图形图像中的任一元素的大小、结构、色泽、外观等不同符号和形式均被赋予了不同属性的传达目的和目标人群。应用计算机进行视觉传达设计可以更加精确的对事物本身的标志、图形以及代表符号等进行组合与搭配,使其更具感染力,从而更能够被潜在受众所认知和接受。
1.2设计与实现方法分析
计算机是现代图形图像设计与视觉传达设计的主要手段和实现平台,其已经成为设计者必需的工具。目前主要的设计与处理软件有AdobePhotoshop、PhotoImpact、Painter以及CorelDraw等。这些工具都支持对图像进行细节设计与调整,以便于更好的传达出作者的设计意图。由上述计算机设计软件所创作的作品可被应用到广告、新闻、电影以及其他大众传媒等多个领域。
2计算机设计方式对图形图像与视觉传达的影响
2.1绘图与设计工具的革新
计算机继承了传统的绘画工具所具有的绘画特点,但是在此基础上对可图形图像的艺术风格进行了拓展,可以使用更多的创作方法对图形图像进行处理,诸如Adobe等图像处理软件支持图文混排、图像编辑、图像扫描、特效处理等功能。相较于传统的手工设计方式而言,计算机辅助工具极大的提升了设计实现效率,节约了排版或转换时间。特别地,计算机允许设计者按照个人意愿对图像内容进行修改,甚至达到摄影与手绘所无法达到的视觉感染力。
2.2视觉传达设计领域拓展
将计算机技术融入到视觉传达设计中可以极大的丰富视觉语言,使受众形成更明显、对比更清晰的视觉感受。计算机设计手段的应用使得视觉传达作品无论是在素材方面还是在应用领域方面都进行了多元化扩展,如图标或符号元素的扁平化设计风格转变、多媒体互动式视觉传达发展、多维化动态化的设计素材转变、虚拟作品与形象的设计与传播等。
在动态交互、新媒体设计等理念地不断推动下,计算机所处理的视觉传达设计同时具有了声、光、动画等内容,覆盖了纸质传媒、包装、网络形象、广告、海报等范围。
2.3创意与表现技法提升
借助计算机设计者可以更为轻松的完成图形图像处理工作,这就使得设计者可以将更多的时间和经历投入到创意设计与效果评价等工作中。成熟的创意放入相关处理软件中进行修饰、扩展、试验即可确认其是否满足使用需求。
更为重要的是,计算机网络中存在海量的优秀资源和素材,计算机图形图像处理软件可以依照设计者的需求将设计者选取的素材进行组合、调色、添加滤镜等,这种处理方式极大的提升了视觉传达设计的维度和空间,使得所设计出的作品展现更逼真更具创意,所应用的手法更丰富更具冲击。应用计算机对图形图像进行视觉传达设计可以让设计者的理念和信息更为精准的传递到受众。
3计算机图形图像设计与视觉传达设计的异同比较
3.1相同点分析
图形图像设计与视觉传达设计相似度很高,很多内容和目的存在交叉性,都需要设计者具有一定的专业知识储备和图形处理软件应用等。在专业学习方面,两者同样都覆盖了绘图与平面设计等相关知识内容,都需要设计者学习和掌握基本的色彩搭配与图形符号搭配等内容。在计算机应用软件方面,图形图像设计还是视觉传达设计所使用的图像处理软件是相同的,如Photoshop、3DMax等。在创意方面,两者均需要设计者具有一定的审美观念,可以灵活组合与运用现有的技术和素材,可以通过作品的创造与再生来与受众进行观念沟通。
3.2不同点分析
虽然两者之间存在大量的相同点,但是在本质上来说,图形图像设计更多的关注在图像处理方面,而视觉传达设计则更多的关注在创意展示方面。这种设计目标的差异性就决定了两种设计方式在创作法则和技术手段取舍方面存在一定的区分度。这种区分度让两者互为指引,互相推动,最终形成更好更具影响力的设计作品。
首先,视觉传达设计目的在于为所设计的产品树立生动的形象,赋予其更鲜明的美感和更具活力的动感。而计算机图形图像设计的目的在于利用现有素材对图形图像进行动态和静态的处理,使其更具多维性和空间性。
其次,视觉传达设计利用点、面、形、光等设计内容将设计者的观念和思维转化为具体的、可见的、可理解的视觉作品。而计算机图形图像设计则主要是集中在对现有素材的在开发与在创作等方面,其利用计算机软件的数据处理能力将多种效果结合在一起,以更加协调、更具对比度的方式呈现给受众。
再次,视觉传达设计在基本知识体系的基础上更加注重创作者的创作理念的形成、对视觉设计相关历史的理解,即其理论与实践并重,作品实现方式与实践灵活度等方面相对较为枯燥。而计算机图形图像则允许设计者根据自我的审美观念对图形图像进行处理和实现,还可以运用所学的知识到诸如视频编辑、照排印刷等工作中,其实现方式和工作对象更广泛。
4计算机图形图像设计与视觉传达设计的应用领域分析
计算机图形图像设计与视觉传达设计两者不是独立的,而是相辅相成的。它们的主要应用领域集中在文字设计、包装设计、广告设计与影像创意、绘画设计、功能界面设计等,涵盖了广告、影视、互联网等行业。
4.1文字设计
文字是现代设计中所使用的最基本元素之一,包含文字位置、色彩、色调、大小、字体等内容,熟练应用计算机处理软件来尝试各种效果搭配可以让文字与图像、符号等内容有机融合。特殊环境中,文字还可以作为整个设计作品的主体向受众传递明确、清晰的信息,让受众感受到强烈的视觉传达内容。
4.2包装设计
包装已经成为人们生活中接触最频繁、辨识度最高的标识之一。吸引顾客的注意、实现商品的价值、增强物品的传播力和影响力等式包装设计的核心目标。新颖的、定位清晰的、感染力强的包装设计通常可以极大的吸引顾客的注意力,让其对产品产生潜在的兴趣和定位。包装设计领域中的图形图像设计与视觉传达设计包括书籍封面、海报、宣传彩页、大屏幕视频、食品服装包装等。为实现物品的真正价值,都需要利用计算机图像设计与处理软件对其包装进行艺术化、形象化设计,进而吸引受众的注意力,让其对产品内涵形成统一的,更为深刻的认知与定位。
4.3广告设计与影像创意设计
广告作品的感染力同样离不开计算机图像设计与处理软件的支持。利用计算机处理软件可以将所设计的作品的优点进行合理放大,从而增强对广告内容的宣传与展现力度,具有创意的广告设计方案还能够引起人们共鸣,给人们留下深刻的印象。而影像设计作品的商业目的不高,更多体现为设计者的某种个人意愿,这就为视觉创意设计带来了广阔的发展空间,推动了计算机图像设计的发展与完善。
但是无论哪种设计都需要使用精准的视觉传达设计手段和灵活的图形图像设计手段来将所要展示的内容、理念、风格等整合到一个完整的、统一的形象中,这一过程需要经过反复多次修改才能实现。为呈现最佳的设计效果,就必须依靠计算机图像处理软件进行高速效果模拟与试验。
4.4绘画设计
计算机图像处理软件的出发点是制作元素更丰富、色调更协调的绘画作品或形象。借助这些软件,作者只需要使用铅笔绘制出草稿即可使用计算机软件完成剩下的工作内容。这种设计方式一方面提升了作者的工作效率,另一方面能够以精准的填色与搭配方式为绘画作品带来更强烈的视觉冲击力。
4.5交互界面设计
电子终端产品在人们日常生活中的普及使得大量的APP软件或游戏展现在人们眼前,其中人机之间的交流主要是通过交互界面实现的。美观、简洁、高雅的交互界面设计也是计算机图形图像设计与视觉传达设计的主要应用领域之一。合理安排交互界面的呈现方式,如二维、三维等元素处理与搭配可以有效提升交互界面的互动性,让用户形成连续的操作印象,顺利完成操作。
5总结
借助计算机图像处理软件可以有效提升图形图像设计与视觉传达设计的实现效率,为设计者提供丰富的设计内容,让设计者使用更多的处理技巧和处理手段对所设计的作品进行调整或完善。并且图形图像与视觉传达设计的结合还能够创造出更加震撼、更具感染力的艺术作品,不断推动人们利用现代化工具将自身的思维和创新能力展现在别人面前。
参考文献:
[1]焦翔,段傲霜,孙士兵.用户交互界面设计研究[J].数字技术与应用,2009(10).
[2]金波.数字时代视觉传达设计的构成关系浅释[J].美术大观,2007(4).
[3]邵玉兰,赵昕.关于计算机图形图像设计与视觉传达设计的分析[J].信息与电脑,2013(03).
计算机视觉方法篇2
关键词:计算机视觉;课程创新;教学改革
中图分类号:G642.0文献标志码:A文章编号:1674-9324(2016)20-0118-02
计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。
一、计算机视觉课程的特点
近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。
二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别
1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。
2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。
三、高校计算机视觉课程教学的创新策略
1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授RichardSzeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。RichardSzeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。
2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。
3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。
四、结语
在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。
参考文献:
[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).
[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).
[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).
[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).
[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).
[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).
计算机视觉方法篇3
关键词:计算机辅助教学;视觉媒介;综合技能;教学形式
中图分类号:G64文献标识码:A文章编号:1005-5312(2012)11-0215-01
视觉传达设计是通过视觉媒介表现并传达给观众的设计,其领域与其他领域不断相互交叉,高校纷纷加大对艺术类专业的投入。在众多院校中,在课程设置方面也是各有特色,但是有一点是相同的,即计算机辅助课程归纳到各个学校的教学计划之中的,且成为该专业的骨干课程。
一、视觉传达专业计算机辅助设计类课程的设置现状
视觉传达设计是指利用视觉符号来传递各种信息的设计。总的来说,视觉传达专业计算机辅助设计类课程主要分为以下几类:平面设计软件类(Photoshop、Coreldraw、Illustrator、Indesign)、二维动画软件类(Flash)以及影视后期制作软件类课程(Aftereffect、Premire)。Photoshop作为一款图像处理和绘图软件成为该专业学生必须掌握的工具,其强大的作用及功能几乎渗透到视觉类专业的所有科目。Coreldraw、Illustrator软件作为必须掌握的矢量软件,在制作插图、标志、书籍装帧、版式设计、VI设计、包装设计等主干课程中发挥到不可忽视的作用。二者作为基础性软件,容易学习和上手,是学生入门的好软件。Flash软件可以用于二维动画和多媒体创作。Aftereffect是目前世界上最广泛的视频合成软件之一,广泛用于数字电视,视频的后期制作,在PC系统上可以完成较好的合成效果。
二、视觉传达专业计算机辅助设计类课程的设置现状
独立院校教育以市场需要为导向,着重在于培养学生的动手能力。因此,计算机辅助课程相对于其它课程来说实践课时较多,以强化学生运用软件的能力。计算机辅助设计类课程要求学生利用日益增多的各类设计素材库,对图像进行处理,变化出更为丰富的视觉语言。如今软件升级换代十分迅速,这要求学生及教师能不断的更新知识,在学习的过程中,要学会质疑和尝试,触类旁通去学习和寻找不同的操作方法。
三、视觉传达专业计算机辅助设计类课程的教学方法
(一)案例式教学法
学会工具的简单用法,最容易达到。通过了解功能、界面、菜单、面板以及工具的基本使用方法,就大致了解。学生除了在课堂上消化和吸收教学案例以外,学会举一反三,大量的课外钻研也有必要的。
(二)项目式教学法
项目式教学法是通过进行一个完整的“项目”工作而进行的实践教学活动的培训方法。在教学实践中,拿实际项目里的课题研究作为项目,它能为学生日后进入工作岗位积累实践经验,这种过程对学生的学习能力有着极大的提高。
四、视觉传达专业计算机辅助设计类课程存在的误区
在教学方面:有的教师侧重于工具的教授,然后辅以大量的图例去启发学生。有的教师则完全把软件课变成单独的软件培训班的模式,一味的填鸭式教学,不去培养学生的创新能力。这些情况只会使学生的软件学习能力停留在很低的层次。
在学习方面:学生不动脑筋,不愿意去探讨原理和基础工具运用,只是默默地跟着范例,至于为什么会,不去探究。另外有些同学不善于做笔记,不勤加练习,今天会明天忘,所以说软件的学习过程也是个需要潜心修炼的过程。
五、视觉传达专业计算机辅助设计类课程的有效进行
(一)针对性的设置课程
学校在开展计算机辅助设计类课程的初期,可以尝试着去要求学生对常规软件(例如Photoshop、Coreldraw、Illustrator等),达到创新的运用程度。其它的软件,学生可以根据自身的学习情况和接受能力进行多样性的选修。同时也可以在这三类基础软件上加大课时的投入,以巩固学习成果。
(二)教学与实践相结合
学校与相关单位紧密协作,定期到单位参观实习此外加大投入让学生能参与到国内外的各项比赛中,以赛代练。
(三)加强师资培训,提高教师业务水平
计算机视觉方法篇4
基金项目:陕西省自然科学研究计划项目(2010JK740;2010JM8019);西安理工大学学科联合研究项目(102-210914)。
作者简介:吕林涛(1955-),男,陕西西安人,教授,主要研究方向:网络与信息安全、数据挖掘;赵呈轩(1982-),男,河南新乡人,硕士研究生,主要研究方向:网络与信息安全;尚进(1984-),男,河南郑州人,硕士研究生,主要研究方向:网络与信息安全;杨宇祥(1974-),男,湖南湘潭人,副教授,博士,主要研究方向:生物医学信号检测与处理。
文章编号:1001-9081(2011)07-1847-03doi:10.3724/SP.J.1087.2011.01847
(1.西安理工大学计算机科学与工程学院,西安710048;2.西安理工大学机械与精密仪器工程学院,西安710048)
()
摘要:针对目前色情图像过滤算法对比基尼图像和类肤色图像误检率过高,且不能有效过滤带有动作的多人色情图像的缺点,提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型首先通过改进的SURF算法提取色情场景局部特征点,然后融合视觉单词的上下文和空间相关高层语义特征,从而构建色情图像的高层语义词典。实验结果表明,该模型检测带有动作的多人色情图像准确率可达87.6%,明显高于现有的视觉词袋色情图像过滤算法。
关键词:色情图像;过滤;图像高层语义;语义树;视觉词袋;鲁棒特征加速
中图分类号:TP393.08;TN911.73文献标志码:A
Pornographicimagesfilteringmodelbasedon
high-levelsemanticbag-of-visual-words
LaLin-tao1,ZHAOCheng-xuan1,SHANGJin1,YANGYu-xiang2
(1.SchoolofComputerScienceandEngineering,Xi'anUniversityofTechnology,Xi'anShaanxi710048,China;
2.SchoolofMechanicalandPrecisionInstrumentEngineering,Xi'anUniversityofTechnology,Xi'anShaanxi710048,China)
Abstract:Currentpornographicimagesfilteringalgorithmshavesomeshortcomings,suchashighfalsepositiveratetowardthebikinisimagesandinsufficiencywhenfilteringpornographicimageswithpornographicactions.ThepaperproposedanewpornographicimagefilteringmodelbasedonHigh-levelSemanticBag-of-Visual-Words(BoVW).Firstly,localfeaturepointsinsexsceneweredetectedusingtheSpeeded-UpRobustFeatures(SURF)algorithmandthenhigh-levelsemanticdictionarywasconstructedbyfusingthecontextofthevisualvocabulariesandspatial-relatedhigh-levelsemanticfeaturesofpornographicimages.Theexperimentalresultsshowthatthemodelhasanaccuracyupto87.6%whentestingthemulti-personpornographicimages,whichissignificantlyhigherthantheexistingpornographicimagesfilteringalgorithmbasedonBoVW.
Keywords:Pornographicimage;filtering;imagehigh-levelsemantics;semantictree;Bag-of-Visual-Words(BoVW);Speeded-UpRobustFeatures(SURF)
0引言
快速有效地监测和过滤网络色情信息已经成为网络信息安全中的一项重要研究课题。现存的色情图像过滤技术虽然对网络上明显的图像可以实现较好的过滤效果,但不能有效过滤带有动作的多人色情图像,并且对含有比基尼的正常图像误检率较高。
随着视觉词袋(Bag-of-Visual-Words,BoVW)算法在图像检索和场景分类领域的成功应用[1-2],2008年ThomsDeselaers等人[3]首次提出采用视觉词袋算法提取图像高层特征过滤色情图像,该算法大大提高了色情图像的识别效率,但忽略了肤色特征。2009年AnaP.B.Lopes等人[4-5]在此基础上加入色调信息提出了HUE-SIFT特征描述算子,采用固定词汇大小分配,最后使用基于支持向量机(SupportVectorMachine,SVM)分类算法进行色情图像的分类。但该算法对词袋算法本身缺乏优化,算法需要付出昂贵的计算时间。2009年YIZHILIU等人[6]提出了构建SURF(Speeded-UpRobustFeatures)视觉词汇的方法来提取肤色区域的局部特征算子以减少SIFT算法的计算时间[7],虽然SURF的计算效率较SIFT算法有较大提高,但是视觉词汇聚类过程中采用简单的K-Mean聚类算法,造成语义缺失。2009年王宇石等人[8-9]采用视觉单词和语义映射算法检测色情图像,该算法虽然采用了语义映射模式,但是未能对高层语义视觉词组进行提取,因此算法仍存在一定的局限性。
针对目前色情图像过滤算法误检率过高等问题,本文提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型在传统低层视觉特征基础上,利用语义分析和理解相关技术,提取图像中包含的高层语义特征,从语义层面来识别不良图像,不仅符合机器视觉认知过程,而且可有效弥补现有算法比基尼图像误检率过高、不能有效过滤带有动作的不良图像过滤技术的不足。实验证明,算法可以有效过滤带有动作的多人不良图像,较同类算法识别率高,误检率低。
1高层语义视觉词袋的色情图像过滤模型
本文提出的基于高层语义视觉词袋的色情图像过滤模型如图1所示。该模型主要包括特征提取、高层语义词典构建和分类器构建三部分。
1)特征提取采用文献[6]中的SURF(4×4)算法提取局部特征;
2)高层语义词典构建通过随机森林算法[1]将提取的视觉基元的进行分类产生底层视觉词汇,并将中级词汇再次分类、融合上下文关系和空间相关特征[10-12],最终构建具有高区分度的高层语义视觉词典;
3)分类器采用文献[1]中的χ2-kernelSVM分类算法。
图1高层语义视觉词袋的色情图像过滤模型
2高层语义词典构建算法
高层语义词典构建算法主要通过视觉基元分类和视觉单词分类两阶段完成。视觉基元分类算法主要由随机森林算法和消除干扰词算法完成;视觉单词分类主要由上下文相关视觉词汇分配算法和空间相关视觉词汇分配算法完成。最终完成高层语义视觉词典的构建。高层语义词典构建算法流程如图2所示。
图2高层语义词典构建算法流程
2.1空间相关视觉词汇的权重分配算法
色情图像最明显的特点是有大面积的肤色区域和敏感器官的暴露,视觉词汇在分配的过程中如果对色情图像空间相关的视觉词汇加权分配,可以有效识别敏感区域和和提高视觉词汇的区分度。本文采用对色情图像空间相关的视觉词汇加权分配[10]。算法描述如下:
1)从兴趣点集合提取出的视觉词汇集合wl(1
2)计算视觉词汇wl在高斯βi条件下加权频率Tfwlβi,Tfwlβi∑nim1P(βi/Zm);
3)计算视觉词汇wl的平均权重Tfwl,Tfwl∑nwli1(Tfwlβi)/nwl;
4)计算wl的权重Ifwl,Ifwlln;
5)计算视觉词汇wl最终空间权重Swwl,SwwlTfwl×Ifwl。
2.2人体器官特征的空间拓扑结构算法
传统的视觉词袋算法通过编码局部突出片段的视觉基元获取视觉单词,但是却忽略了图像对象间的空间拓扑结构,本文将利用人体器官特征的空间拓扑结构表达的三角关系提取色情图像高区分度特征。经研究发现,人体器官特征本身具有一定的空间拓扑结构,利用人体器官特征的这一特点可以准确判定图像是否含有人体躯干部位。对于图像中包含单人的色情图像身体倾斜度不大于90°,人体暴露的胸部特征和人脸特征基本成三角形状,如图3所示。
图3色情图像人体器官特征空间拓扑结构
本文采用简化2D字符串[11]构建高层语义视觉词汇间的空间拓扑结构,假设V是人体器官特征对象集合,集合内每一个对象对应一个高层视觉词组,本文用“
2.3多人色情图像高层语义树构建算法
对于包含多人的色情图像,除具有大面积的肤色区域信息,更重要的是包含一些特定的动作,主要有亲吻、拥抱以及躯体部位的粘合。亲吻主要涉及嘴部和其他敏感器官,拥抱主要涉及肢体,躯体粘合主要涉及人体躯干和敏感器官。上述三种行为语义基本构成多人色情图像中的行为语义特征,色情图像高层语义树构建过程如图4所示。
图4色情图像高层语义树构建过程
在图4中,语义模型包括:人体器官对象模型和人体相关行为模型。由于色情图像相关的语义词汇中有些词汇出现的概率较高,因此,本文在文献[12]提出的加权分配语义词汇算法基础上,去除场景语义模型,只对人体器官对象视觉词组和人体行为相关视觉词组加权分配。对于数据集合V中任意一张图像Ci,如果人体器官对象视觉词组概率为PO,人体行为相关视觉词组概率为PA,可以通过公式PCiαPO+βPA,α+β1,计算Ci的敏感系数。当敏感系数大于阈值t时判定此图为色情图像。
3实验结果分析比对
为了验证高层语义视觉特征在色情图像过滤中的效果,本文通过采用网络收集的色情图像和PascalVOC2010图像库正常图像作为训练和测试数据集合,并与本领域著名文献[4,6,9]中方法完成实验结果对比。
3.1实验采样数据集
实验图像来自网络和PascalVOC2010图像库,其中在网络上收集的色情图像5800张,可以分为A类:包含明显的图像;B类包含比基尼图像;C类:包含带有动作的多人色情图像;正常图像5000张均取自PascalVOC2010图像库。
训练数据集和测试数据集分别为3000和5560张图像,从三类色情图像中各随机取出1500张进行训练,另外手工标注了2000张色情图像的人体躯干和敏感区域(性器官),用来产生各类低层视觉语义单词。
3.2实验结果比对
本文采用随机森林算法从1932900个关键点中分类产生了7883个SURF视觉单词,并根据词汇的上下文关系和空间相关特征进行再次分类,产生5120个中级视觉词组,同时将中级词组分为2150个人体器官相关和2980个人体动作相关的高层语义词汇。最后对高层语义词汇编码形成色情图像高层语义词典。
由于色情图像中包含大面积的肤色区域和人体敏感器官,此类局部特征点具有明显的上下文相关和空间相关特性。表1结果表明:加入上下文相关和空间相关特性的视觉词汇分配算法的特征区分度要明显高于传统视觉词汇分配算法;三类图像的过滤正确率本文算法均高于其他算法。视觉词袋算法的时间复杂度主要取决于特征提取和视觉词汇分配算法的时间复杂度,本文采用文献[1]中的随机森林算法对视觉词汇进行分配,缩短了视觉词汇分配的计算时间。实验结果表明,在特征提取和词汇分配两个阶段的总计算时间,本文算法的平均计算时间均低于其他三类算法。四类算法特征提取和词汇分配平均计算时间比对如图5所示。
表1四类色情图像过滤算法正确率对比
%
4结语
基于视觉词袋的色情图像检测是一种很有前景的方法,因为通过理解图像表达的高层语义对色情图像进行过滤不仅可以过滤明显的图像和多人色情图像,而且也符合机器视觉和认知理论。本文用具有高区分度的高层语义特征进行分类检测速度和准确度都较现有算法有较大提高,但在过滤90°侧身的色情图像检测方面有待进一步研究。
图5四类过滤算法特征提取和词汇分配平均计算时间对比
参考文献:
[1]UIJLINGSJRR,SMEULDERSAWH,SCHARJH.Real-timevisualconceptclassification[J].IEEETransactionsonMultimedia,2010,12(7):665-681.
[2]WULEI,HOISCH,YUNENGHAI.Semantics-preservingbag-of-wordsmodelsandapplications[J].IEEETransactionsonImageProcessing,2010,19(7):1908-1920.
[3]DESELAERST,PIMENIDISL,NRYH.Bag-of-visual-wordsmodelsforimageclassificationandfiltering[C]//ICPR2008:19thInternationalConferenceonPatternRecognition.Washington,DC:IEEEComputerSociety,2008:1-4.
[4]LOPESAPB,deAVILASEF,PEIXOTOANA,etal.Abag-of-featuresapproachbasedonHUE-SIFTdescriptorfornudedetection[C]//EUSIPCO2009:Proceedingsofthe17thEuropeanSignalProcessingConference.Glasgow,Scotland:Mendeley,2009:1552-1556.
[5]LOPESAPB,deAVILASEF,PEIXOTOANA,etal.Nudedetectioninvideousingbag-of-visual-features[C]//SIBGRAPI'09:Proceedingsofthe2009XXIIBrazilianSymposiumonComputerGraphicsandImageProcessing.Washington,DC:IEEEComputerSociety,2009:224-231.
[6]LIUYIZHI,XIEHONGTAO.ConstructingSURFvisual-wordsforpornographicimagesdetection[C]//ICCIT'09:12thInternationalConferenceonComputersandInformationTechnology.Washington,DC:IEEE,2009:404-407.
[7]LUOJUAN,GWONO.AcomparisonofSIFT,PCA-SIFTandSURF[J].InternationalJournalofImageProcessing,2009,3(4):143-152.
[8]王宇石,李远宁,高文.基于局部视觉单词分布的像检测[J].北京理工大学学报,2008,28(5):410-413.
[9]王宇石,高文.基于视觉单词和语义映射的色情图像检测算法[J].高技术通讯,2009,19(10):1041-1047.
[10]LITENG,MEITAO,KWEONI,etal.Contextualbag-of-wordsforvisualcategorization[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,21(4):381-392.
计算机视觉方法篇5
关键词:计算机工程;视觉领域;深度学习技术
引言
计算机视觉简言之即是依靠电子设备成像来代替生物视觉系统,随后依靠提前写好的程序对获取的图像信息实施处理。该技术的短期应用目的在于完成相对简单的智能视觉工作,而深度学习技术在计算机视觉领域的应用,在很大程度上丰富了其功能,提高了识别效率,让其能够在更多行业发挥出自身价值。
1计算机视觉领域的深度学习技术
1.1图像分类中的深度学习技术
基于深度学习技术,卷积神经网络得到了进一步的发展,其应用范围也更为宽泛,例如说在图像分类中的运用。图像分析需要对图像实施扫描分析,随后对其具体类别予以划分,更加注重其整体语义。目前相对普遍进行图像分类的数据集为ImageNet,其中囊括了非常丰富的内容,存储了近1500万个图像的URL并将图像划分为数万余个类型。ImageNet每年组织开展的大规模视觉识别挑战赛(ILSVRC)中,图像分类算法与技术也不断创新,图像分类的准确性也持续提升。ImageNet数据集表现出规模大、类型多的突出特点,所以更加适用于迁移学习,即是把部分核心技术或结构拓展应用到各个领域,对于视觉领域的深度模型来说,能够把模型内的网络结构和参数直接共享到其他数据集,从而对数据实施微调。图像分类属于计算机视觉领域最为基础的环节,对于图像分类模型创建和数据分析处理经验也能够迁移应用到其他领域中。
1.2目标检测中的深度学习技术
目标检测相对于图像分类而言表现出更多的复杂性,主要任务是在囊括多种不同类型物体的图像内精确定位和识别某一物体,恰恰是出于这一目的,深度学习技术在目标检测中的应用更为复杂,要实现更加精准的效果也相对更难。近年来针对目标检测的算法日益更新,如优化后的R-CNN算法,是借助于卷积神经网络思想,对物体进行分类,提取物体特征。而SelectiveSearch算法的出现有了进一步的创新和突破,有效促进了检测准确性的提高,这也给通过卷积神经网络进行目标检测带来了更多可能性,随后的FastR-CNN算法极大地促进了目标检测效率的提升,该算法对提取候选区的问题予以优化,大大减少了候选区提取和目标检测过程的时间。目标检测网络以FastR-CNN算法作为支撑,于输出位置设置滑动窗同时和候选区域网络实施连接,目标检测的关键在于卷积神经网络,依靠它把各个点的特征进行提取,再借助回归算法获得对应范围出现目标的概率[1]。
1.3人脸识别中的深度学习技术
人脸识别主要是借助相应算法对人脸特征实施提取,因为其建立的人脸模型表现出一定的不稳定性,因此模型建立往往也表现出一定的难度,相对于建立刚体模型而言更为困难。人脸识别通常来说涉及人脸检测定位以及特征提取两个方面,人脸检测定位是基于背景图像中将人脸目标分割出来,实施归一化处理,而人脸特征提取算法不变。前者存在的技术难点是人脸目标具有多样性以及背景图像具有复杂性,所以对背景情境实施合理假设并予以简化是十分关键的。与此同时,高维空间人脸模型的建立较为复杂,精确度估算难度较大,人脸特征提取的技术难度是因为人脸属于弹性模型,其难度超过刚体模型。一般来说,较为常见对人脸特征实施提取与识别的方法有几何特征法、特征脸算法以及弹性模型法,CNN算法和过去的特征提取算法比起来表现出更高的稳定性和适用性,同时能够有效抵抗外部干扰,促进人脸识别技术的推广应用。
2应用实例
2.1安防领域的应用
深度学习技术在计算机视觉领域中的应用可以为安防行业提供更佳的解决方案,比如说人脸识别技术的应用,很多大型企业如Facebook、腾讯、阿里巴巴等都将非常关注和重视。作为深度学习技术在计算机视觉领域应用的重要内容,人脸识别在安检以及反恐等领域中也能够发挥出很好的效果。与此同时,对行人角度的REID技术实施研究,依托于深度学习强化目标检测,对目标特征实施提取和刻画,能够为异常行为监控和跟踪带来支持[2]。
2.2无人驾驶领域的应用
对于无人驾驶领域来说,选择激光或雷达这类传感器的成本更高,基于深度学习的计算机视觉技术也能够提供新的解决方案。依靠摄像机对视频画面进行采集,对获取到的图像实施分析,提供类似于前车碰撞预警等功能。在这一过程中,计算机视觉技术可以实现对目标的检测识别、对目标车辆的跟踪分析、对车道线是否偏离进行检测等。基于深度学习技术的检测识别表现出更加强大的优势,现阶段深度学习芯片日益增多,对于无人驾驶技术的发展也带来了更加有力的支持。
2.3智能家居领域的应用
过去的很多智能家居产品一般都是依靠智能手机蓝牙或者WiFi等途径来实现对家居产品的控制,这一方案即便能够做到家居智能化,但其水平依旧有待提高。基于深度学习技术,能够有效促进智能家居行业的更新发展,除开语言、语音识别之外,还能够利用计算机视觉技术实现人际交流与互动,比如说手势识别控制。2.4教育领域和图片搜索领域的应用基于深度学习的计算机视觉技术也能够在智慧教育中得以普及应用,如近年来很多新的拍照解题App,使用者只需要利用手机相机拍照上传即可获得相关题目的分析解答,促进学习者学习效率的提升。此时视觉技术包括了对文字的检测与识别,另外针对个人简历识别、文档识别等方面也能够进行拓展应用。同时计算机视觉技术还可以在图片搜索领域中得以应用,使用者通过拍摄上传相应的图片,即可从数据库中找出与原图相似的图片,深度学习属于一种非常高效的技术手段,能够提供更加快速高效的图像检测功能,结合图像搜索引擎,为用户带来更加便捷的服务[3-5]。
2.5医疗影像数据中的应用
医学影像直接关系到对患者疾病诊断的准确性,对于放射科的医务人员来说,依靠医学影像能够促进诊断效率的提升。现阶段国内外诸多医学专家队伍,在心血管、肿瘤、神经内科以及五官科等都建立了精准深度学习模型,极大地推动医疗水平的提升,为广大患者带来了更加便捷和高效的医疗服务。基于深度学习技术的计算机视觉在医疗影像数据中的应用主要集中在如下几个方面:(1)能够提供临床诊断辅助等医疗服务;(2)依靠数据分析技术,能够在很大程度上促进医疗机构经营管理水平的提升;(3)在医学影像中的应用,能够让医务工作者更加直观便捷地获取患者影像;(4)深度学习技术能够为医疗大数据的可视化带来便利;(5)在药企研发工作中的应用,可以处理好过去一直以来药物研发周期长和成本居高不下的问题;(6)在健康管理领域中的应用,借助于可穿戴设备来对个人健康数据实施监测,进而对疾病风险予以提前预测。
计算机视觉方法篇6
关键词:智能视频监控;目标跟踪;运动分割;图像标定
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)35-8499-03
1概述
在人类的活动所涉及的各种信息中,以视觉信息所占是比重最大。人类主要依靠视觉系统来形成记忆。计算机视觉系统便是模拟人类视觉系统的某些功能,用摄像机和电脑代替人眼对目标进行识别、跟踪、测量,实现计算机对三维景物世界的理解。计算机视觉是计算机科学和人工智能的一个分支,目前既是工程领域也是科学领域里一个极富有挑战性的研究项目,它的实现,将给相关重要应用领域,如制造业、医疗诊断、检验以及军事领域中的智能、自主系统等,带来质的改变。近三十年来,计算机视觉技术已经取得了突飞猛进的进展,它的巨大应用前景将使得这种发展势头继续保持相当长的时期。
计算机视觉是通过运用各种成像系统代替人的视觉器官实现成像输入的,再由计算机来代替大脑完成对视频图像的分析和处理。目前有两种技术途径可以实现计算机的智能视觉效果,一个是仿生学方法,另一个是工程方法。仿生学是从分析人类视觉入手,通过对人类视觉成因原理的了解,参考人类视觉建立一个计算模型,用计算机系统将所有的过程和结果一一重现。由于这种技术方法目前还有许多难题需要破解,进展十分缓慢,因此更多的考虑采用工程方法。工程方法脱离了人类视觉系统的种种条框,从另一个角度寻找各种可行的技术方法实现计算机的视觉功能。
对于人类来讲,视觉系统虽然是获取信息的途径中占比最大的,但是,其他获取信息的通道也是必不可少的。在人类的智能系统中,感知行为是通过各个通道分别获取信息,然后汇集起来,使人类获得一个全面的感知。每个通道所获取的信息对于事物的理解或许是不全面的,但是,将所有的信息通道所获取的信息进行总和后却是可以得到一个相对完整的认识的。以前所研究的比较初级的人工智能系统就犯了以偏概全的毛病,希望通过独立运行一个完美的功能子系统就能获取所有的信息。为了达到这样一个目的,不得不去人为施加种种约束条件,或者造一些脱离实际的理想数据,结果可想而知。我们在研究计算机视觉系统的可行性方法的时候,也要认识到计算机视觉只是人工智能的一部分,它的功能是不能够孤立实现的,必须结合不同的应用背景,与不同的感知通道相互配合,综合达到智能视觉监控系统的目的。例如,计算机视觉系统运用在通信中,应与语言通道想配合;在发现和跟踪目标的应用中就要注意和激光和超声波等非视觉技术配合等。目前,关于计算机视觉的理论还不是太完善,但是相关的应用已经先行一步,该文对计算机视觉系统方面的实际运用方面进行了研究。
2计算机智能视频健康概述
2.1计算机智能视频监控研究现状
计算机视频监控是通过计算机视觉和图像处理来完成对目标的一系列监控目的,比如运动检测、运动目标跟踪、目标分类以及目标行为的描述与理解等。将这些监控目的进一步划分,其中运动目标的类与跟踪、运动检测是近年来视频监控领域里研究较多的项目,也是属于视觉处理中低级和中级的部分;而高级部分是行为的描述和理解,这也是业内近年来较多受到关注的研究热点,它代表了监控行业未来的发展方向,也是信息产业的未来发展趋势。由于它巨大的应用前景,产业界、学术界和各级管理部门都对它给予了高度重视,其中蕴藏着的巨大商机和所带来的经济效益更为人们津津乐道。
人们可以运用计算机智能视频监控系统对拍录到的图像序列进行自动分析,它特有的计算机视觉和视频分析技术可以自动完成这个过程,不需要人为进行过多干预。这样,就可以在很大程度上解决“他们正在做什么”、“他们将会做什么”的问题,而后,人们通过进一步的决策推理过程对“我们可以采取什么问题”的疑问给出答案。目前,社会上发起的平安城市等大型项目已经给智能视觉系统的应用提供了可供借鉴的方向,同时,还可以扩展到人流量统计、监控偷油行为、入侵行为等,这些需要用到智能识别系统的项目都使得人们逐渐对计算机智能视频监控系统重视起来。
2.2计算机智能视频监控系统与运动目标检测技术
目标的运动检测是一项相当困难的工作,这是因为背景图像中往往还存在一些动态变化的影响,如影子、光照、遮挡、混乱干扰以及天气等。这些因素的干扰使得人们很难将运动变化的区域从背景图像中提取出来。直接影响了对目标的分类、跟踪和行为理解等后期处理。目前,常用了运动目标检测技术有背景减除、时间差分、Rosenblum等。
2.3计算机智能视频监控与运动目标跟踪技术
2.3.1运动分割
动态环境中捕捉到的运动目标图像大多受到各种不确定因素的影响,如影子、物体之间或者与环境之间的遮挡、摄像机的运动、光照条件的变化等,这些都给准确有效的运动分割带来困难。但是,快速准确的运动分割是一个相当重要的环节。就拿影子的干扰来说,若是影子与与检测目标分离,容易引起误会,将影子误认为是场景中的目标;若是影子与目标相连,则会扭曲了目标的形状,使得基于形状的目标识别方法不再可靠。目前主要采用的是背景减除法,这种方法的适用范围有限。人们目前还没有找到对于任何复杂环境中的动态变化均有适应性的处理模型。研究者们试着运用时空统计的方法构建自适应的背景模型,也许对于那些不受限于环境的运动分割而言是个好方法。
2.3.2目标跟踪的分类
2.3.2.1根据目标跟踪与目标检测的时间关系可分为三类
一是先检测后跟踪,而是先跟踪后检测,三是边检测边跟踪。
2.3.2.2根据目标跟踪的所采取的策略来分,有3D和2D两种
3D的方法是在一个由基于坐标系构筑的三维立体世界内进目标进行跟踪,2D则是在一个二维平面内对目标进行锁定跟踪。2D的方法所需处理的数据较少,跟踪操作速度较快,但是,对于遮挡问题无能为力。
2.3.3跟踪方法细分
2.3.3.1基于特征的跟踪方法
不管是刚体运动还是非刚体运动,在一序列图像中,相邻的两帧图像中,由于采样时间间隔十分短,在视觉上差别微小,可以认为是这些个体特征在形式上具有平滑性。
2.3.3.2基于主动轮廓的跟踪方法
用参数表示轮廓线,运用目标的边缘特征提供运动方式、物体形状之外的其他目标信息。
2.3.3.3基于运动估计的跟踪方法
运用运动估计技术对目标进行分割和跟踪是一种常用的做法。
2.4图像标定
由目标在图像坐标系下的坐标来求得在世界坐标系下的坐标,称之为图像标定。通常是根据摄像机的内外参数来实现的,简称为摄像机标定。这种方法中,需要注意的是摄像机所得到的图像投影容易受到几何形变的影响,这样在建模的时候,导致精度不够。像平面与所拍摄的物平面上的两条平行线,在图像上就可能是两条相交的直线。一个匀速运动人,想要在图像坐标系下计算出其速度。但是,在近距离拍摄时,测得的速度快,远距离拍摄的时候,测出的速度慢。在进行目标跟踪之前,对目标进行良好的图像标定,可以使目标的动态特性建模效果更加精确。
2.5计算机智能视频监控技术难点
数字化、智能化是视频监控系统的未来发展趋势。目前,视频监控系统系统智能化还需面对许多问题,这些问题大多源于计算机视觉技术方面。
2.5.1从实际情况来看
视频监控系统需要面对一个十分复杂且不断变化的应用环境,这给计算机视觉技术的应用带来了更高的要求,要求能够自动、连续地工作,才能将目标从复杂环境下的分离、结构出来,从而进一步完成其他分析工作。
2.5.2其次,运动目标本身具有多样性的特征
如何使这些目标摆脱客观环境的限制,将目标的变化区域从背景图像中提取出来,从而目标进行运动分析、分类,尤其是对非刚性目标运动进行跟踪、行为理解还是相当困难的,这也是智能视频监控系统领域里近年来研究的重点。
2.5.3若是监控的范围扩大,就需要大量的摄像机进行协同工作
但是,实现多台摄像机对运动目标连续、一致的视觉分析还非容易之事。
2.5.4目前该领域内还产生了建立视频数据库的想法
系统通过这样的方法实现海量视频信息的存储、检索和查询,这方面也是近年来研究的热点,目前还处于起步阶段。距离视频监控系统的智能化目标还有相当长的路要走。
2.6计算机智能视频监控应用前景展望
2.6.1人数统计
在许多人流量大的地方都有人流量统计的需求,如火车站、广场等。这时候目标以人头为基本计算单位,对人头的检测和跟踪是主要技术要求。实际上这种检测轮廓非常重要。
2.6.2车流量统计
在许多路口,交通部门对车流量也需要有个大概统计,许多地方的车流量可以通过其他检测手段检测,视频图像是最快和较为准确的一种方式。
2.6.3遗留物检测
自911事件发生以来,全球对于公共安全的意识日益重视,各国纷纷采取多种措施防范恐怖主义袭击,例如加强出入口管制、随身行李检查、增加警备人员数目、追踪可疑人士的行径等。其中,监控系统扮演了非常重要的角色,特别是在车站、机场、大型商场等人口密集的地区,一旦发生炸弹引爆等恶意袭击事件,后果不堪设想。为了及早防范,监控系统需要采用具备遗留物侦测的智能分析系统,对可疑滞留物品实行及时通报和处理。另外,遗留物侦测也可以用来解决自动提款机(ATM)的安全问题。部份不法份子会在ATM加设卡片阅读机或贴上误导性信息,达到骗取钱财的目的,设置遗留物侦测系统可以及时发现这些非法架设的物品。遗留物侦测还可以用于侦测遗规泊车的情形,结合车牌辨识系统更可达到全自动的智能化执法。一旦发现禁止停车区域有车辆停留,便会触发遗留物警报讯号,并启动车牌辨识器记录违规停泊车辆的车牌号码,大大降低交通执法人员的工作量和运作成本。
2.6.4遗失物检测
在博物馆或公共展览厅贵重物品失窃的情形时有发生,单纯依靠录像做事后处理的消极性做法往往不能解决问题,如果在物品遭窃的瞬间就能马上发现对于防范事件有相当重要的作用。遗失物侦测的作用是可以侦测到画面上物品被移走或是偷走的情形,及时发出警报,同时也能自动分辨出对象属于遗留物还是遗失物。但这类检测对同色物体的分辨分析运算能力有很高的要求,同时对硬件的配套布置也有很严格的要求。
当摄影机被移动或是画面被遮蔽时会造成场景变化,侦测器便可以根据这种情况判断摄影机异常并发出警报。这种应用更加广泛。通产的移动检测都属于此范畴。
在实际应用场景中,日光对监控的影响较大,一般要避免逆光。
3结束语
综上所述,目标跟踪有非常广泛的应用市场需求,我国还处于起步阶段,研发出具有自主知识产权的、稳定可靠、技术先进、节约成本等特点的智能监控系统,可以有效填补国内空白。随着技术的成熟,硬件的推陈出新,应用产品的大幅降价,使得应用范围不断扩大,将来这方面会有更好的前景,使之成为一个能带动相关产业集体发展的一个新型产业。
3.1对经济发展的作用
良好的市场前景会促进企业在该产业的科技力量投入,有力促进了智能监控技术革新,使得企业进入了经济发展的快车道,同时带动了电子产业及相关企业的技术革新及经济发展。形成技术革新与资金的一个良性循环。
3.2对社会发展的作用
增加了对地方经济和就业需求的拉动。产业链的形成,强化实施企业之间的横向经济联合和技术协作,通过企业间技术平台上的横向协作,在特色产业基地内形成合力,打造一条新型的产业链。
3.3对人才培养推动作用
企业的相关类技术人员之间不断的合作交流,大大提高了企业相关类技术人才一个质的飞跃。达到技术推介和人才培养的目的,为国内,特别是经济发达地区今后在电子科研技术领域的进一步发展奠定人才技术的基础。
参考文献: