当前位置: 首页 > 范文大全 > 办公范文

计算机视觉导论(6篇)

时间:

计算机视觉导论篇1

图像处理、图像分析、机器视觉和计算机视觉是彼此紧密关联的学科,其特点均具有很强的理论性和实践性。如果在教学中不重视实践教学或实践教学手段不力,都不利于学生创新能力和动手能力的培养。高校教师应重视理论教学的同时,更要重视实践教学,关键是要找到强有力的教学方式和教学手段,找到恰当的图像处理软件。Matlab科学计算软件具有丰富的图像处理工具箱[1-2],目前被广泛1应用于图像处理的教学中。但是,机器视觉课程具有很强的理论和实践性,一些功能齐全的机器视觉软件,如Halcon和OpenCV等软件的出现,为提高这些课程的实践教学效果提供了新的手段。本文将探讨如何应用Halcon软件改进实验教学方式和手段,并结合实例说明Halcon在机器视觉等课程教学中的应用。

1机器视觉硬件系统概述

机器视觉系统[3]是基于机器视觉技术为机器或自动化生产线建立的一套视觉系统,图1为实验用机器视觉系统,包含摄像机、照明光源、镜头、图像采集卡和计算机组成。

2Halcon概述

Halcon软件是德国MVtec公司开发的一套完善的标准的机器视觉算法包[4],是得到广泛应用的机器视觉集成开发环境,提供了1100多种具备突出性能控制器的库,如图像的运算、图像的几何与数学变换、滤波、色彩分析、Blob分析、形态学计算分析、3D校正等。Halcon软件保障与硬件无关,支持大多数图像采集卡及带有Directshow和IEEE1394驱动的采集设备。

Halcon软件包含一个功能强大的交互式软件接口HDevelop,提供一个通用的浏览界面,访问不同的图像采集设备,支持Windows、Linux和Solaris运行环境,为用户搭建了快速有效的图像处理程序开发平台。它甚至可以从图像采集设备中实时捕捉图像。HDevelop拥有很多数据和图像检查的图形工具。它的图形用户界面支持多种显子语言。HDevelop具备语法检查,语法凸现,函数参数的合适取值,后续操作和替代算子建议,程序调试,完整的在线帮助等功能。Halcon软件还可以导出以C++、C#、C、VisualBasic或者VB.NET程序,以嵌入到其他程序中。

3实验教学应用实例

在机器视觉等课程的理论教学中,我们的教学目的是让学生掌握相关的理论知识,在机器视觉等课程的实验教学阶段,我们更要培养学生的算法编程能力和实践应用能力。利用Halcon软件的高度交互式编程环境HDevelop,能编译和测试视觉处理算法,可以方便查看处理结果。再者,Halcon软件自带许多图像处理与机器视觉的相关案例,涵盖了图像处理与机器视觉基础知识的大部分内容[4]。我们在教授学生理论知识的同时,结合案例的讲解,使学生在掌握理论的同时熟悉实践过程,进而培养学生的编程实现能力。因此选择Halcon软件作为教学软件,成为培养学生图像处理和视觉处理算法编程能力和实践能力的又一重要手段。由于篇幅限制,这里仅以利用Blob分析算法实现车牌识别的实例来说明Halcon软件在机器视觉与数字图像处理等课程教学中的应用。

Blob分析算法实现车牌定位识别程序如下:

read_image(Image,'lisence')

fill_interlace(Image,ImageFilled,'odd')

threshold(ImageFilled,Region,0,90)

connection(Region,ConnectedRegions)

select_shape(ConnectedRegions,SelectedRegions,'width','and',30,70)

select_shape(SelectedRegions,Letters,'height','and',60,110)

sort_region(Letters,SortRegions,'upper_left','true','column')

read_ocr_class_mlp('Industrial_0-9A-Z.omc',OCRHandle)

do_ocr_multi_class_mlp(SortRegions,ImageFilled,OCRHandle,Class,Confidence)

area_center(SortRegions,Area,Row,Column)

disp_message(3600,['Theresultis:'],'window',200,150,'yellow','false')

forIndex:=0to6by1

disp_message(3600,Class[Index],'window',200,300+20*Index,'yellow','false')endfor

上面程序中,利用read_image算子读入要识别的车牌图像,命名为Image,如图2所示;通过fill_interlace算子修改在采集图像过程中造成的两个半幅图像拼接的问题。接着,用threshold算子对图像进行阈值分割处理,分割出含有车牌的图像区域,灰度阈值范围为0~90;接着用connection算子将选择出来的区域进行相联,形成相连区域ConnectedRegions,如图3所示。处理后的图像除了车牌区域使我们的感兴趣区域外,其他的都为干扰区域,于是用算子select_shape通过限定width和height将车牌区域选择出来,如图4所示。车牌区域共有7个,从左至右排序后,利用现有Industrial_0~9A~Z字符库对车牌7个部分进行识别,用到算子do_ocr_multi_class_mlp。识别之后,利用for循环将结果用浅黄色字体显示在窗口中,实验结果如图5所示。

从上面的车牌识别实例可以看出,HDevelop交互编程环境中的函数概念清楚,用法明了,应用简单。由于每一个HDevelop算子的各个参数都可以在编程过程中及时调整和编辑,这样我们在实验过程中对程序进行单步调试,讲解重要算子的选择、调试和参数编辑,让同学们看到算法运行的每一个步骤,这样同学们就能很快掌握相关知识点。Halcon具备可实时查看图像属性的交互对话框,来查看程序中的参数设置,灰度直方图,特征值柱状图,放大镜和特征检测等。随着学生对HDevelop编写算法的掌握,后续的教学部分可以从HDevelop导出算法代码并集成到应用程序中,例如生成用户界面等,这样同学们就可以开发机器视觉程序,添加用户界面,集成调试生成可执行的应用程序。

计算机视觉导论篇2

关键词:视觉导航;移动机器人;图像处理

中图分类号:TP242文献标识码:A文章编号:1009-3044(2008)09-11705-01

RobotVisionNavigation'sSummarize

WULin

(LiaoningFinaceVocationalCollegeInformationTechnologyDepartment,Shenyang110122,China)

Abstract:Navigation'stechniqueisthecoreofmobilerobot.Mobilerobothasmanynavigationmethods.Thisthesismakeaanalysisandcontrastamongallkindsofnavigationmethods,itgivesthatbecauseofthedevelopmentofvisiontheoryandmethod,andcomparetolaser,radarandultrasonic,visionnavigationhasmanyadvantages,sovisionnavigationareadoptedinmanyfields.Mobilerobotprocessesthepictureintheprocessofnavigation,thebadofreal-timealwaysisaverytoughproblem.Thekeyofsolvingthisproblembasedondesigningakindoffastpicturetreatmentmethod.

Keywords:visionnavigation;mobilerobot;picturetreatment

移动机器人是一种在复杂的环境下工作的具有自规划、自组织、自适应能力的机器人。移动机器人集人工智能、智能控制、信息处理、图像处理、模式识别、检测与转换等专业技术为一体,跨计算机、自动控制、模式识别、智能控制等多学科,成为当前智能机器人研究的热点之一。

在移动机器人的运动过程中始终要解决的是自身的导航与定位问题,相关技术研究中,导航技术可以说是其核心技术,也是其实现真正的智能化和完全的自主移动的关键技术。也就是DurrantWhyte提出的三个问题:(1)“我现在何处?”;(2)“我要往何处去?”;(3)“要如何到该处去?”[1]其中问题(1)是移动机器人导航系统中的定位及跟踪问题,问题(2)、(3)是移动机器人导航系统中路径规划问题。导航研究的目标就是没有人的干预下使机器人有目的地移动并完成特定任务,进行特定操作。机器人通过装配的信息获取手段,获得外部环境信息,实现自我定位,判定自身状态,规划并执行下一步的动作。

移动机器人的导航方式分为:基于环境信息的地图模型匹配导航;基于各种导航信号的路标导航、视觉导航和味觉导航等[2]。

环境地图模型匹配导航是机器人通过自身的各种传感器,探测周围环境,利用感知到的局部环境信息进行局部地图构造,并与其内部事先存储的完整地图进行匹配。如两模型相互匹配,机器人可确定自身的位置,并根据预先规划的一条全局路线,采用路径跟踪和避障技术,实现导航。它涉及环境地图模型建造和模型匹配两大问题。

路标导航是事先将环境中的一些特殊景物作为路标,机器人在知道这些路标在环境中的坐标、形状等特征的前提下,通过对路标的探测来确定自身的位置。同时将全局路线分解成为路标与路标间的片段,不断地对路标探测来完成导航。根据路标的不同,可分为人工路标导航和自然路标导航。人工路标导航是机器人通过对人为放置的特殊标志的识别实现导航,虽然比较容易实现,但它人为地改变了机器人工作的环境。自然路标导航不改变工作环境,是机器人通过对工作环境中的自然特征的识别完成导航,但路标探测的稳定性和鲁棒性是研究的主要问题[3]。

视觉导航,计算机视觉具有信息量丰富,智能化水平高等优点,近年来广泛应用于移动机器人的自主导航。视觉导航方式具有信号探测范围广,获取信息完整等优点,是移动机器人导航的一个主要发展方向[4]。目前国内外主要采用在移动机器人上安装车载摄像机的基于局部视觉的导航方式,如文献[4]中所提及的:D.L.Boley等研制的移动机器人利用车载摄像机和较少的传感器通过识别路标进行导航;A.Ohya等利用车载摄像机和超声波传感器研究了基于视觉导航系统中的避碰问题等。视觉导航中边缘锐化、特征提取等图像处理方法计算量大且实时性较差,解决该问题的关键在于设计一种快速的图像处理方法或采取组合导航方式[4-5]。

味觉导航是通过机器人配备的化学传感器感知气味的浓度,根据气味的浓度和气流的方向来控制机器人的运动。由于气味传感器具有灵敏度高、响应速度快以及鲁棒性好等优点,近年来许多研究人员在气味导航技术上做了许多研究工作。但该项技术能够真正应用到实际环境中的却很少,仍处于试验研究阶段。FigaroEngineeringInc.公司研制的氧化锡气味传感器,被广泛用于气味导航试验。石英晶体微平衡气味传感器、导电聚合物气味传感器和一种模仿哺乳动物鼻子功能的电子鼻等用于移动机器人味觉导航的传感器都处于试验阶段。目前的味觉导航试验多采用将机器人起始点和目标点之间用特殊的化学药品,如酒精和樟脑丸等,引导出一条无碰气味路径,机器人根据不同的道路跟踪算法,用气味传感器感知气味的浓淡和气味源的方向进行机器人导航试验。味觉导航的研究具有很好的研究价值,该种移动机器人可用来寻找化学药品泄露源。

由于计算机视觉理论及算法的发展,又由于和激光、雷达和超声在导航方面相比,视觉导航具有以下几个优点:首先,即使在丢弃了绝大部分的视觉信息后,所剩下的关于周围环境的信息仍然比激光雷达和超声更多更精确;其次,激光雷达和超声的原理都是通过主动发射脉冲和接受反射脉冲来测距的,因此当多个机器人同时工作时,相互之间可能产生干扰,而视觉由于是被动测量,因此多个机器人相互之间的干扰可以减少到最小;最后,激光雷达和超声数据的采样周期一般比摄像机长,不能及时对高速运动的机器人提供信息并作出规划,因此视觉传感器被大量地采用。目前移动机器人的导航大都采用基于视觉或有视觉参与的导航技术。最近二十年来,在未知或部分未知环境中,基于自然路标导航与定位技术的研究;视觉导航中路标的识别以及图像处理的新型快速算法的研究成为了计算机视觉的主要研究方向。

视觉导航主要完成障碍物和路标的探测及识别。国内外应用最多的是在机器人上安装车载摄像机的基于局部视觉的导航方式。P.I.Corke等对有车载摄像机的移动机器人视觉闭环系统的研究表明,这种控制方法可以提高路径跟踪精度。从视觉图像中识别道路是影响移动机器人导航性能的一个最重要因素。对于一般的图像边沿抽取而言,已有了许多方法,例如,局部数据的梯度法和二阶微分法。Trahanias利用视觉探测路标来完成机器人的导航。其中路标不是预先定义的人工路标,而是在学习阶段自动提取的自然路标。在视觉导航中边缘锐化、特征提取等图像处理方法的计算量大,移动机器人是在运动中对图像进行处理,实时性差始终是一个非常棘手的问题。解决该问题的关键在于设计一种快速图像处理方法。为了满足速度的要求,基于统计计算的预值法被应用于机器人的导航,但在实际应用中发现,它抑制噪声的能力差,特别是预值的选取极大地依赖于环境,要想获得理想的结果,仅在一幅图像中的不同区域就要设置不同的预值。近些年,由于人工智能的发展,有很多好的算法被应用到移动机器人的视觉导航中去。比如,根据导航图像的特点采用边缘提取结合HOUGH变换的方法和带滤波窗的区域扫描的方法,经过检验,这两种算法都具有较好的实时性,对于直线形态的各类导航线以及对于已知半径的弧形导航线具有较高的可靠性,以上算法目前对于分支较多的直线形态的导航线以及未知半径的弧形导航线的效果不佳,这是今后努力的方向。

Stanley还提出了基于神经网络的机器人视觉导航技术。该技术中估算逆雅可比矩阵,并将图像特征的变化与机器人的位置变化对应起来,通过神经网络训练来近似特征雅可比矩阵的逆阵。该技术,通过提取几何特征、平均压缩、向量量化和主成分提取来简化图像处理,实现实时视觉导航。

综上所述,移动机器人是在运动中对图像进行处理,实时性差始终是一个非常棘手的问题。解决该问题的关键在于设计一种快速图像处理方法。将室内地面作为机器人视觉导航的路标。依据地面的颜色信息,将地面上没有障碍物的区域识别并分割出来,机器人在可行走区域内行走,这样就可以实现机器人的自主导航。利用环境中地面的颜色特征,采用比较简单的图像处理算法分割彩色图像,经实验证明可提高机器人导航的实时性、准确性和鲁棒性。

参考文献:

[1]郭戈,胡征峰,董江辉.移动机器人导航与定位技术[J].微计算机信息,2003,19(8):10-11.

[2]吕永刚,谢存禧.移动机器人的导航与路径规划的研究[J].机电工程技术,2004,33(1):19-21.

[3]KennethDHarrisa.Absolutelocalizationforamobilerobotusingplacecells[J].RoboticsandAutonomousSystem,1997,(22):393-406.

计算机视觉导论篇3

在我国市场经济不断发展的盛况下,我国科技发展水平也紧随其后,成为世界上的科技强国之一。在计算机水平的不断提高下,计算机视觉技术应运而生。其中,计算机视觉技术被应用与各个领域,并在各个领域都得到广泛有效的应用,比如军事领域、医疗领域、工业领域等。本文针对计算机视觉技术在交通领域中的应用进行分析。

【关键词】计算机视觉交通领域探究

近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。

1计算机视觉的概述及基本体系结构

1.1计算机视觉概述

通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。

计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。

计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。

1.2计算机视觉领域基本体系结构

提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。

2计算机视觉在交通领域的应用

2.1牌照识别

车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。

2.2车辆检测

目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。

2.3统计公交乘客人数

城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。

2.4对车道偏离程度和驾驶员工作状态判断

交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。

2.5路面破损检测

最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。

3结论

本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。

参考文献

[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).

[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).

[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).

[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).

[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.

[6]王大勇.关于计算机视觉在交通领域中的应用分析[J].科技与企业,2013(01):115.

作者简介

夏栋(1988-),男,湖北省孝感市人。现为同济大学软件学院在读硕士。研究方向为计算机视觉。

计算机视觉导论篇4

关键词:CAI课件;媒体;创景导学模式;整合

Apply"TheModelWhichCreateCircumstancestoGuideStudy"toMakeaSoftwareforInstructionorStudy

WUGui-fen

(LvliangHigherCollege,Lvliang033000,China)

Abstract:Thepaperdiscussesthemediumonmakingasoftwareforinstructionorstudy.Itsummariesthemajorcharactersofthemediaandputsforwardfouressentionfactorswhichmadeup"themodelwhichcreatecircumstancestoguidestudy",introduces"themodelwhichcreatecircumstancestoguidestudey"indetailfromprocess、characteristic,problemswhichmusttobenoticedandsoon.

Keywords:CAICourseware;medium;themodelwhichcreatecircumstancestoguidestudy;conformity

多媒体课件是计算机辅助教学中最要的一个内容。在教学进程中,一个课件的成功应用可以达到视听结合,生动、形象、感染力强,能引起学生的兴趣和注意力,激发学生的创造性思维的效果,对提高教学效率和教学质量起到很重要的作用。那么,要制作一个好的课作,它涉及到教学知识和计算机技术两个方面的内容。首先,课件制作必须在现代教育思想、教育理论、学习理论、教学设计理论等的指导下进行,使得教学课件符合教学规律,达到最佳教学效果。其次,为了处理多种媒体信息,课件制作又要运用多种计算机技术和工具。这里所说的媒体主要是指感觉媒体,用于我们感知客观环境,它是指集成在计算机系统中的文字、图形、图象、动画、语言、声音、音乐等多媒体,这些媒体都具有各自的教学特点和教学功能,一个好的课件必须合理地运用这些媒体,使它们发挥最大的教学潜力,使学生获得尽可能多的知识信息。在课堂教学中怎样选择媒体才最合适、最有效呢?一般情况下,选择媒体要注意考虑以下几个方面的因素。[1]

1媒体的主要特征

英国学者贝茨指出:各种教学媒体既有共性,也有各自的特性,同样的教学目标通过不同的媒体实现,每种媒体都有其独有的内在规律,任何媒体都有各自的优势和劣势,“万能媒体”是不存在的,而且各种媒体在不同的教学环境中对不同的学习者的效果也不尽相同。因此,关于教育媒体特性的研究一直是教育技术学科研究的内容,它是教育媒体有效应用的基础。

剖析计算机多媒体中的各个独立媒体,其表现力、传播力、参与性等方面与传统教育媒体相比有根本的不同。

1.1表现力

它是指媒体表现事物的能力。计算机多媒体是以视觉、听觉、还有触觉作用于人们的感官,它能表现事物的时间特征、空间特征、运动特征、声音特征、色彩特征。时间特征,是指计算机多媒体能呈现过去已经发生过的历史事件以及未来即将发生或正在发生的事件过程,能给学生交待出事物出现的先后顺序、持续时间、出现频率、节奏快慢等。空间特征是指计算机多媒体给学生提供宏观、微观的事物空间状态。还能以多视角、多景观给学生展现事物的发生、发展及其变化过程。使学生在学习时,能感觉到事物的空间形状和大小。运动特征是指计算机多媒体能表征连续变化的、具有一定运动状态的事物特征,而且可以借助电视技术改变事物的运动状态,如慢放、快放、静像、倒放等,有利于学生观察事物。声音特征是指计算机多媒体能给学生呈现事物的各种声音,包括自然界、社会界的音响,同期声以及人们的语言、音乐等。声音特征在学习过程中很重要,让学生不但能听到声音,而且能欣赏到音乐。音乐是一种最能表现喜、怒、哀、乐等情感变化的心灵语言,利用音乐可有效地实现情感教育。色彩特征是指计算机多媒体所能展现的事物外在形态的颜色变化。

1.2传播力

传播力也称渗透力,是指现代教育媒体传播信息的速度和所覆盖的范围。计算机不仅能在“第一时间”通过电波把信息传递出去,而且不受空间的限制,把信息传递到世界的任何角落。就是说计算机多媒体具有实效性强、渗透力大、覆盖面广的特性。

1.3参与性

参与性是指利用多媒体获取信息时的行为、感情的参与程度。计算机多媒体具有形象、直观、声画并茂的表现特征。顺应了学生接受视听信息的最佳感觉,心理需求,使学生产生全身心的情感呼应,激发了学习兴趣,引发了学习动机。而且能以面对面的形式,近距离地进行交流,产生了亲切感、接近感,这是其它媒体难以达到的感情参与。而且计算机媒体具有良好的可挖性,便于教师组织调节教学活动;学生的控制,便于自学。计算机媒体双向交互功能,能实现人机交互对话,这些特点使教师、学生的教学行为参与到整个教学过程中。所以计算机是一种行为参与程度、感情参与程度极高的媒体,特别适合课堂教学、个别教学和协作教学。

1.4多媒体化

计算机集文本、图表、图形、视频、音频、动画等多种媒体符号于一体并且以接近人类联想记忆的结构――超文本结构(非线性网状结构)组织、安排、呈现教学信息,这使人类知识方式向前跨越了一大步。[2]

2构建“创景导学模式”的四个要素

在多媒体环境下,实现现代信息技术与课堂教学整合的“创景导学模式”构建,应包含以下四个要素:

2.1激发动力

运用信息技术,创设生动形象的场景,激发学生自主或协作的情感,主动学习,善于学习,愉快学习。

2.2自学探究

运用信息技术提供具体、丰富的材料,创设典型事物形象,发展过程,设计疑问,引导学生观察、认识、理解、探究新知。

2.3合作交流

在现实条件或虚拟情景中,进行师生交流,发挥“主导”、“主体”作用,进行生生交流,学生互相讨论,交流学习体会,在交流中共同提高,在交流中发展能力。

2.4反馈评价

及时反馈学生自主或协作学习情况,进行分析与评价,改进教学方法,提高教学效率和效果。[3]

计算机视觉导论篇5

关键词:三目摄像机;标定;立体视觉;外部参数

一、绪论

1.1研究的背景及意义

计算机视觉是当今极为重要的学科之一,它在具有很强的挑战性的同时又拥有广泛的应用前景和实用价值。计算机视觉以视觉理论为中心,以图像处理、模式识别、计算机技术和生理学、心理学为基础,研究内容主要有两个方面:一是开发从输入图像数据自动构造场景描述的图像处理系统;二是理解人类视觉机理,用机器代替人去做人类难以达到或根本无法达到的工作[1]。

计算机视觉应用的广泛性体现在其不仅用于文字、指纹、面部、商标以及图像数据库、检测集成电路芯片、多媒体技术这些图像方面,还应用到机器人导航、工业检测和产品的自动装配、CT图像器官重建和遥感照片解释等空间物体的定位、识别以及重建上。现如今,计算机视觉已经应用到机器人、地理、医学、物理、化学、天文等各大的研究领域。

作为多个学科交叉与融合中心的计算机视觉,摄像机是其研究的重要工具,而摄像机标定又是计算机视觉研究的一个关键问题,故摄像机的标定越来越受到广泛的重视。摄像机标定是通过物体空间上的点与图像中的对应点的几何关系,来确定摄像机的内外参数的过程。标定结果是否准确影响着三维测量的精度和三维重建的结果,而且实时的标定更能满足自动导航机器视觉的需要[2]。

伴随着应用的发展,摄像机广泛地被应用于三维立体的测量、视觉检测、运动检测等领域。由此,对摄像机标定的精度要求也日益增加。摄像机标定结果的优劣影响了计算机视觉在各领域的应用。摄像机标定的准确与否,对能否提高计算机视觉在各领域测量的准确度有重要影响[3]。因此,研究摄像机标定方法具有重要的理论研究意义和实际应用价值。

1.2摄像机标定技术研究的发展及现状

摄像机有一个图像平面和提供三维空间到图像平面转换的镜头。由于镜头会产生畸变,不能把这个转化过程简单描述为投射变换。所以它表示的是畸变的模型,这些模型近似于真实数据,而其精确性则依靠于建立的模型及模型参数的准确性。

首先进行摄像机标定工作的是加拿大的Deville,他于1910年建立实验室,使用多个瞄准仪对他的“测量摄像机”(surveyingcamera)进行标定[4]。上个世纪三十年代后期,美国标准局发明了一种精确镜头,用来检测摄像机,同时将它用在摄像机标定上。四十年代后期,该项工作得到进一步加深,有了更多对高精度的需求和对易操作设备的需求。1955年,Carman出版了《棋盘平面度的干涉测量和控制》,该书引起了社会各界对摄像机标定的关注。二战时期,随着飞机的大规模使用,航空摄影与制图兴起,为得到更加精确的测量结果,对摄像机镜头的校正要求也变得更高。五十到七十年代也是镜头校正技术发展最为迅速的时间段。在这期间,各种镜头像差的表达式逐步被提出并且得到普遍认同与采用,建立了很多的镜头像差的模型,D.C.Brown等人作出了比较大的贡献,他们导出了近焦距情况下给定位置处径向畸变表达式并证明了近焦距情况下测量出镜头两个位置的径向畸变就可以求出任何位置的径向畸变[5]。这些径向与切向像差表达式成为后来各摄像机的标定非线性模型的基础。这段时间里,研究的重点是如何校正镜头与用何种方法补偿镜头像差,这些研究对促进各性能镜头组的研制起到了重要作用。在1999年,张正友提出了一种简便的摄像机标定方法,该方法介于传统标定和自标定之间,操作方便灵活,能够得到不错的精度,满足了众多拥有桌面视觉系统的用户在摄像机标定方面的需求。

1.3本文的主要研究内容

本文的主要研究多个摄像机的标定问题。标定主要是对摄像机内外参的测量计算,利用这些参数对多个摄像机识别的物体尺寸进行衡量并建立起多摄像机系统的数字环境。

论文的内容包括:

第一章为绪论,介绍摄像机标定相关的研究背景、国内外研究现状。

第二章为摄像机标定理论基础:主要介绍标定的坐标系与待标定的参数。

第三章提出本文的多摄像机标定方法与实验过程。

第四章进行全文的总结。

二、摄像机标定方法研究

2.1摄像机标定原理

摄像机通过透镜将三维物体投影到--维图像平面上,这个成像变换的过程称为摄像机成像模型。摄像机成像模型有多种,最常用的为小孔成像模型。由于实际的摄像机镜头会发生一定的畸变,使得空间点所成的像不在线性模型描述的位置而会发生一定的偏移,为了能准确的标定摄像机参数,标定的过程中要考虑非线性畸变因子。

一般来说,得到标定结果后要对其精度进行评估,然而很难得到准确的摄像机标定参数真值作为参考,其中基于图像坐标和世界坐标的绝对和相对误差的评价方法应用广泛,本文将对这些方法的原理进行探讨。

2.2摄像机标定坐标系建立

首先定义了四个坐标系,如图1所示,图像坐标系的坐标原点为O0,列与行由坐标轴u和v表示;成像平面坐标系的原点是摄像机光轴与图像坐标系的交点0l,x、y轴分别与u、v轴平行;在摄像机坐标系中,坐标原点0c即为在摄像机的光心,Xc、Yc轴与x、y轴平行,与图像平面垂直是摄像机光轴作为Zc轴,0c0l为摄像机焦距f;世界坐标系是假想的参考坐标系,可固定于场景中某物体上,用于描述摄像机的位置,由Xw,Yw,Zw轴组成。

图(1)

2.3摄像机外部参数构成

主动视觉传感器从在笛卡尔直角坐标系中的运动表现为相应的旋转矩阵和平移矩阵,故摄像机外部参数表现为旋转矩阵R和平移矩阵T,则摄像机坐标系与世界坐标系的转化关系可以表示成:

上式中(Xc,Yc,Zc)表示空间点在摄像机坐标系下的坐标,(Xw,Yw,Zw)表示空间点在世界坐标系下的坐标。根据靶标点在像空间坐标系和物方空间坐标系中的坐标,通过分解旋转矩阵线性计算像空间坐标系与物方空间坐标之间的转换参数,即外方位元素(摄站参数)[6]。

2.4各摄像机相对位置确定

三目摄像机拥有三个视觉传感器,而三个传感器之间的相对位置可通过已获得的外部参数进行确定。将三个摄像机坐标系设置为,Ocixciycizci(i=1,2,3),由2.3中所介绍的内容可知,这三个摄像机坐标系与世界坐标系的关系为:

i=(1,2,3)

由此我们可以得到任意两个摄像机i,j的坐标系转换关系:

其中:==i,j=1,2,3

三、摄像机标定实验过程及结果

3.1实验系统介绍

实验中被用来标定的是一个多摄像机系统,摄像机标定有关的基本参数、系统组成和开发环境如下:

(1)硬件环境

标定板、三目摄像机和图像采集卡等。

(2)软件环境

OpenCV开源视觉库,它仅由一系列C函数和少量C++类构成,为Python、MATLAB等语言提供了接口,在图像处理和计算机视觉方面实现了很多通用算法。

3.2实验过程

本系统以棋盘格模板作为标定模板。采用激光打印机打印棋盘格黑白方块间隔纸,方块边长为3cm,共6行9列,将打印纸固定在一块平板上,作为标定模板,如图(2)。安装三目摄像机系统,调节固定好个摄像机位置,如图(3)。手持标定板在三目摄像机前方各个位置拍摄5组共15张各姿态的照片,利用Canny算子进行像点灰度中心提取、同名像点匹配并解算出三个摄像机在标定板坐标系中的外部参数值。

3.3标定结果

摄像机1:

R=T=

摄像机2:

R=T=

摄像机3:

R=T=

四、总结

随着计算机技术的高速发展,计算机视觉成为当今热门的研究课题,受到了广泛关注。本文就如何在机器视觉的理论基础上对三目视觉系统进行标定进行了研究,讨论了计算机视觉理论知识,分析摄像机标定原理以及标定坐标系的建立。同时通过计算机视觉知识的分析讨论了基于三目视觉系统的摄像机标定技术,完成了三目视觉系统的外部参数标定实验。三目摄像机测量系统外部参数的标定能够解决测量作业现场、测量控制场建立难的问题,为快速地建立简单实用的控制场提供了方案,有一定的实用价值。

参考文献

[1]荆丽秋.双目视觉系统标定与匹配的研究与实现[D].哈尔滨工程大学,2009.DOI:10.7666/d.y1489086.

[2]马颂德.计算机视觉―计算理论与算法基础[M].北京:科学出版社,1998.

[3]王荣一.摄像机标定及关键技术研究[D].哈尔滨理工大学,2011.DOI:10.7666/d.y2012483.

[4]ClarkeTA,FryerJG.Thedevelopmentofcameracalibrationmethodsandmodels.PhotogrammetricRecord,1998,16(91):51-66

[5]BrownDC.Decenteringdistortionoflenses.PhotogrammetricEngineering,1966,32(3):444-462.

[6]范亚兵,黄桂平,高宝华等.三目立体工业摄影测量系统外部参数的快速标定[J].测绘工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949.2012.05.013

计算机视觉导论篇6

关键词:计算机辅助教学中学物理教学

一、利用计算机等多媒体课件发展学生创新思维

在中学物理教学中开展创造性教学需要借助许多条件,其中重要的一条就是要多角度、多方向、多层次、多方式、多顺序、多途径地提示认知对象,进行思维训练。计算机辅助教学恰好能够提供这种条件。在中学物理教学过程中,充分利用计算机优势,可使同学们的创造性思维和主体意识得到充分发挥。它具有多变换的优势,可以扩展认知领域,提示教材内在的逻辑关系。教师可以多变换地讲解、提问、设疑,启发学生勤于思考,拓展学生的思维空间,培养中学生的创新精神和创造潜能。在中学物理教学活动中培养创新意识是一项集科学性、系统性、长期性、连续性和艰巨性的教育任务,创新意识存在本末、轻重、缓急之分,在物理教学过程中要把总结与反思当做培养创新意识的出发点,这是提高学生综合素养的重要教学内容。只有有的放矢地做好创新教育与教学实践结合的每一个环节的工作,认真做好调查研究,弄清问题的根本原因,制订切实可行的计划,才能真正确保学生具有未来参与实践的创新能力和素质。其次,在中学物理教学中,可借助计算机使同学们养成良好的思维习惯,学会科学的思维方法。物理教师应利用计算机与生活、计算机与社会、计算机与环境,以及趣味性教学活动等有利条件,激发学生的学习兴趣,培养他们正确的学习方法,养成良好的学习习惯,培养对社会有用的人才。通过对教学目标的分析,教师根据教学活动的本质需求,面对不同教学对象确定每一次具体教学活动的主题内容,并且利用计算机创设与主题相关的教学情境。在学生自主地学习、实施“人机”交互的情况下,还要展开小组讨论、协商,进一步完善和深化理解。教师可结合生活实践设计一些学生相对比较熟悉的情境和问题,然后引导同学们共同探讨其中的核心问题,让他们畅所欲言,大胆想象。在整个活动过程中教师提的问题精巧而不多,但同学们说得多,互相讨论得多,老师注意观察每一个学生的具体动向,认真对待学生提出的奇特问题,给予耐心解答,对同学们的热情予以鼓励和表扬。同时将计算机作为物理教学过程中帮助学生积极学习,合理安排教学过程的工具,从而提高学生素质,达到最终目标,为优化整体素质教育奠定基础,为培养创新型人才夯实基础。

二、利用计算机构建有利于优化教学效果的情境

对中学生来说,如何有效激发探索新知识兴趣是至关重要的,在物理教学过程中,针对学生的学习兴趣和心理特点,利用计算机等多媒体技术为学生创设有利于物理教学形象化的课堂教学情境,以趣味性极强的动态视听感觉、形象的画面进一步激发学生的求知欲望,在物理课堂利用计算机演示物质运动现象的全程,有利于激发学生探索物质运动规律的兴趣,使传统被动的应试学习成为学生主动而乐于学习的主要动因。心理学研究表明,任何人的兴趣和学习动机主要是靠后天培养起来的,并不是与生俱来的,主要是通过外界事物的新颖性、独特性满足同学们的好奇心的需要而引发的,而计算机的有效运用正好能使这些因素得到进一步优化,往往最有利于激发学生的兴趣。心理学资料显示,一个人获取的外界信息,83%来自视觉,11%来自所觉,3.5%来自嗅觉,1.5%来自触觉,1%来自味觉,而计算机辅助教学恰恰在视觉、听觉效果方面提供了独特的优势。在物理教学活动中计算机是传递教学信息的重要载体,是传输信息的工具和手段。在物理教学过程中利用计算机辅助教学需要运用得当,如果运用不好,就不利于优化教学效果,如果很好地利用,则有利于调节课堂教学气氛,创设学习情境,充分调动学生的视听等感官,挖掘各方面潜能。通过计算机的实践运用为学生创设最佳的学习、探索情境,充分调动每一个学生的积极性、主动性,有效提高学习兴趣,使学生在形象、动态演示物质运动的教学环境中愉快自觉主动地学习,让学生最大限度地发挥自身潜能。

三、利用计算机多媒体实施形象教学有利于强化记忆