计算机视觉的主要任务范例(12篇)
计算机视觉的主要任务范文篇1
说起来,英特尔很早便开始关注VR了。从2016年开始,雷锋网发现,他们对外过ProjectAlloyVR硬件参考开放平台(今年9月宣布放弃该计划),2017年年初的CES上展示过一段六自由度视频,六月份的E3大展期间亮相过VR无线方案,甚至还宣布将为多届奥运会进行VR直播,以及还有很多他们没有公布的事情。
雷锋网觉得,对VR的研究,英特尔下了不少功夫。而在这次的媒体沟通会上,来自英特尔中国研究院通信架构实验室的研究员详细地介绍了5G和VR的结合,未来5G将如何助力VR的发展。
雷锋网将演讲全文整理如下。
通信架构实验室主要是致力于无线通信基础架构的研究,我们主要是采用通信和计算结合的方式打造高效的端到端的通信系统,提升用户体验。今天我给大家介绍的主题主要是汇报我们5G和VR结合的工作——“通信和计算融合,引领VR未来”。
主要介绍三个部分:
第一,5G主要面对的数据洪流,从架构上怎么支持5G的数据洪流。
第二,介绍研究院对于远程沉浸式互动的愿景。
第三,通信与计算融合解决移动VR关键问题。
我们研究工作的重点主要是通信和计算融合的方式,为什么需要通信和计算融合呢?大家如果从互联网厂商的角度可能认为通信系统基本上对我来说是透明的,我不需要知道你通信到底做了哪些事情,只需要把信息从一端传到另一端就可以,为什么通信和计算要结合起来,有什么好处?
5G如何应对庞大的数据流
主要的出发点是数据,怎么处理数据和传输数据,特别是5G将来所要面对的数据洪流。大家肯定都是对摩尔定律非常熟悉,宋院长(英特尔中国研究院院长宋继强)也介绍摩尔定律如何实现每18个月我们芯片的能力翻一番。
而在通信领域,通信系统通信速率的发展以及我们对移动通信数据的需求,甚至是超过了摩尔定律。比如说2016年全球的移动数据通信量是增长了63%,如果按照这个速度下去,两年实际上就翻了2.5倍左右。它的增长速率甚至超越了摩尔定律的发展。为什么?借用的一句话,满足我们日益增长的对美好文化生活的需求。这是一个指数定律。
按照这个速率增长下去,到2022年5G部署的时候我们将面对什么呢?我们将面对50EB数据的流量,每个月的移动数据流量在今天的基础上再增长5倍。EB是10的18次方。同时,我们知道5G支持物联网的应用,特别是我们提的自动驾驶,自动驾驶的汽车每天产生的数据是4个TB,如果大家对硬盘比较熟悉,一天产生的数据容量要充满非常大的硬盘,每年365天需要买365个硬盘来存储整个自动驾驶的数据。特别是自动工厂智慧城市里的互联工厂,一天的数据量,像芯片厂、封装厂一天的数据流量就是1TB,一天要买几百块硬盘来装满你的数据。对于5G来说我们所要面临的数据洪流是非常巨大,对整个通信系统和计算系统来说都是一个巨大的挑战,当然也意味着巨大的商机。
今天围绕的主题是VR和5G,为什么VR需要特别大的数据容量,为什么VR在数据洪流里会占据大量的流量呢?目前互联网的最主要的传输内容是视频,将来VR是代表更高质量视频的未来。
举个例子,如果大家看一张很高清的图片,放在手机上或者是放在电视上会觉得现在的清晰度已经超出你的想象,非常的清楚。但是如果你把一个同样的图片放在一个VR眼镜上,同样的分辨率会变得非常模糊,为什么?主要是视角的原因,我们在手机和电视机上看图片的时候,你的视角只有10到30度左右,在VR眼镜上拓展到100度、120度、150度,一下子增加了好几倍,纵向还有增加的倍数。为了达到非常好的高清要求,对VR的显示来说需要25倍到40倍的分辨率增加,这样它的流量会变得非常高。
比如我们要打造一个非常好的VR系统,现在的系统是达不到这个要求,你需要16K到24K超级高清的VR。不压缩的话,容量会达到500Gbps,每个月的容量是1Gbps,如果是500Gbps,可能是十几年的容量一秒钟就过去了,即使压缩之后也达到1Gbps,同时VR对显示的延迟非常敏感,对传输的容错性也是非常敏感。所以对5G来说,特别是高质量的虚拟现实和增强现实,对5G的通信系统和计算系统来说都要着力应对。
我们主要研究系统架构,在5G系统架构里面怎么样满足一个速率洪流的要求,主要是采用计算和网络融合的方式,在端到端的部署、计算和网络系统来满足数据处理和传输的要求。
在3G、4G时代,网络是网络,数据和云计算是云计算功能,对于一个云计算的应用来说,网络基本上是透明的,它的传输容量在接入网端的传输容量和核心网的传输容量,骨干网的传输容量是一致的,你发的任何一个请求都会到云计算中心处理,然后再把结果返回给你,这样在整个容量是一个一致的管道的容量。
大家应该都有亲身的体验,如果你宽带扩容了50兆,然后再扩到100兆或1Gbps,其实你的感觉并不明显,你的容量并不是受限于接入网端,而是在核心网、骨干网或者数据中心里面,没有办法支持那么高速率的应用。如果你的小区里面放一个视频服务器,你去访问视频服务器的时候会感觉看起高清大片来特别流畅,主要是因为内容下沉。
在4G的后半期我们已经引入了边缘计算,边缘计算的目的主要是应对在网络边缘的数据传输和处理的要求。我们加入边缘计算,可以对很多边缘产生的数据进行实时的处理和反馈,比如智能汽车产生的数据,智能工厂产生的数据,这样就不需要把所有的数据传到云计算中心再进行处理。它有两点非常明显的好处,第一是时延非常低,满足物联网的应用。第二是减少核心网的带宽。虽然我们的5G会将边缘的容量扩展得很大,比如说100倍到1000倍左右,核心网不可能扩展到1000倍。
在5G和下一代会是什么样?会发生什么呢?在第三阶段的时候,我们认为它的计算能力会进一步的下移到智能终端。比如,车或者手机实际上就是一个智能终端,家里的传感器和路上的传感器很多都可以连到智能终端上,5G的网络会把整个物联网设备、智能终端和边缘计算的能力、云计算的能力统一起来,所以我们能够打造一个端到端的网络,同时也是一个端到端的计算平台,来应对5G的数据洪流。
大家肯定是对AR/VR非常熟悉,我们对未来AR和VR的认识和愿景是什么。我们主要是提出远程沉浸式互动的未来,什么意思?未来,你带着一个VR眼镜,我们可以用5G的网络把你和一个智能的机器人连接起来。
中国研究院也有非常多的智能机器人方面的研究,我们把网络和机器人连接起来,同时机器人能够把360度视频和声音实时的传输到客户端,你可以对机器人进行控制和真实的世界进行互动。这能达到什么效果呢?就好像在任何时间你都会瞬间的转移到世界上任何一个角落,和一个真实的环境进行互动,这是我们设想的一个超越目前AR和VR远程沉浸式互动的未来。
能支持什么样的应用呢?我们觉得非常多的应用,像远程购物,你现在是在北京,你可以一下子就跑到美国的超市里进行购物,从货架上亲自把你想要的东西选下来,你就再也不用担心假货。还有远程的旅游,比如说你在一个你喜欢的时间和地点,比如说慕田峪刚下过雪,或者夕阳西下的时候,一下子跑到那里,可以亲自体验一下那个美景。
还有社交的功能,大家回家都非常少,在外地工作的时候,有了我们这个系统可以瞬间转移到你的家里,和你的父母进行聊天,好像你真的回到家里身临其境一样,这是我们设想的远程沉浸式互动的未来。我们用什么样的技术实现呢?下面跟大家介绍一下。
VR最主要的肯定是要做内容,我们刚才也说目前的VR内容2K、4K,它的清晰度还差得很远,我们怎么样产生高质量VR的内容呢。如果你体验过VR的视频可能会有一些体验,目前的VR视频除了是好莱坞制作的大片,基本上VR视频内容都是2D的,因为3DVR视频生成是非常复杂的,制作难度也大。
所以,我们英特尔中国研究院研究的目标聚焦两点:
第一,3DVR视频能实时合成,能够产生高质量的内容。
第二,怎么实时产生内容满足我们对远程沉浸式未来的要求。
我们的设备大家可以看到它有非常多的摄像头,有17个,每个摄像头是2K的分辨率,为什么需要这么多的摄像头,实际上主要是为了在水平方向能够在任意方向差值生成一个3D的内容,需要每个摄像头之间有比较多的重合区域,所以需要非常多的摄像头。
3DVR的合成算法非常复杂,特别是产生一个没有瑕疵的3D视频,你要消除它的鬼影效应,消除拼接的瑕疵,采用非常复杂的光流算法,即使是目前最强大的服务器和最强大的台式机也很难完成实时性的功能。
我们开发了分布式的处理平台,是非常高密度的分布式处理平台,是2.5U高的机箱,在这里可以插入12个至强CPU卡,同时插入12块FPGA卡,中间有600G左右的互联能力。对视频VR处理来说,对实时合成来说一个主要的功能就是怎么样实现精准的同步,从处理的角度实现精准的同步,这个平台也可以支持。通过我们算法的研究,通过实时处理的加强,希望我们能够真正的达到产生一个非常高质量的,比如说现在产生8K的高清的内容,满足将来的要求。
我们有了内容之后,下一个面临的问题是怎么样把这些内容传输到客户端。刚才说了VR的传输要求是非常高,整个的带宽需要是100兆到1Gbps。同时,延迟需要非常低,只有十几毫秒到二十多毫秒。目前的网络基本上是没有办法满足这个要求,所有移动的网络是有接入网,有核心网,有骨干网,所以在任何的两个用户之间传输,即使你是在离得很近的两个用户传输,实际上要走一大圈,中间需要经过非常多的设备,即使优化得很好,最好的效果只能达到50毫秒到100毫秒。
在这种情况下怎么能够满足VR处理实时性的十几毫秒的要求,特别是移动的时候跟上你的显示速度,这只有十几毫秒。我们提出一种方法——边缘计算,通过通信和计算结合的方法,采用边缘计算的能力能够使VR达到实时传输的要求,解决从显示到头显的要求,解决从带宽到时延的要求。
首先,我们生成VR的视频内容之后,把360度的全景视频通过压缩传到边缘服务器,在边缘服务器端有整个全景的内容,可以同时服务多个用户。每个用户会把自己的视角信息,你在看哪个方向传给边缘服务器,边缘服务器把视角信息的内容发给用户。
这样有两个特别显著的好处:
一是通过通信和计算结合的方式,采用边缘服务器能够显著降低从移动到显示的时延,本来是50到100毫秒,现在只是10到20毫秒。
二是能够大大降低无线通信带宽的需求。如果不采用这种方法需要1Gbps带宽,采用这种方法可以降低2到3倍。通过这种方法我们能够打造一个高效的5G网络传输系统。
还有一点比较重要的:可靠性。因为VR的传输它对数据传输的可靠性要求非常高。一个视频如果离得很远,看电视的时候突然有一些瑕疵可能感觉比较明显,但不会感觉特别不舒服,但是如果一个VR眼镜在显示一个视频的时候,如果突然感觉有一帧丢失了,就需要很长的时间才能恢复出来,这时候会感觉到特别的不舒服。
怎么样满足这个要求呢?当然,如果我们仅仅从通信设计的角度去设计一个速率非常高,延时非常低,同时容错性非常好的系统,这也是可以做得到的,但是整个的成本和效率就会非常低。我们也提出用通信和计算结合的方式,我们把整个头显端的计算功能增强,在头显端做一些容错性处理,比如把异步时间扭曲的功能加到头显端。
举个例子,通过边缘服务器或者是个人的笔记本,把视频、游戏传到头显端,第一帧会正确接收,当第二帧传输失败的时候,头显端会用前一帧的内容根据目前头显的位置信息和视角信息进行旋转,重新生成第二帧的内容,这时候用户对整个传输失败的感觉不会太明显,甚至没有丢失的感觉,这样用户体验会大大提升。我们将这种增强异步时间扭曲的功能加入到移动VR头显端,特别是加入到手机端。通过增强头显端和手机端的功能,提高整个系统的可靠性和体验,显著的降低VR带宽的需求和整个设计的难度。
这是我们录的两段视频,左边是英特尔的移动VR系统,右边是第三方的系统。可以看到左边的系统是我们用手机拍摄下来的,是非常流畅,但是右边因为是完全靠这种PC的功能,手机端的功能比较弱,会显得非常卡顿。
还有另外一点最重要的,也是做研究经常容易忽略的一件事情,你的应用在哪里来。如果我们做了一个VR系统,所有的应用要重新写,所有的内容要重新生成,那是没有办法建立起一个生态系统的。
计算机视觉的主要任务范文篇2
关键词:学习活动;个案;ZLMS
中图分类号:G434文献标志码:B文章编号:1673-8454(2015)02-0029-04
一、问题的提出
我们正处于网络化的知识时代。我们的工作和生活以知识创造、信息交流和技术应用为中心,而知识也历经了从分类、层级到网络和生态的变革。这种变革改变了每个事物,更改变了我们的组织空间和结构。[1]博客(blogs)、维基(wikis)、标签(tagging)、社会性书签(socialbookmarking)、播客(podcasting)、视频日志(videologging)等社会化工具的出现,不仅为教师的教学和学生的学习提供了丰富的网络资源,还拓展了教与学的空间。与此同时,网络学习平台也被越来越多地应用到日常教学中。网络学习平台的应用不仅提高了学生的学习效果,也更符合学生个性化的学习需求。但在网络学习平台的使用过程中还存在着诸多问题,如网络学习平台只注重课件、视频等资源的堆砌而忽略了合理的学习活动设计、学生参与性不高等。因此,笔者引入以学习活动为中心的教学设计理论,以期解决目前网络学习平台使用过程中存在的问题。
二、以学习活动为中心的教学设计理论
1.学习活动的概念
传统的教学设计理论注重对学习内容特别是对学习结果的分析,而忽视了学习活动在完成学习任务中的作用。杨开城教授提出的以学习活动为中心的教学设计理论认为,教学系统是由学习活动(如右图所示)构成的,是师生之间有组织的共同活动的序列。学习活动的主要设计成分包括:活动任务(含学习目标)、交互操作过程(含学习方式和方法)、学习成果、学习资源、学习工具以及活动规则,各要素的具体含义如表1所示。学习活动由任务组成,学习活动所有的设计成分都围绕学习任务展开。[2]
2.以学习活动为中心的教学设计
以学习活动为中心的教学设计理论认为,教学系统是由学习活动构成的,因此学习活动是教学设计的基本单位。学习活动的设计就是分析学习活动中各要素之间的动态关系。在高职教育教学中,学习活动还要包含真实的工作情境,以真实的工作情境为教学情景,以解决真实问题为导向,设计学习活动。整个教学设计的过程按照“尝试设计―对方案的结构化分析―优化设计―缺陷分析”的流程展开。教师先将经验和灵感置入初始教学方案之中,然后再通过理性分析和设计以及优化操作提高教学方案的品质。[3]
三、“计算机应用基础”网络学习活动个案分析
我院一年级学生开设的《计算机应用基础》公共课除了采用班级授课制外,还开设了网络课程。网络课程中学习活动的开展主要是以ZLMS网络学习平台为主,在Web2.0环境下,借助QQ群、博客等社会性软件实施的。
ZLMS网络学习平台是基于Web2.0的、以课程管理为中心、以学习活动为驱动的在线学习管理系统。ZLMS引进了视频直播教学的理念,可将面授课堂完全搬到网上进行。学生登录系统不但可以在线点播课程课件及多媒体视频、浏览教学信息资源,还可参加实时的教学互动视频课堂、课程讨论及测验考试;教师不但可使用学生的所有功能,还可查看统计学生的学习档案,组织管理内部的学习资源,为教师对学生素质进行公正评价及正确分析提供了有力的平台支持。学生可以在电子阅览室或其他地方进行网络课程的学习。
本案例以宁夏民族职业技术学院“计算机应用基础”公共课中的视觉设计专业班“塞上江南魅力吴忠演示文稿制作”为例,具体说明“计算机应用基础”课中的学习活动是如何开展实施的。
1.活动设计目的
设计“塞上江南魅力吴忠演示文稿制作”活动的主要目的是通过本次活动使学生学会使用PowerPoint软件制作演示文稿,演示文稿要富有创意、界面布局合理、画面舒适,不仅能体现视觉设计专业的专业技术特点,还要能体现回族民族特色。
2.活动设计过程
(1)确定活动设计各要素
①学习者分析
分析学习者特征,特别是先决知识和技能,确定学习者之间的共同特征和个性差异。学习者分析是因材施教的主要前提条件。
学生特征:实验班级艺术系13级5年高职视觉设计专业1班学生是初中毕业进入我院学习的,学生文化知识基础较差、自控能力不强,但他们思想比较活跃,动手能力、适应性较强,富有创新意识,可塑性强。其在理论知识学习方面存在困难,更喜欢进行实际操作,简单的实验能力较好,但解决实际问题能力较差。
已有知识和技能:学生在Word中已经学习过图片、艺术字、自选图形等对象的插入和设置,在素描等其他专业课中学习过版面布局和色彩搭配等方面的知识,但是学生还不能将已学会的知识和实际应用联系起来,所以在本章内容的学习中可利用学生已有知识实现本章的学习目标。
②学习内容分析
“计算机应用基础”是面向所有专业开设的公共基础课,涉及面广、影响大,对学生计算机应用能力的培养,顺利完成后续课程的学习,毕业后能迅速适应岗位需要、具有可持续发展的再学习能力等具有重要作用。鉴于“计算机应用基础”公共课的这种性质,在制定课程总体目标并细化为章节学习目标时要与视觉设计专业的专业特点相结合,专业不同、学习内容不同,所要达到的实践技能的目标也不同。在本案例中,学生除了通过向幻灯片中插入图形、图片、音视频文件,为对象设置动画效果制作演示文稿、设置超链接实现幻灯片的跳转、设置演示文稿的放映方式之外,还应能使用Photoshop等音频工具对多媒体对象进行简单的编辑和美化,并利用母版、动画等方法制作富有创意、具有独特风格的演示文稿。
③学习目标分析和描述
根据“计算机应用基础”的课程性质制定总体目标,结合视觉设计专业特点再将学习目标进一步细化到每一个知识点。
总体目标:本课程的职业岗位定位是面向各行各业的信息处理工作,通过任务引领的学习领域活动,使学生能够利用计算机和网络这个现代化工具进行信息的加工与处理,提高学生办公事务的信息化处理能力,培养学生的信息素养与团队协作意识。通过本课程的学习,使学生具备较强的计算机基础应用能力,加强、拓宽自身专业能力,满足就业岗位对计算机能力的要求。
本章的目标:通过本章内容的学习,学生明确PowerPoint演示文稿的应用领域;熟悉PowerPoint工作界面、菜单工具栏等;熟悉PowerPoint幻灯片的组织,知晓对象、舞台、背景的角色概念,能够运用PowerPoint软件进行演示文稿的制作,包括在幻灯片中插入图片、图形、艺术字、音频、视频、Flash影片等多种对象,能根据需要使用Photoshop等音频工具对多媒体对象进行编辑;能利用母版、配色方案统一修改演示文稿的外观;能为幻灯片中的对象设置合适的动画效果,设置超级链接,并能根据需要选择合适的放映方式放映演示文稿。
知识点:通过知识网络图的形式进行表征。
④学习活动设计
根据“塞上江南魅力吴忠演示文稿制作”这一章的具体学习目标,本章节的学习活动主要包括三种:教师和学生共同参与的学习活动;学生共同参与的协作式学习活动;学生自主学习的自主式学习活动。[4]
⑤交互方式
本课程的交互方式有三种:一种是教师和学生之间的交互,第二种是生生之间的交互,第三种是学生与ZLMS网络学习平台的交互。其中教师和学生之间通过课堂教学、网上在线答疑、辅导等方式进行,而学生之间则通过知识交流、情感交流、小组协作的方式进行,学生之间通过ZLMS网络学习平台互相分享和交流学习心得,按照自己的时间和知识掌握程度选择学习进度,以此实现与ZLMS网络学习平台的交互。
⑥学习资源和工具
本章节学习活动任务中需要的学习工具主要包括:安装了MicrosoftOffice软件的计算机、Baidu、Google及相关资料网站的链接;Photoshop等图片、视频工具、迅雷下载工具;交流工具主要是QQ群、ZLMS网络学习平台的讨论区;学习资源主要包括ZLMS网络学习平台中的课件、视频、学习文档、参考资料等。
⑦交往规则
在学习活动中,教师要对学生的学习进行监管。学生集中精力投入到学习活动中,学习小组中学生分工合理,同学之间文明交流,不在课堂中做与学习活动无关的事,如玩游戏、浏览与学习无关的网页内容等。
⑧学习成果的评价规则
学习成果的评价包括教师评价、个人自评、学生互评。所有学生作业完成后通过ZLMS网络学习平台提交作业,学生不仅可以看到自己提交的作业,还可以看到其他同学提交的作业,以此实现学生互评。评价时除了考虑学生对学习内容的掌握程度,还应考虑学生在学习过程中的实际表现,即将终结性评价与过程性评价相结合。
(2)学习活动切分
根据知识建模图将本单元内容切分为四个学习活动,通过学习活动来实现本章的学习目标。这四个学习活动分别是:①创建演示文稿;②演示文稿模板设计;③演示文稿动画设计;④演示文稿的放映。
(3)活动任务切分
学习活动确定之后,也就确定了各学习活动的活动目标,接下来就要对学习活动进行任务切分。下面以“演示文稿模板设计”学习活动为例,说明活动任务切分及所包含的主要内容(见表2)。
3.数据分析和结果分析
笔者在开展研究前后都对学生计算机应用的实际情况进行了问卷调查,并进行了统计分析。
(1)活动满意度
从课程开始前后的对比可以看出,网络学习活动对学生的学习效果有很大的促进作用,也更符合学生的学习需要。学生不仅能全面、立体地获取教学资源,交互式地进行学习活动,还能及时与他人交流协作,提高自己分析和解决问题的能力。在此基础上还可以及时借鉴他人的学习经验,使自己的自主学习能力得到锻炼和提升。
(2)活动目标实现情况
活动的主要目的就是促进学生掌握知识和技能,培养与他人协作的意识。从平台统计数据看,90.1%的学生熟练掌握Windows、Word、Excel、PowerPoint等计算机基础知识和操作技能,85%的学生认为能提高自己与他人共享学习经验及成果的积极性,84.2%的学生能提高与他人协作、交流的技能。因此,笔者认为借助ZLMS网络学习平台实施学习活动的效果是良好的。
五、总结
通过个案研究,以学习活动为中心的教学设计理论为我们在网络环境下的学习活动设计提供了新的框架和思路,也顺应了网络时代中国教育发展的大趋势。但是学习活动是一个复杂的系统,还有很多问题有待我们更加深入地研究和探索。
参考文献:
[1]G・西蒙斯.网络时代的知识和学习――走向连通[M].上海:华东师范大学出版社,2009.
[2]杨开城.教学设计――一种技术学的视角[M].北京:电子工业出版社,2010:12-27.
计算机视觉的主要任务范文
关键词图表加工,规则模型,认知过程模型,计算模型,层次框架模型。
分类号B842
古埃及人绘制地图来表示复杂的空间信息,在某种意义上创作了第一种图形显示;在莎士比亚时代,人们使用“划线”和“标记”系统来记录数量关系[1]。Playfair在《商业与政治地图册(TheCommercialandPoliticalAtlas)》一书中区分了饼图、直条图、直方图和线形图等,率先对图表显示进行科学研究(参见文献[2])。Playfair明确指出,对于呈现定量数据,使用模拟符号比使用词汇和数字更有效(参见文献[3])。
图表(graphandtable)作为一种重要的信息记录、展示和传递方式,已经被广泛地应用到科学[1]、工程[4]、教育[5]、商业和媒体[6]等领域中,并发挥着重要的作用。图表不仅有突出的视觉和空间特征,而且有表征数量关系的图表构成成分,因此,图表加工与人们对图表的知觉加工和对图表构成成分的概念加工密不可分。如何更好地设计和制作图表以有效地记录和展示信息,如何快速有效正确地理解并获取图表所传递的信息,已成为认知心理学家关注的重要问题,其研究成果具有明显的应用价值。
近年来,研究者们提出了许多有关图表加工的理论模型,试图说明图表加工过程的特点与规律。基于已有的图表加工理论所涉及的认知加工过程的复杂程度,我们将其区分为两大类,第一类较为简单,包括规则模型(rulemodel)、认知过程模型(cognitiveprocessmodel)和计算模型(computationalmodel),而第二类是2004年提出的层次框架模型(hierarchicalframeworkmodel),涉及的认知加工过程相对比较复杂。本文将首先介绍第一类模型,并进行简要评述;然后,介绍和评述层次框架模型;最后,在总结已有图表加工理论的基础上,试图指出以往图表加工研究中存在的问题,并提出未来的发展方向。
1规则模型
规则模型指出了图表设计过程中应遵循的基本准则,主要可以分为分析模型(analyticmodel)和兼容模型(compatibilitymodel)两大类。分析模型主要侧重于从图表自身的角度出发来考虑图表设计的原则,而兼容模型的特点在于从图表和任务的兼容性方面来考虑图表设计的原则。
1.1分析模型
分析模型中所论述的图表设计的基本原则,大多是基于认知心理学家的直觉和经验,只有少数基于实证数据。Bertin的《图表记号学(SemiologyofGraphics)》一书着重分析了图表显示的视觉特性,并详细地阐述了用于设置和显示数量变化的图表生成技术[7]。他把图表设计问题划分为不同的类别,认为在设计图表时应该考虑图表拟显示的信息成分的组织水平(名义的、顺序的、等距的和比例的),并指出表征信息某一成分的变量必须具有和它们所表征的信息成分至少相同的组织水平。
Tufte则提出了数据-笔墨比率(data-inkratio)原则(参见文献[3])。这一原则认为,图应该只用来表示重要的信息,因此,应该使不能表达数据点或数据点之间关系的描述减至最少,以减少混淆。Gillan和Richman进一步指出,数据笔墨比率越高,则完成系列判断所用的时间越短,准确性越高;整合性的任务(如总体比较、综合判断)比聚焦性任务(如单值提取)更易受数据-笔墨比率的影响[8]。他们的实验结果表明,图形背景的使用可能会干扰读者对图表信息的加工(尤其是当读者完成整合性任务时),其结果会增加反应时间,降低准确性[8]。
Kosslyn在编码、知觉和表征的不同层面上对图表进行了句法的(syntactic)、语义的(semantic)和实效的(pragmatic)分析,指出了影响图表阅读难易程度的因素[9]。Zhang关注表征维度(representingdimensions)和被表征维度(representeddimensions)之间的关系,指出只有当表征维度能够充分必要地表征被表征维度时,表征方式才是最优的,也就是说,表征维度和被表征维度应该在量尺类型上匹配[10]。
综上所述,分析模型主要侧重于从图表自身出发来考虑图表设计的原则。分析模型的主要问题在于,它们很少考虑任务类型、图表读者的知识经验以及这些因素之间的交互作用,并且缺乏实证研究支持。具体而言,Bertin侧重于对图表设计原则的叙述,并没有提供相应的实验证据。Kosslyn的图表理论[9]和Zhang的表征原则[10]也缺乏实验数据的支持。虽然Tufte的数据-笔墨比率原则得到了一些实验数据的支持,但其概念却有点扩大化了。例如,在线形图中,数据是由各个点来表达的,点与点的连线并不传递数据,根据Tufte提出的原则,这些多余的连线应该被删除。但是,如果删除这些多余的连线就会削弱人们完成某些任务(如趋势评估)的能力,因为这些连线为图表读者提供了线条斜率的突显特征(参见文献[3])。
1.2兼容模型
兼容模型即任务-显示兼容性(task-displaycompatibility)模型[3],认为不同的显示方式适用于不同的任务,如果任务不同,那么最佳的显示方式也应有所不同。Vessey在“认知匹配理论”(cognitivefittheory)中对这一模型进行了详细的阐述,旨在说明图和表两种信息呈现方式之间的差别以及它们所支持的任务类型[11,12]。Vessey指出,图主要用来呈现空间信息,而表主要用来呈现符号信息。任务主要可以区分为两大类:一类为“符号”(symbolic)任务,包括提取离散数值;而另一类为“空间”(spatial)任务,包括觉察或判断数值之间关系(如大小比较、趋势判断等)。根据兼容模型,当呈现方式和任务均为空间的或均为符号的时候,两者是兼容的,其任务绩效要明显高于两者不兼容情景下的任务绩效。但是,Vessey的实验结果只是部分地符合模型的预测。
兼容模型的一个主要变式是“接近―兼容性原则”(proximity-compatibilityprinciple,简称为PCP),即任务和显示方式应该同时是低接近性的或者同时是高接近性的[3,13,14]。低接近性任务要求使用单个数据点(如提取具体数值);而高接近性任务则要求使用数据点的构型(如比较趋势)。在低接近性的显示方式中,数值之间距离较大或者分开显示(如数据表);而在高接近性的显示方式中,数据之间分布紧密并可组成视觉构型(如客体显示,objectdisplay)。PCP表明,当任务的接近性与显示方式的接近性相兼容的时候,绩效最好。Renshaw等人使用眼动技术对图例的位置进行考察,结果表明在遵循PCP的条件下,读者的操作绩效较好[15]。需要说明的是,PCP不仅包括显示方式的空间接近性,还包括所使用的颜色、形状和尺寸的相似性。
我们认为,兼容模型提出了图表设计的一个重要原则,但并未说明为什么遵循兼容性原则的图表能提高图表读者的任务绩效。此外,兼容性模型只阐述了图表与任务之间的关系,并没有考虑图表读者的知识经验等因素。由于图表读者、图表和任务构成一个系统,三者之间存在着一定的交互作用,图表-任务之间的关系可能会受到图表读者知识经验的影响。前面提到的Vessey的部分实验结果与模型预期不一致,可能是图表读者不同的知识经验造成的。
2认知过程模型
认知过程模型认为,图表理解的过程可以分解为一系列的认知加工过程,主要包括图表理解理论(theoryofgraphcomprehension)、理解认知信息工程(understandingcognitiveinformationengineering,简称为UCIE)的计算机程序和知觉与概念加工模型(modelofperceptualandconceptualprocesses)。
2.1图表理解理论
Pinker在其提出的图表理解理论中,将图表界定为向读者传达数学量尺中一组N维数值的一种表征方式,用客体的视觉维度(如:长度、位置、亮度和形状等)对应于各自表征的量尺(如:名义的、顺序的、等距的或比例的),每一个维度值对应于相应量尺的值[16]。Pinker指出,要理解图表,读者需要做两件事情。首先,他必须在心理上以一定的方式来表征图表中的元素。当读者看一张图表时,图表中的信息就会以一种强度的二维模式即网膜上的视觉阵列(visualarray)作用于其神经系统,视觉阵列的原始信息通过视觉描述(visualdescription)被转换为记忆表征来指代图表中视觉标记的意义。其次,读者必须记住或推论出图表视觉成分所代表的相应的数学量尺。为此,Pinker提出图表图式(graphschema)的概念,即在某些领域已经被记住的图表信息,包括对至今未知信息的参量和插槽的描述。读者通过图表图式可以获得图表的视觉成分与相应的数学量尺之间的正确对应关系。
Pinker指出,为了回答特定的问题,图表读者需要把从视觉描述中获得的信息转换成概念消息(conceptualmessages),并把问题转换成能够通过视觉描述来回答的形式。这将包括下面的一系列过程:(1)匹配(matching),即将图表归类为某一特定的图表类型;(2)消息汇集(messageassembly),即从图表图式中产生概念消息的过程,值得注意的是,并不是图表中的所有信息都必须被转换成概念消息;(3)查询(interrogation),即基于概念问题对新信息进行编码和提取;(4)推论过程(inferentialprocesses),即将数学和逻辑规则应用到概念消息中去,以获取新的信息。
Pinker的图表理解理论主要以命题表征为基础,关注的是人们从图表中提取信息的过程。该理论存在着以下几个方面的问题:(1)Ratwani等人指出,图表理解理论对读者的任务绩效不能提供很好的解释,没有说明读者在理解图表的过程中是如何整合信息的,如“群组”(cluster)信息是单个读取的还是以格式塔的方式形成的[17];(2)不能很好地解释问题类型对信息加工过程的影响。Ratwani等人指出,根据图表理解理论,读者读取和整合问题应该有着相同的扫描模式。然而,经验数据表明,问题类型对读者的扫描模式有着强烈的影响,视觉加工的操作是服务于读者所要回答的问题[17];(3)声明了推论是图表理解过程的一部分,但是并没有给出推论过程发生的细节;(4)没有提及领域知识的问题;(5)Trickett等人指出,这一理论没有涉及到空间转换的概念,对需要空间转换的问题难以理解[18]。
2.2UCIE的计算机程序
在Pinker图表理解理论的基础上,Lohse采用UCIE的计算机程序来模拟读者使用图表的认知加工过程,对读者提取特定信息的加工过程做出定量预测[19]。Lohse指出图表理解包括以下认知加工过程:(1)早期的视觉加工即检测和编码图表的视觉特征;(2)短时记忆即形成从早期视觉加工过程中获得的视觉描述;(3)短时记忆的信息激发了和长时记忆中记忆痕迹的联系。他使用GOMS(goals,operators,methods,andselectionrules)模型和视线追踪技术来研究图表理解的过程,同时考虑到短时记忆容量(3个组块)和持续时间(7s)有限,以及扫描过程中获取信息的难易程度不同等方面的因素,通过使用大量的“认知工程参数”(cognitiveengineeringparameters)来估计在假定的显示方式下完成一个具体任务所需要的时间。他进行了相关的实验研究,对扫描模式做出了具体的预测,将读者的实际绩效和计算机程序的预测绩效相比较,部分结果支持UCIE模型。
Lohse的UCIE模型为定量预测图表的理解过程迈出了重要的一步。但仍然存在诸多问题:(1)Lohse指出,实验中任务绩效的个体差异非常大,需要额外的研究来解释[19];(2)UCIE模型的预测会受到显示信息复杂程度的影响,Foster指出,这或许是由于UCIE模型使用的是较低水平的操作,而这些较低水平的操作对图表的信息复杂程度的变化比较敏感[20];(3)Meyer指出这个模型不太容易使用,因为它具有大量的认知参数,难以对各种新任务建模[21];(4)没有提供恰当的整合机制。Lohse认为在整合信息的过程中,将出现多次重复扫描的可能性,通过大量的扫描形成类群,把类群联系起来,实现多类群的推理,直到建构完所有的相关类群并做出比较[19]。然而,Ratwani等人的研究表明,图表读者一般是一次性形成类群,然后利用这些信息进行推理[22];(5)同Pinker的图表理解理论一样,UCIE也没有提及领域知识和空间成分。
2.3知觉与概念加工模型
Carpenter和Shah在前人的基础上提出了图表理解的知觉与概念加工模型[23]。她们将图表理解看作是整合一系列复杂的知觉和概念加工过程,提出了三种类型的加工:(1)模式再认过程,即编码图表中主要的视觉模式,如线条是直的还是锯齿状的,是否有多条,它们之间是平行的还是交叉的关系。准确的编码是图表理解的前提条件;(2)模式解释过程,即对视觉模式的代码进行操作,将视觉特征转换为它们所表征的概念关系,并提取出定性、定量的关系。这些过程包括提取和视觉模式相联系的知识,如上行曲线表示增函数。当视觉模式容易激发适当的数量概念的时候,图表的理解就变得相对容易,然而,有些数量的或函数的信息获取需要复杂的推论过程;(3)整合过程,即将这些数量关系和从标签、标题中推论的指代物联系起来,包括确定被量化概念的指代物,将这些指代物和已编码的函数联系起来。指代过程的一个方面就是标定过程,包括阅读坐标轴上的图例和数量值,并将它们和相应的线条和数据点联系起来。标定过程很可能与模式再认、相关概念知识的提取发生交互作用。
Carpenter和Shah采用视线追踪技术来考察图表加工过程中涉及的认知过程,明确提出应将知觉加工和概念加工结合起来[23]。实验结果表明,图表理解需要读者阅读和重读坐标轴和图标区以获得的必要信息,而且人们并不总是能够保持从这些区域所获得的信息。她们的研究为图表中不同区域的设计提供了一定的心理学依据。
此外,认知过程模型还包括Cleveland和McGill提出的图表知觉模型(graphperceptionalModel)[24,25],Gillan和Lewis提出的人-图表交互的成分模型(componentialmodel)中的混和算法知觉(mixedarithmeticperceptual,简称为MA-P)模型[26],Meyer提出的视觉搜索模型(visualsearchmodel)[21],Gillan和Callahan提出的人-图表交互的成分模型中饼图的锚定-对齐-调整模型(anchor-align-adjustmodel)[27],Hollands和Spence提出的用于条图和饼图中数量辨别任务的递增估计模型(theincrementalestimationmodel)[28],Freedman和Shah提出了基于知识的图表理解模型(amodelofknowledge-basedgraphcomprehension)[29]以及Katz等人提出的图表理解中的视觉组块假说(thevisualchunkshypothesis)[30]。
3计算模型
Peebles和Cheng对基于图表推理(graph-basedreasoning,简称为GBR)的模型予以扩展,提出了计算模型[31,32]。
GBR模型(参见文献[31,32])类似于Lohse的UCIE的计算机程序,不同之处在于它认为图表推理过程中的读者行为是推理者的知觉技巧、所使用图表特性和任务的特定要求三者交互作用的函数。它假设,对于一个特定的信息提取任务,有经验的读者将利用一种程序来获得眼跳序列和对目标任务的固视信息。最终的扫描路线是否是最优的,或多或少依赖于被试有关图形的一般知识、对任务类型的熟悉程度以及完成任务所需的概念和程序。GBR模型也存在一定的局限性:(1)最优路线的假设掩盖了个体水平上重要的认知和策略因素的影响,例如,在加工的过程中,读者可能需要权衡额外的眼动与减少工作记忆负荷的策略性决策;(2)有关时间的预测停留在陈述性的水平上,需要更强有力的模型来产生定量的结果。
Peebles和Cheng以认知理论为基础,将GBR模型与具体化认知(embodiedcognition)、执行加工/交互控制(executiveprocess/interactivecontrol)和ACT理性知觉运动(ACTrationalperceptualmotor)相结合,提出了图表理解的计算模型。这一模型能够结合并测试相关的认知因素(如陈述性和程序性的知识、所采取的策略和工作记忆的局限性)以及知觉运动因素(如鼠标的运动和视觉注意的转移)。与其他的认知任务分析方法一样,计算理论结合了成分单元任务执行潜伏期的假设,能够准确预测完成单一任务的时间。此外,计算模型还能够提供解释任务的重要的足够的证据,包括学习机制,可以模拟练习对绩效的影响。
计算模型不仅仅涉及图表理解中人的认知过程,还涉及到人在完成任务过程中的知觉运动因素,它将人-图表-任务看作一个系统,在认知-人造物-任务(cognition-artifact-task)的系统框架下来探讨人-图表-任务之间复杂的交互行为,并进行计算机模拟。这一模型对于简单任务(如,单值提取)绩效的预测已经相当完美,但是它难以预测复杂任务(如整合任务、推论任务)的绩效。
4层次框架模型
上面所论述的规则模型、认知过程模型和计算模型主要集中在从显示数据点相对较少的简单图形中进行数据直接读取(如单值读取)和数据间读取(如差异比较、确定趋势等)的操作。然而,现实生活中的图表使用还涉及更复杂的信息提取过程,如股票分析家和气象预报员不仅要确定当前的数值,还要对未来的数值进行预测[33]。Trickett等人发现,以往的图表加工模型能够准确地解释简单图表和复杂图表中的数据直接读取问题;但是当应用于整合问题时,在解释读者如何从含有多个数据点的复杂图表中整合信息进行数据间读取,特别是对数据间读取的任务绩效进行预测时出现了困难;此外,更重要的是以往的图表加工模型也不能解释推论过程,因为推论需要读者超越外显呈现的数据进行数据外读取[18]。
针对以往图表加工理论模型的不足,Ratwani等人提出了层次框架模型(hierarchicalframeworkmodel)[17,34,35]。这一模型认为,(1)从图表中提取信息的复杂性是有层次的,数值读取是最简单的信息提取任务,其次是整合与推论;(2)提取不同类型信息所需要的认知过程随着任务的难度以层次的形式逐渐提高的,读取数值是最基本的信息提取任务,复杂的信息整合任务除了需要简单地读取信息之外,还需要进行空间转换(spatialtransformation)。空间转换是指对图表的数据进行的心理操作,例如,为了做出比较,需要在心理上将一条线移动到另一条线上,空间转换允许图表读者结合图表的不同区域,这一操作可以帮助读者比较量值和预测趋势[18],Feeney和Webber也指出,人们在执行图表理解任务时,应该尽可能自发地产生与空间特性有关的模拟表征(analogicalrepresentation)[36];(3)为了做出推论,图表读者不仅要使用整合过程,还需要使用模式外推(patternextrapolation)和心理模型(mentalmodel)。模式外推是指图表读者先考察已知的数据点,然后在这些数据点所组成模式的基础上做出推论;心理模型也能够用来做出推论。Trafton等人表明,当从可视化的气象图中做出推论时,气象专家能够形成定性的心理模型[33];(4)其他的一些因素如知识经验、认知努力等也会影响心理操作的执行。尽管层次框架模型指出图表读者在提取不同类型的信息时会使用不同的认知过程,但这并不是必然的,由于认知经济原则,图表读者会尽可能地使用最简单的过程去提取所需要的信息。例如,当整合信息时,如果可能的话,图表读者主要还是使用读取信息的操作,因为读取信息是最简单的信息提取方式,与空间转换相比需要的认知努力非常少。
图表加工的层次框架理论目前还处在起步阶段,还有许多的问题需要解决。例如图表读者是如何从不同类型的图表中获取信息的?如何整合这些信息并做出推论的?在获取信息、整合信息并做出推论的过程中进行了哪些心理操作?获取信息、整合信息和做出推论所需要的心理操作有何区别与联系?读者如何进行空间转换?如何形成心理模型?后续的研究有必要结合口语报告和视线追踪技术,进一步探讨上述问题,以完善现有的理论。
5小结
综上所述,图表加工理论的发展可以分为两个阶段。第一个阶段提出了规则模型、认知过程模型和计算模型。最初的规则模型侧重于图表设计的原则,由强调图表显示的视觉特性(分析模型)发展到强调图表和任务的关系(兼容模型)。认知过程模型侧重于图表理解涉及的认知过程,由定性的认知过程描述(Pinker的图表理解理论和Carpenter等人的知觉与概念加工模型)发展到认知过程的定量预测(Lohse的UCIE的计算机程序和Peeble等人的计算模型)。计算模型不仅强调了对认知过程的定量预测,而且在人-图表-任务这一广阔的背景下来考察人-图表之间的交互作用。到目前为止,第一阶段的发展成果卓著,实现了对图表理解过程的定量预测和计算机模拟。第二个阶段提出了层次框架模型。这一模型是第一阶段模型的扩展,目前还刚刚起步,侧重于从复杂图表中来提取信息并做出推论以回答高度整合的任务,代表了未来图表加工理论的发展趋势。因此,在未来的研究工作中,在完善定量显示的信息提取模型的同时,有必要把工作重心转移到发展与完善层次框架模型上。图表加工研究的未来发展方向将可能主要表现在以下三个方面。
首先,在研究广度方面,所研究的图表不再仅仅局限于静态的、二维的、简单的图表。目前,已有少数研究者开始涉及动态的[37]、三维的[38]、复杂的[39](如动画、股票走势图、天气预报图等)图表研究。在未来的研究中,研究者可能会更关注对动态的、三维的、复杂的图表的研究,考察图表读者在动态的、三维的、复杂的图表中提取、加工和推论信息的特点和规律。同时,由于所研究图表复杂性的增加,需要注重图表读者的知识经验对图表加工的影响。专家具备专业知识的优势,他们对图表中信息的获取、加工特别是做出推论的方式可能不同于新手,这也是未来研究需要探讨的一个问题。
其次,在研究深度方面,从重视图表阅读绩效转向探索图表表征机制,以及图表和文本信息的整合机制。以往研究试图寻求适合不同任务的最佳的图表显示方式,而很少关注图表表征的机制。图表是一种重要的信息表征方式,对图表表征机制的探索必定能进一步深化人们对图表加工过程的理解,而且人们对图表的加工与对其他相关的信息(如文本信息、音频信息等)的加工关系密切,因此,未来的研究不仅要考察图表表征机制,也要考察与之相关的背景信息或上下文信息的作用。近期研究已开始涉及图表和文本信息的整合机制问题。Hegarty曾给被试呈现描述滑轮系统的文本和图片,观察其注视点的变化,结果发现,被试阅读有图片伴随的文本时,其理解过程在很大程度上是以文本导向的,观察图片是为了构建他们在最近阅读文本的过程中获得的信息的表征[40]。Rayner等人考察了被试阅读印刷广告(既有文本,也有图片信息)的过程,结果发现,被试并没有在广告的图片和文本之间交替注视,而是倾向于先阅读大的印刷区,然后阅读小的印刷区,最后才看图片[41]。
最后,在研究方法方面,将综合运用多重数据采集技术。在研究的初期阶段,可以采用观察、问卷和访谈等传统的方法来了解在不同任务条件下读者对图表形式的需求。在正式实验阶段,可以采用严格控制的实验室研究,记录被试回答相关问题的反应时、正确率。在未来对复杂图表加工的研究中,还将重视使用口语报告和视线追踪技术,甚至对被试完成任务的行为摄像,然后进行动作分析。口语报告尽管有其不足之处,但是在研究读者有意识的信息获取、加工等高级的心理过程方面仍然具有一定的优势。重要的是,我们可以将读者的口语报告作为一个指标,与其他的客观指标如反应时、正确率相结合,以探讨读者获取、加工信息的特点和规律。视线追踪技术能够对读者认知活动提供相对应的实时测量,在探讨读者获取、加工和推论图表信息的细节方面有其优势。在研究过程中,可以记录被试在图表不同区域的注视持续时间、注视次数、区域内和区域间的眼跳距离、扫描路线等指标。研究表明,读者在获取、加工和推论图表信息的过程中有其相应的眼动模式,不同的眼动模式反映了被试加工过程中的不同状态。例如,注视时间的长短、注视次数的多少在一定程度上能够反映被试加工信息时认知负荷的高低,眼跳的距离在某种程度上能够反映被试的知觉广度和所要加工的信息密度[41]。根据读者的眼动模式可以揭示图表加工过程中所包含的认知成分,从而增进人们对图表加工过程的理解。
参考文献
[1]BestLA,SmithLD,StubbsDA.Graphuseinpsychologyandothersciences.BehavioralProcesses,2001,54:155~165
[2]SpenceI,WainerH.WilliamPlayfair:Adaringworthlessfellow.Chance,1997,10:31~34
[3]CD威肯斯,JG霍兰兹著.朱祖祥等译.工程心理学与人的作业.第三版.上海:华东师范大学出版社,2003.144~188
[4]RisdenK,CzerwinskiMP.Aninitialexaminationofeaseofusefor2Dand3Dinformationvisualizationsofwebcontent.Int.J.Human-ComputerStudies,2000,53:695~714
[5]ChengP,CupitJ,ShadboltN.Supportingdiagrammaticknowledgeacquisition:anontologicalanalysisofCartesiangraphs.Int.J.Human-ComputerStudies,2001,54:457~494
[6]RaynerK,RotelloCM,StewartAJ.IntegratingTextandPictorialInformation:EyeMovementsWhenLookingatPrintAdvertisements.JournalofExperimentalPsychology:Applied,2001,7(3):219~226
[7]BertinJ.Semiologyofgraphics.PrefacetotheEnglishEdition,Madison,WI:UniversityofWisconsinPress,1983,省略/bboard/q-and-a-fetch-msg?msg_id=0000S0&topic_id=1
[8]GillanDJ,RichmanEH,Minimalismandthesyntaxofgraphs.HumanFactors,1994,36:619~644
[9]KosslynSM.Understandingchartsandgraphs.AppliedCognitivePsychology,1989,3:185~226
[10]ZhangJ.Arepresentationalanalysisofrelationalinformationdisplays.InternationalJournalofHuman-ComputerStudies,1996,45:59~74
[11]VesseyI.Cognitivefit:atheory-basedanalysisofthegraphsversustables’literature.DecisionSciences,1991,22:219~240
[12]VesseyI.Theeffectofinformationpresentationondecision-making:acost-benefitanalysis.Information&Management,1994,27:103~119
[13]WickensCD,AndreAD.Proximitycompatibilityandinformationdisplay:effectsofcolor,spaceandobjectivenessoninformationintegration.HumanFactors,1990,32:61~78
[14]WickensCD,CarswellCM.Theproximitycompatibilityprinciple:itspsychologicalfoundationanditsrelevancetodisplaydesign.HumanFactors,1995,37:473~494
[15]RenshawJA,FinlayJE,TyfaD,WardRD.Understandingvisualinfluenceingraphdesignthroughtemporalandspatialeyemovementcharacteristics.InteractingwithComputers,2004,16:557~578
[16]PinkerS.Atheoryofgraphcomprehension.In:RFreedle(Ed.),Artificialintelligenceandthefutureoftesting.Hillsdale,NJ:Erlbaum,1990.73~126
[17]RatwaniRM,TraftonJG.RealWorldGraphComprehension:High-LevelQuestions,ComplexGraphs,andSpatialCognition.UnderReview,2004,archlab.gmu.edu/~rratwani/real_world_graph_comprehension.pdf
[18]TrickettSB,TraftonJG.UseofSpatialTransformationsinGraphComprehension.Cogsci2004,cogsci.northwestern.edu/cogsci2004/ma/ma353.pdf
[19]LohseGL.Acognitivemodelforunderstandinggraphicalperception.Human-ComputerInteraction,1993,8(4):353~388
[20]FosterME.EvaluatingModelsofVisualComprehension.Cogsci2003,hcrc.ed.ac.uk/comic/documents/publications/foster-eurocogsci-2003.pdf
[21]MeyerJ.Performancewithtablesandgraphs:Effectsoftrainingandavisualsearchmodel.Ergonomics,2000,43(11):1840~1865
[22]RatwaniRM,TraftonJG,Boehm-DavisDA.Thinkinggraphically:Extractinglocalandglobalinformation.In:RAlterman,DKirsch(Eds.),25th.AnnualMeetingoftheCognitiveScienceSociety.Boston,MA:Erlbaum.2003,archlab.gmu.edu/~rratwani/Thinking_Graphically.pdf
[23]CarpenterPA,ShahP.Amodeloftheperceptualandconceptualprocessesingraphcomprehension.JournalofExperimentalPsychology:Applied,1998,4:75~100
[24]ClevelandWS,McGillR.GraphicalPerceptionandGraphicalMethodsforAnalyzingScientificData.Science,1985,828~833
[25]ClevelandWS.Amodelforstudyingdisplaymethodsofstatisticalgraphics.JournalofComputationalandGraphicalStatistics,1993,2:323~343
[26]GillanDJ,LewisR.AComponentialModelofHumanInteractionwithGraphs:1.Linearregressionmodeling.HumanFactors,1994,36:419~440
[27]GillanDJ,CallahanAB.AComponentialModelofHumanInteractionwithGraphs:VI.CognitiveEngineeringofPieGraphs.HumanFactors,2000,42:566~591
[28]HollandsJG,SpenceI.TheDiscriminationofGraphicalElements.Appliedcognitivepsychology.2001,15:413~431
[29]FreedmanEG,ShahP.TowardaModelofKnowledge-BasedGraphComprehension.In:MHegarty,BMeyer,NHariNarayanan(Eds.):Diagrams2002,LNAI2317,2002.18~30
[30]KatzIR,XiX,KimH,ChengP.ElicitedSpeechFromGraphItemsontheTestofSpokenEnglish.TOEFLResearchReports,Report74February2004,ftp.省略/pub/toefl/990114.pdf
[31]PeeblesD,ChengP.Extendingtaskanalyticmodelsofgraph-basedreasoning:AcognitivemodelofproblemsolvingwithCartesiangraphsinACT-R/PM.CognitiveSystemsResearch,2002,3:77~86
[32]PeeblesD,ChengP.ModelingtheEffectofTaskandGraphicalRepresentationonResponseLatencyinaGraphReadingTask.HumanFactors,2003,45(1):28~45
[33]TraftonJG,TrickettSB.ANewModelofGraphandVisualizationUsage,In:JDMoore,KStenning(Eds.),Proceedingsofthe23rdAnnualConferenceoftheCognitiveScienceSociety.Mahwah,NJ:Erlbaum.2001,aic.nrl.navy.mil/~trafton/papers/graph-comprehension.pdf
[34]RatwaniRM,TraftonJG,Boehm-DavisDA.FromSpecificInformationExtractiontoInferences:AHierarchicalFrameworkofGraphComprehension.HFES,2004,archlab.gmu.edu/~rratwani/HFES.Hierarchical_framework.pdf
[35]RatwaniRM,TraftonJG.MakingGraphicalInferences:AHierarchicalFramework.Cogsci2004,cogsci.northwestern.edu/cogsci2004/papers/paper376.pdf
[36]FeeneyA,WebberL.AnalogicalRepresentationandGraphComprehension.LectureNotesinComputerScience,2003,2733:212~221
[37]TverskyB,MorrisonJB.Animation:canitfacilitate?Int.J.Human-ComputerStudies,2002,57:247~262
[38]KumarN,BenbasatI.TheEffectofRelationshipEncoding,TaskType,andComplexityonInformationRepresentation:anEmpiricalEvaluationof2Dand3DLineGraphs.MISQuarterly,2004,28(2):255~281
[39]BelcherD,BillinghurstM,HayesSE,StilesR.UsingAugmentedRealityforVisualizingComplexGraphsinThreeDimensions.ISMAR2003,省略/fileman_store/2003-ISMAR-ComplexGraphsAR.pdf
[40]Hegarty,M.Mentalanimation:Inferringmotionfromstaticdisplaysofmechanicalsystems.JournalofExperimentalPsychology:Learning,Memory,andCognition,1992,18:1084~1102
[41]RaynerK,RotelloCM,StewartAJ,KeirJ,DuffySA.IntegratingTextandPictorialInformation:EyeMovementsWhenLookingatPrintAdvertisements.JournalofExperimentalPsychology:Applied,2001,7(3):219~226
ReviewonGraphandTableProcessingTheories
RenYanju1,2FuXiaolan1
(1StateKeyLaboratoryofBrainandCognitiveScience,InstituteofPsychology,ChineseAcademyofSciences,Beijing100101,China)
(2GraduateSchool,ChineseAcademyofSciences,Beijing100039,China)
Abstract:Graphandtable,asimportantinformationrepresentationmodes,hadbeenappliedbroadly.Graphandtableprocessingrefertohumancognitiveprocessingofinformationingraphandtable.Firstly,thearticlereviewedrulemodel,cognitiveprocessmodel,andcomputationalmodel;secondly,itcommentedthehierarchicalframeworkmodelwhichhadbeenputforwardin2004;andfinally,itsummarizedthegraphandtableprocessingtheoriesandpointedoutresearchdirectionsinthefuture.
Keywords:graphandtableprocessing,rulemodel,cognitiveprocessmodel,computationalmodel,hierarchicalframeworkmodel.
收稿日期:2005-03-03
计算机视觉的主要任务范文篇4
关键词:多智能体;视觉系统;跟随者;定位
中图分类号:TP399文献标识码:A文章编号:1009-3044(2015)06-0189-02
TheDesignonVisualSystemofFollowerintheGroupofMultiIntelligentRobots
ZOUHai-yang
(CollegeofComputerinChinaWestNormalUniversity,Nanchong637000,China)
Abstract:ThevisionsystemisanimportantapproachtoPerceivetheoutsideworldforus。Itmakesrobotwithintelligentfunctionsandthevisualsystemisessential,itisabout70%informationtoachievedthroughthevisualsystem.Inthereallifeofdisaster,howtouseineffectively72hoursofgoldtimesandmakeintelligentrobotgroupstoachievedisastertominimizedamageandinjury.Thevisualsystemhasprovideduswithinspiration,ithasapowerfuldatafilteringcapabilities,ifthevisionsystemisintroducedintothegroupofmultiintelligentrobots,itprovidesabettertheoreticalandpracticalsignificancetorealizetherealintelligenceaboutrobots.
Keywords:multi-agent;visionsystems;follower;positioning
1视觉系统总体概述
我们感知外界往往通过个人的视觉、触觉、听觉、嗅觉等感觉器官,其中视觉是感觉器官中最主要的,我们所接触的外界的绝大部分信息是通过视觉系统。人们应用视觉系统,同物体建立相互的作用,来完成复杂的任务和各种动作。人类视觉系统具有强大的数据筛选功能,在我们的感知信息中70%以上都来源于视觉系统[5],我们可以通过视觉系统轻易的从大量的数据信息中识别出我们所需的目标。现实生活中灾难的多样性和复杂性正以指数的形式增加,如何在有效的72小时的黄金时间内,实现灾难损失和伤害的最小化。成为我们研究的一个方向。把视觉系统引入到多智能机器人群体中,为我们的研究提供了借鉴和启发。我们可以模拟人的视觉系统,使机器人具有视觉感知功能,这样更有利于机器人群体对于未知环境的感知。因此,多智能机器人群体视觉系统的设计具有较高的理论价值和应用前景。
对于多智能机器人群体视觉系统设计主要应用于以下三个领域:视觉检验、视觉导引、和移动机器人的视觉导航三类。
1)视觉检验:代替人应用于产品的检测和安检等领域。
2)视觉导引:通过对外界物体的模式识别来确定物体在二维或三维空间内的位置和方向,利用人工智能来完成分类、搬运或装配等相应的任务。
3)视觉导航:通过视觉系统,使多智能机器人群体获得当前环境的三维信息,在相应的编队控制策略下,安全到达指定的地址。
随着科学技术的不断更新,多智能机器人的应用越来越广泛,尤其是视觉系统,它已经被应用到众多领域,如:工业、农业、航空航天、危险物品的搬运、灾难的救援等方面。
2视觉系统的设计过程
多智能机器人群体编队控制策略中我们对机器人采用的是基于领航-跟随者的控制策略,这更有利于机器人群体能以我们设定的队形来完成搜索救援工作。视觉系统的设计中信息之间的传递和处理都是由群体中的各体来完成,但随着机器人智能化的高度发展,要处理的信息量势必会大大增加。基于此点考虑,在算法的设计过程中,我们把机器人分成领航机器人和跟随机器人两大类。对于领航机器人我们采取多目视觉系统;跟随者机器人,我们采用了单目视觉系统。
在设计机器人时,从空间和应用两个相矛盾的方面综合考虑后,我们设计的机器人结构要简单,运行速度要快,机器人群体间通信的数据链要尽量的少,通信速度越快越好。为此在设计中我们可以把机器人群体中跟随者机器人的视觉系统设计成单目视觉系统,单目视觉系统中跟随者机器人身上只有一个的摄像机,用来获得图像信息,通过一定的算法来实现目标的识别和定位,它的优点是:结构简单、处理速度快。出于对智能化的要求,结合实际,我们把领航机器人的视觉系统设计成多目视觉系统[2],可以通过调整每个视觉单元的动态投影矩阵来实现精确的立体定位。
在视觉系统过程中主要包括图像的采集、处理、对目标物体的跟踪及定位。对于人类来说很容易就能做到对物体的定位、跟踪及边缘检测等相应的工作。我们在早期模拟人的视觉系统采用的是静态“LookAndMove”方式,随着计算机图形处理技术的飞速发展,出现了视觉注意机制,视觉注意机制是指人的眼睛能快速识别出实时变化环境中的物体,总能忽略掉不相关的信息,视觉注意机制为机器人视觉系统提供了重要的借鉴。由于单目视觉系统主要是通过处理二维图像获得信息,因此对目标的定位效率不是很好,为了精确定位,结合算法,我们把领航者机器人视觉系统设计成多目系统。
1)图像的采集和处理:我们一般对所采取的图像进行压缩、噪声滤波、边缘提取、图像分割等处理,通过对人类视觉系统的模拟,进行相应的操作。
2)对目标物体的定位:在跟随机器人的设计中,我们主要是通过对二维平面的视觉搜索定位,算法对图像进行重构和分析,以此来确定目标在原来图像中的位置,利用坐标转换机制得到物体在空间中的真实位置。
3)对目标物体的跟踪:我们主要是通过对连续图像的分析,从而得到移动物体的移动轨迹,引导机器人去实现相应的操作。
4我们的期望和不足
视觉系统是我们感知外部世界的重要途径,我们同外界的交流中,大约有70%是通过视觉系统实现的,要使机器人具有智能化的功能。视觉系统是必不可少的,在现实生活中多智能机器人已经被广泛地应用于众多的领域,对多智能体机器人群体具有很好的实用价值。在课题中由于时间和精力有限,还有很多方面需要改进。1)在课题中我们在基于领航―跟随者控制策略中,我们只设计了跟随者的视觉系统。2)在算法中,由于空间和通信链的原因,我们只能设计单目视觉系统,同人眼的双目成像还有一定的差距。因此对于算法还需要进一步完善,希望我的课题研究能为机器人视觉系统的智能化设计提供一种借鉴。
参考文献:
[1]朱木健.基于服务机器人视觉系统的设计[D].重庆:重庆大学,2006.
[2]李造.多工业机器人系统中多级协作视觉系统的设计[D].杭州:浙江大学,2008.
[3]李荣华.面向机器人跟踪的视觉注意模型与应用研究[D].大连:大连理工大学,2011.
计算机视觉的主要任务范文篇5
1计算机教学中的不合理现象
1.1教学方法因循守旧,固步自封
当下各个高校都在倡导计算机教学改革,但效果很不理想。多数学生上计算机课还是在以考试为目的,死记硬背那些枯燥的概念和理论知识,而忽视了计算机的操作技能的练习。这与教师的教学方法落后是分不开的,老师在讲台上讲,学生在下面记笔记,这种千年不变的教学模式已经不再适应计算机科学的发展了。因此计算机课程迫切需要得到真正的改革。
1.2教师过分重视理论知识的灌输
教师缺乏对计算机课程应以实用性为指导的教学理念的理解,一再依赖教学大纲中的内容,以为教学大纲的内容教授完成了,教学目的就达到了。殊不知,这恰恰导致了学生只记住了概念,却丢掉了计算机课程最重要的能力,这就是动手能力、实际应用能力。
1.3教学评价方式不科学
评价方式是计算机教学的重要一环,大多数高校采取的评价方式往往是传统的笔试加上机的方式。这种方式十分落后,不但学生觉得枯燥无味,而且也限制了学生的动手能力的发展,压抑了学生的创造性。
2任务教学法在计算机课教学中的应用方法
2.1任务教学法的内涵
任务教学法是指,教师引导学生,确立一个目标,以完成此目标为任务,共同协作将其完成。在完成任务的过程中,学生发挥自己的主观能动性,利用所学的知识,将目标完成。最后教师再在课堂中对任务进行点评,给出参考的解决方案。这种教学法可以帮助学生将所学的知识点结合在一起,培养学生的全局观和动手能力。
2.2任务教学法的应用
2.2.1任务设定
首先,设定任务的时候应该立足教学目标,根据学生的水平,设定相应的任务,将枯燥的知识点整合起来,使学生看到这个目标就有去尝试的愿望,使学生化被动为主动,全身心地投入到这个任务中去。其次,任务的设定应该尽可能向学生的生活靠拢,让学生找到一种解决身边问题的感觉,从而激发学生的学习兴趣,在不知不觉中提高了动手能力,增强了计算机技能。
由此我们可以总结出任务创设的几个要点。第一,突出教学目标。任务创设时,要弄明白主要目标和次要目标。要偏重立足于主要教学目标来设定任务,同时要兼顾考虑次要目标。要结合实际情况将任务划分成许多小任务或者分支任务交给学生去完成。这样就把复杂的问题简单化了,使学生能够更直观更容易地完成任务。第二,任务中分配的知识点应该适量,不应该急于求成。学生的水平有限,不可能一上来就具备很好的综合能力,如果一个任务中包含了过多的知识点,往往会适得其反,学生会觉得在完成任务的过程中困难重重,难于下手,从而滋生厌烦情绪,不利于任务教学法的实施,不利于学生动手能力的培养。第三,任务的设定要尽量少做限制,给学生更多自由发挥的空间,培养学生的创造性和自我学习的能力。例如,模拟一个学生日后工作中的情境,为上级领导完成某项大工程,学生可以利用互联网进行查询相关的信息。这样学生学到的知识得到了进一步的扩展和延伸,这就更加体现出了学以致用的原则,同时也进一步的提高了学生的学习兴趣。第四,可以根据学生的专业特点,设定与之相关的任务。以笔者所在高校为例,如给会计专业的班级授课时,可以偏重于excel中的会计专用函数的应用。在给小学教学专业的班级授课时,则可以多加入演示文稿部分内容任务训练。不同专业的学生受到了与之相关计算机技能的相应训练,提高了学生对计算机课程的认同感,学到了相应的计算机技能,更进一步的提高了学习兴趣。
2.2.2任务教学法在授课过程中的应用
首先是布置任务阶段。模拟工作中的环境,将准备好的任务告诉学生去完成,并进行适当的讲解,给出一些完成任务的思路供学生参考,引导学生进行适当的讨论,对于大的任务可以令学生分成小组,组员协同工作完成任务。
然后是任务实施阶段。在教师的指导下,学生开始实际操作。由于任务具有一定的综合性,在完成任务的过程中,学生可能会遇到一些问题并期望教师给予明确的操作方法指导。教师不能马上就给出具体的操作方法,而要多方引导,使其自己发现问题的症结所在,而不要过多地干涉学生的思维方式,从而培养学生独立思考的能力。在自己研究出问题的解决方案后,学生一定会得到一种成就感,使学生从中找到了学习的乐趣和解决问题的乐趣。
接着是师生交流阶段。在学生操作了一段时间后,往往会遇到一些具有“共性”的问题,此时允许学生提出问题,针对学生的问题教师可以统一给出提示,但不是完全告诉具体步骤。教师在和学生交流的过程中应该保持一种积极向上的情绪和和蔼可亲的态度,对学生的问题要积极处理合理解决,切不可急躁甚至斥责学生,而要耐心地进行指导。这样就可以使学生通过教师的耐心指导,逐步建立起对计算机课程的自信心和兴趣来。
最后是收尾点评阶段。这个阶段十分重要,往往能够起到画龙点睛的作用。学生在完成布置的任务后会很迫切地知道自己的成果会得到什么样的评价,教师应该结合任务的具体要求,将解题思路和所用到的知识点教授给学生,使学生在具体的工作中抽象出解题的思路和方法来,形成用计算机解决此类问题的能力。教师对学生上交的任务给出点评,指出学生任务的不足之处。期末的时候要将每一位的同学的每次任务综合起来,给出本学期的最终评价结果来。
计算机视觉的主要任务范文1篇6
上课时,首先给学生演示“成品”,如一期小报,一张统计表,一幅图画等,然后边演示边讲授做“成品”的步骤,过程中涉及了需要学生掌握的知识点。在一节课的45分钟里,仅用10分钟讲授和演示,剩下的时间统统给学生上机练习,我来辅导答疑。每一节课都要求学生学会几个技巧,完成一个阶段内容,也就是一个“成品”或“半成品”。学生在操作中遇到问题,教师答疑并提醒全体注意,这样,每节课的教学目标明确,任务清楚,循序渐进,学生操作及时,学有所得。
1、调动学生学习的主动性
动机是“为了什么”,目的是“达到什么”,没有动机的活动是不存在的,我在教学过程中以任务促使学生形成动机,进而培养学生的学习兴趣。例如,上课演示“奥运五环旗”,让学生一模仿二发挥。这节课设置的任务符合学生的实际,多数学生都关心奥运会,非常熟悉五环旗,一看就有兴趣;另外,应用的技巧难易适当,即复制和粘贴,多数学生很快能学会,只要教师在讲授步骤别注重知识点的把握,学生在自己画时就能抓住重要步骤,发挥出学习的主动性。
2、满足学生的求知欲望
作为教师演示的课件,一定要在课前精心设计制作,才能达到“任务驱动”的目的。这时,教师演示讲授操作步骤,尽管“全体广播”使学生只能用视觉、听觉,不能操纵计算机,但是教室里鸦雀无声,竟没有一个人不是全神贯注盯着显示器的屏幕,这时的学生求知欲望最强,他们迫切地想知道、想学会这引人入胜的动画是怎么做出来的,也就是说,“任务驱动”创设着一种适当的情境,引起了学生的认知的冲突,使学生产生了一种悬而未决的求知欲,从而激发了学生的求知热情。
3、给予学生成就感
教学目标的实现,不仅包括教学思路、教学过程,还有教学效果。计算机学科必须动手的特点,使教师的教法不可以纸上谈兵,也使计算机的考试不适于死记硬背。“任务驱动”让学生在每一堂课上为着“任务”、为着制作一件“成品”或“半成品”去动手操作,去克服遇到的各种困难,比如,想让五环互相环套,却涂抹了圆的一部分弧;想嵌入几个漂亮的汉字,却一个字都输不上去等等,逼你提问题,去寻找解决问题的技巧。当大功告成,一种收获的喜悦、一种成就感油然而生,立刻又在考虑:“我不能白做,得留下,留在我的软盘上!”接下来就学存盘——一节课没停手,既没感觉累也不感觉枯燥,不知不觉就下课了,要不是底下还有课,手怎么也不愿离开那小鼠标,这似乎不象考试,可再想想,难道这不说明你掌握了这节课的知识?完成了“任务”,不是考试合格了吗?
4、开拓学生的创造力
计算机视觉的主要任务范文篇7
一、以强化政治意识为立足点,加强思想道德建设
在当前审计任务越来越重、压力越来越大的新形势下,审计干部只有保持清醒的政治头脑,具有正确的政治思想、坚定的政治立场、敏锐的政治观察力和鉴别力,才能把握住审计工作方向,从而推动审计工作创新发展。为此,紧密联系实际,组织广大审计干部认真学习邓小平理论和“三个代表”重要思想,学习科学发展观和构建社会主义和谐社会等一系列重大战略思想,进一步坚定理想信念,树立正确的世界观、人生观、价值观和全心全意为人民服务的公仆意识。增强政治意识、责任意识和政治敏锐力。坚持以开展党风党纪、勤政廉政和职业道德为主要内容的经常性思想教育,强化律已意识和法制观念,时刻保持清醒的头脑。自觉践行社会主义荣辱观,严格遵守各项政策纪律,热爱审计工作,忠于审计事业。努力培养审计人员树立“依法审计,客观公正”的职业道德,坚持社会主义核心价值体系,自觉执行审计纪律,秉公执法,廉洁从审,切实维护审计机关清正廉洁、客观公正的良好形象。
二、以提升审计手段为突破点,加强审计信息化建设
随着现代科学技术特别是信息技术的迅猛发展和各类领域的广泛应用,审计手段发生了深刻的变化。为适应这一需要,始终坚持与时俱进,以新的视角认识问题,以新的思路指导建设,以推动审计信息化建设向更高层次发展,实现审计手段现代化的目标。在全面推广应用AO系统开展项目管理和数据分析的同时,加大审计方法的研究力度。在学习运用OA操作,不断完善OA系统,实现局域网互联互通的同时,高度重视审计信息资源的开发利用,促进审计信息资源管理水平不断提高,为审计工作提供强有力的技术支撑。重视人才的培训,进一步加大培训力度,在继续抓好审计署组织的计算机技术初级应用水平考试的基础上,采取“走出去、请进来”的方式,一方面每年选送2~3名审计人员参加上级审计机关举办的计算机软件应用培训,另一方面邀请地方高校或科研单位的计算机专家教授搞讲座、做辅导,提高全体审计人员的计算机操作应用水平。重视计算机软件的开发应用,鼓励自主创新,充分发挥专业技术人才的作用,切实解决计算机审计中遇到的各种难题。积极探索实行联网审计,资源共享,研究建立联网审计操作规程和质量控制措施,切实提高信息化审计水平。同时,要经常注意对网络及设备进行全面有效地清查,进一步完善网络安全防护体系,确保信息传输、处理和储存的安全保密,更好地开展审计工作。
三、以提高业务素质为关键点,加强审计干部队伍建设
审计干部队伍建设,是决定审计事业发展的基础和关键。把干部队伍建设摆上重要议事日程,按照总理提出的“建设一支作风过硬、经得起考验、高素质的审计队伍”的要求,狠抓审计干部队伍整体素质的提高,为审计事业的发展提供更为有力的支撑。一是注重整体优化,打牢组织基础。着眼新形势下审计监督职能和任务的需要,从优化组织结构入手,抓好队伍建设,改善审计人员素质和能力结构,有效地保障监督职能作用的发挥。在人员使用上,注意有序流动,适时进行内部调整交流,实行岗位轮换,把优秀人才用到重要岗位上,有效增强干部队伍的生机和活力。二是搞好业务培训,打牢业务基础。建设团结、务实、廉洁、高效审计干部队伍,使审计人员具有宽厚的理论知识、丰富的高科技知识和扎实的业务技能。因此,加大培训力度,鼓励支持他们参加各种业务培训和在职自学,不断提高审计业务水平。三是加强理论研究,打牢能力基础。加强审计理论研究是探索新形势下审计工作特点规律的迫切需要,也是审计机关实施科学决策的重要保证。引导审计干部注意在工作落实中总结经验教训,在总结分析中自我提高,把握特点规律,善于把工作实践变成理性思考,以理论研究的成果推动审计工作创新发展。四是改进机关作风,打牢效能基础。自觉践行总书记倡导的八个方面的良好作风,全面加强审计机关作风建设,大力弘扬“依法、求实、严谨、奋进、奉献”的审计精神,倡导谦虚谨慎、文明审计的作风,提倡艰苦奋斗、勤俭节约的作风,培养求真务实、严谨细致的作风,保持良好的精神风貌。
四、以争做人民满意公务员为着眼点,加强党风廉政建设
党风廉政建设是审计工作的生命线。总理指出,人民信任审计机关,把重任交给审计机关,同时也关心和注视着审计机关,这就需要严格要求,自身要正、自身要严。坚持从严治理审计队伍,深入开展警示教育,做到防微杜渐、警钟长鸣、生活正派、情趣健康,自重、自醒、自警、自励,不断夯实廉洁从审的思想道德基础,筑牢拒腐防变的思想防线。按照“为民、务实、清廉”的要求,严格执行审计纪律和各项廉政规定,认真落实审计署和省厅关于加强审计机关自身建设的各项要求。审计干部要树立正确的权力观、地位观和利益观,自觉做到以公仆之心对待权力,以平常之心对待地位,以奉献之心对待事业,向党和人民交出一份干事创业、清正廉洁的合格答卷。大力培育和弘扬“热爱祖国、忠于人民、恪尽职守、廉洁奉公、求真务实、开拓创新、顾全大局、团结协作”的公务员精神,争做人民满意的公务员。
五、以提高机关管理水平为落脚点,加强审计制度建设
计算机视觉的主要任务范文1篇8
[关键词]视知觉跨通道多感觉知觉多感觉联合
[中图分类号]B842.1[文献标识码]A[文章编号]1009-5349(2012)02-0052-02
引言
现代人类被认为是视觉动物,因为我们每天的生活要很强地依赖视觉信息。电的发明使得我们甚至在黑暗中也可以看到周围的环境,新技术使我们的沟通和娱乐用到更多的图像和文本,广播和电话曾经一度作为最基本的交流和娱乐工具,现已让步于以图像为主的电视、电子邮件、短信息和互联网。在科学界,一般也认为视知觉是优势通道,是不受其他通道影响的,是不被非视觉信息所影响的。这和整体上脑机制特别是知觉处理的模块化范式是一致的,多年来这一思想都占主导地位。甚至在视觉通道内,其处理过程也被认为是高度模块化的,处理运动、颜色、立体感觉、形状和位置等各方面的东西都涉及到单独的脑区和脑机制。
经典的跨通道交互作用的实验也验证和补充了视觉是优势感觉通道的观点。在这些实验中,人工的在视觉信息和通过其他通道传达的信息之间造成冲突,然后报告视觉很强烈地支配了整体的知觉对象。例如,在口技效应中,对声音位置的知觉是通过视觉刺激的位置来捕捉到的(ThurlowWR&JackCE,1973),对位置的视觉捕捉也发生在和本体感受和触觉有关的通道中。这些效应都非常强烈,被作为视觉在知觉中占主导的证据。甚至在一个一般认为是听觉功能的机制,即言语知觉,也发现视觉很强地改变了听知觉的内容。比如,把音节ba的发音和发ga音的口型视频放在一起,人们将会把ba的声音知觉为da。这个效应被称为麦克格效应(McGurkH&MacDonaldJ,1976)。
一、视知觉的跨通道调整
越来越多的研究表明,多感觉刺激不仅对认知过程产生重大影响,也会对基本的视知觉产生很大影响。这里,我们将讨论声音和触觉如何提高视觉处理中对亮度的感知,如何有助于检测,提高瞬时分辨率,引导注意和影响运动知觉、视觉学习和视觉适应等。
(一)亮度感知和视觉检测
即使在另外的通道输入甚至没有提供任何和任务有直接意义相关的信息时,也会发生多感觉的增强效应。在Stein和他的同事的研究中(SteinBE&LondonN,1996),被试在伴随着一个简短的宽频带声音刺激时对一个视觉光强度的评价比这个视觉光刺激单独呈现时要高。不论相关的声音线索来源于哪里,声音刺激对较低的视觉强度的评价会带来更大的提高。后面研究发现当减少有声音的trials比例时,这种效应就会消失,这和反应偏向的解释是一致的。声音提供了一个一般的线索化、启动或转变机制,这会导致大脑在整体上对同时发生的刺激处理更有效。因此,即使声音不是和中心任务有特定的关联,但它提供了可以间接增加任务成绩的信息。声音也会在独立于这种时间线索效应时对视知觉起到促进作用。
(二)运动视知觉
除了跨通道对静态视知觉的影响所提到的以上例子之外,很多研究也证明了跨通道对运动知觉的影响。运动很难被视觉知觉,比如在黑暗的或闭塞的环境下,声音和触觉可以传递信息,这有助于对运动的精确性知觉。因此,尽管传统观点认为视觉要比听觉或触觉运动知觉有优势,也有很多研究报告视觉运动知觉本身也会被其他通道所影响(HidakaS&Manaka,2009)。而这些结果可以用反应偏向来解释,而不是一个感觉联合效应。通过口技效应,静态听觉刺激也会影响到对视觉运动知觉的方向。
(三)视觉学习和视觉适应的跨通道调节
跨通道信号也能增强视觉事件记忆和知觉学习,对物体的视觉再认能从多感觉的编码中获益。Murray和他的同事发现(MurrayMM&MichelCM,2004)当任务是判断呈现在序列中的图片是否是以前呈现过的或新的图片,第一次呈现时,对那些首次呈现时伴随和它们相应声音的图片,比如图片是铃铛,声音是“叮”和首次呈现没有声音伴随的图片相比,再认精确度更高,即使在第二次呈现时都没有声音。换句话说,物体的视―听编码提高了视觉提取。这种提取的易化只发生在那些和它们相应的语义上一致的声音一起呈现的图片上,而不是对任何的声音都有用,表明易化不是因为声音的一般转化效应,而是涉及到视―听的捆绑。
二、非视觉刺激引起的视觉错觉
Sekuler和他的同事表明视觉运动感知到的运动轨道可被声音改变。当两个一样的视觉物体在一个二维空间的显示器上连续不断地向彼此移动,做一致方向的运动然后彼此分开,物体可以被看作或者是通过彼此流动的,或者相对于彼此弹回的。但是,如果两个物体的视觉一致伴随着一个简洁的声音,运动的视知觉就更偏向于弹回运动(SekulerR&SekulerAB,1997),这对视知觉而言是质的变化。产生这种变化的机制目前还不是很清楚,而且它也不可能是通过认知过程来调节的――比如通过高水平的知识即当物体相撞时产生一个声音,而是发生在知觉水平的交互作用。最新的研究表明甚至阈下的声音也能引起偏向。然而,研究表明错觉的确反映了在处理的知觉水平上的交互作用(DufourA&TouzalinP,2008),表明这种错觉可能是因为一个一般的注意调节而不是多感觉联合本身。
Shams和他的同事们表明一个简短的视觉刺激的知觉能被同时发生的简短的声音质的改变。当一个单独的闪光出现的时候伴随两声或更多的“哔哔”声,对单独的闪光的知觉就变成了两个闪光或更多的闪光,这种效应被称为声音引起的闪光错觉。相反的错觉也会发生,当两个闪光伴随着一个单独的“哔哔”声时,对闪光的知觉就变成了一个(WoznyD&BeierholmU,2008),但这种错觉通常都不是很强烈。
三、跨通道交互作用的计算原则
直觉上,可以认为,如果对一个环境变量,比如事件的时间有两个能得到的感觉测量比如听觉和视觉,那么假定感觉测量经常是嘈杂的,结合两个测量来得到对环境变量的一个更有情报的估计就会很有意义。更重要的是,如果同样的变量有两个嘈杂的观察者,如果两个观察者都是无偏估计者,那么结合两个测量就会导致一个更精确的估计。因此,结合一个视觉观察者和一个听觉观察者会在环境中对物体属性的估计有帮助作用。另一方面,如果两个感觉信号来源于不同的物体,比如,视觉信号来自一个农场一角的一只母牛,而听觉刺激来自另一个角的公鸡,那么结合两种信号就会被误导,就会对估计产生一个很大的错误,比如,对物置的估计。因此,为了弄清楚周围环境的意思,神经系统需要去计算哪一个信号是由同样的物体引起的,是应该被结合的,哪一个信号是由不同的物体引起的,是应该去掉的,这是一个非常重要的因果推理。因为神经系统一般没有关于在任何假定的时间特定场景和事件因果结构的任何线索,因此解决这一问题仅仅是建立在嘈杂的感觉测量和关于世界的先验信息基础上的。除了解决这一因果推论问题,一旦推测多种信号是来自同样的物体,神经系统还需要计算出如何去结合它们,这就是多感觉联合的问题。
Shams和他的同事们最近引进了一个规范性的模型――贝叶斯模型,该模型是一个非层级的模型,是内隐执行因果推理的。这一模型可以解释在空间位置的视―听交互作用,同样也可以解释观察者的知觉因果结构(KördingK&BeierholmU,2007)。也同样表明在完成这一视―听任务时,感觉表现和先验期待似乎彼此之间独立编码的,表明神经系统确实在执行这一知觉任务时遵循了贝叶斯推理。综合所有的研究表明在执行基本的知觉任务时,人类的知觉系统执行因果推理和多感觉联合时,是以一种和贝叶斯观察者高度一致的方式。这种策略是统计上最优,它会把知觉估计的平均错误降到最小,然而,在一些条件下也会产生错误,即以错觉的方式表现出来。
四、总结
一个多世纪以来,整体上脑的机制特别是视知觉,都被认为是高度模块化的。不同的感觉通道都被坚信是在单独的通道上所组织的,通道之间没有任何的沟通和交互,对世界统一的知觉被认为是通过在更高水平上对来自这些单独通道的信息输入的汇聚的进一步处理而形成的,是感觉信号在它们各自单通道脑区分别被彻底处理后最后才融合的。过去几年的研究都揭示了视知觉可以通过来自其他通道的信息输入在数量上和内容上被改变,这些调整可以发生在很多不同的处理水平上,在不同的知觉领域,通过一些视觉错觉很明显地表明这一调节是很有趣的也是稳定的。视觉处理被非视觉感觉信号的调整甚至发生在皮层处理的早期阶段,即初级视觉皮层,而且是在非常短的潜伏期下。
视觉处理在一个广泛的领域内和其他感觉通道有很强的交互作用,这些交互作用似乎遵循着一个一般的计算策略,即试图将在知觉上的平均估计降到最小。人类多感觉知觉似乎通过结合感觉证据和先验知识来完成因果推理的任务和以统计上最优的方式来联合感觉。的确,视觉处理是人类知觉的一个重要的成分,是作为一个大的网络的一部分来运行,这个网络从一系列来源和通道中获得感觉测量,然后试图去提出感觉信号的每一个解释,最终使得在整体上平均错误最小。
【参考文献】
[1]AlinkA,SingerW,MuckliL.Captureofauditorymotionbyvisionisrepresentedbyanactivationshiftfromauditorytovisualmotion.cortex.JournalofNeuroscience,2008,28:2690-7.
[2]BeierholmU,QuartzS,ShamsL.Bayesianpriorsareencodedindependentlyoflikelihoodsinhumanmultisensoryperception.JournalofVision,2009,9:1-9.
[3]CappeC,RouillerEM,BaroneP.Multisensoryanatomicalpathways.HearingResearch,2009,258:28-36.
[4]DiLucaM,MachullaT-K,ErnstM.Recalibrationofmultisensorysimultaneity:Cross-modaltransfercoincideswithachangeinperceptuallatency.JournalofVision,2009,9:1-16.
[5]DufourA,TouzalinP,MoessingerM,BrochardR,DespresO.Visualmotiondisambiguationbyasubliminalsound.ConsciousnessandCognition,2008,17:790-7.
[6]FreemanE,DriverJ.Directionofvisualapparentmotiondrivensolelybytimingofastaticsound.CurrentBiology,2008,18:1262-6.
[7]HidakaS,ManakaY,TeramotoW,SugitaY,MiyauchiR,GyobaJ,etal.Alternationofsoundlocationinducesvisualmotionperceptionofastaticobject.PLoSONE,2009,4:e8188.
[8]KonkleT,WangQ,HaywardV,MooreCI.Motionaftereffectstransferbetweentouchandvision.CurrentBiology,2009,19:745-50.
[9]KördingK,BeierholmU,MaWJ,TenenbaumJM,QuartzS,ShamsL.Causalinferenceinmultisensoryperception.PLoSONE,2007,2:e943.
[10]SatoY,ToyoizumiT,AiharaK.Bayesianinferenceexplainsperceptionofunityandventriloquismaftereffect:Identicationofcommonsourcesofaudiovisualstimuli.NeuralComputation,2007,19:3335-55.
[11]SekulerR,SekulerAB,LauR.Soundaltersvisualmotionperception.Nature,1997,385:308.
[12]ShamsL,MaWJ,BeierholmU.Sound-inducedashillusionasanoptimalpercept.NeuroReport,2005,16:1923-7.
[13]SpenceC,PavaniF,DriverJ.Crossmodallinksbetweenvisionandtouchincovertendogenousspatialattention.JournalofExperimentalPsychology:HumanPerceptionandPerformance,2010,26:1298-319.
计算机视觉的主要任务范文篇9
驱动任务教学法在中职计算机教学方面发挥着重要的作用。本文从驱动任务教学法的意义出发,分析与探讨了驱动任务教学法应用存在问题,并为提升中职计算机教学水平提出科学的建议及对策。
关键词:
驱动任务;中职;计算机
一、引言
经济的发展,带动了信息技术的进步,如今已经进入了信息技术阶段,在大数据时代下,计算机已经成为人们生活与工作必不可少的工具。这几年随着高校的扩招,一方面给社会与企业输送了大量高素质的人才,但是另外一方面给现代就业市场带来严峻的压力。许多用人单位更加青睐中职学生,与大学生相比,中职学生具有更加强的专业技能,尤其是动手能力方面更胜一筹。中职教育的发展得到国家的重视,但是中职教学依然存在较多的问题。纵观现在中职计算机课堂中,很多教师采用陈旧单一的教学方法,教学质量与教学效果不是很好。因此,为培养优秀的计算机人才,就要加大力度对教学方式进行改革。驱动任务教学法,以任务为导向,将学生安排成若干个小组,学生以小组的名义去完成任务,在执行任务过程中,教师不能直接干预学生的任务,任务结束之后,小组进行自我评价,教师并进行简要点评。驱动任务教学法,弥补了传统教学的弊端,有助于全面提升学生的综合素质。本课题重点探讨了驱动任务教学法的应用意义,并为提升中职计算机教学水平提出科学的建议。本课题进一步丰富了驱动任务教学法的相关理论,并为中职教学提出实践性的参考价值。
二、驱动任务教学在中职计算机教学的应用
(一)有助于激发学生对计算机课程的兴趣
爱因斯坦说过兴趣是最好的教师”,要提升教学质量就要激发学生兴趣。传统的教学课堂中经常采用填鸭教学法。这种教学方式,对于充满活力的中职学生来说,十分枯燥无味。通过驱动任务教学法,教师布置相关任务,学生以小组方式去完成任务,课堂上学生之间能够相互沟通相互讨论,与呆板的课堂相比,充满挑战与快乐,有助于调动学生的积极性。
(二)有助于培养学生的综合素质
如今就业压力非常巨大,对于中职学生来说,学历上具有一定的劣势。要增强学生的就业竞争力,就要通过日常教学全面提升学生的综合素质。传统的教学方式忽视了学生职业素养以及通用能力的提升。通过驱动任务教学法,给学生进行合理的分组,让学生以小组的名义进行学习,这样有助于培养学生的团队精神与合作意识。在完成任务的时候,引导学生进行总结,有助于提升学生的表达能力与自我总结能力。通过驱动任务教学法,还有助于提升学生的心理素质,引导学生树立正确的世界观、人生观以及价值观。
(三)驱动任务教学法有助于降低中职计算机教师的压力
社会的发展,改善了人们的物质生活,但是年轻教师的生存压力依然非常巨大,特别是房价、物价的持续上涨。不少民办中职教师,待遇比较差,工作压力较大,一些中职计算机教师不仅要承担教学任务,还有承担机房的维护工作,甚至还要担任班主任工作,繁重的教学任务让计算机教师非常疲惫不堪。驱动任务教学法,能够减少教师课堂的授课时间,同时增加师生之间的互动与沟通,加强师生感情交流,有助于教师组织课堂纪律。
三、加强驱动任务教学法在计算机教学中的措施
(一)布置合理科学的任务
在现实教学中,很多教师有尝试采用驱动任务教学法辅助教学,但是效果不明显。出现很普遍的现象,刚开始学生参与的积极性很高,但是后面就逐步失去兴趣,甚至有学生感觉到课程乏味,没有意思。深入了解,主要原因是教师在布置教学任务的时候,难度不合理。例如有教师给中职一年级的学生,布置编程等任务,很多学生都没有计算机基础,因此在执行任务的时候感觉难度较大,容易失去信心。也有部分教师,为了应付教学,给计算机专业学生布置的制作节日贺卡等任务,很多学生觉得任务比较简单,缺乏挑战性,不需要怎么进行讨论即可完成。
(二)加强对课堂纪律的管理与组织
中职学生,大部分是中考落榜生,他们文化基础较差,而且纪律性不强,比较难以管理,这个群体的学生通常不爱学习,比较贪玩,课堂中甚至喜欢捣乱。部分教师采用驱动任务教学法的时候,一些好动的学生经常趁讨论的机会讲话,甚至有逃离课室的现象,严重影响教学的质量。一些计算机教师,形式上采用驱动任务教学法,实质上直接放任课堂不管,对学生来说是非常不好,长时间下去并未学习到专业知识。因此,计算机教师,要加强对课堂纪律的管理,不管采用什么方法,都要求学生遵守学校规章制度以及课堂纪律,俗话说无规矩不成方圆”,只有制定严格的规定,学生的学习效果才会更加明显。
(三)加强对学习任务的总结与评价
驱动任务教学法的运用,有另外一个特色,就是在任务完成之后,教师要引导学生进行自我评价与总结,同时教师对各个小组的表现进行简要的点评。首先,教师要鼓励各小组要派代表主动对本小组的任务完成情况进行评价,尤其是对其他组员的表现也进行点评,有助于提升学生的表达能力。其次,教师也可以组织小组之间相互评价,例如让A组同学对B组同学的表现进行评价,有助于小组之间相互学习,相辅相成。最后,教师要对各小组的表现进行点评,俗话说英雄是赞美出来的”,对于学生做的好的要给以肯定,做的不足的教师应该以婉转的方式进行点评。
四、总结
总的来说,驱动任务教学法在中职计算机教学中发挥着重要的意义,驱动任务教学法不仅有助于激发中职学生对计算机课程的兴趣,同时有助于提升学生的综合素质,减轻教师的工作压力。要提升中职计算机教学水平,教师还要布置科学合理的任务,加强对课堂纪律的管理与组织以及加强对学习任务的总结与评价。
作者:张宁宁单位:淄博市职工教育培训中心
参考文献:
[1]王斯艺.任务驱动教学法在中职计算机教学中的应用研究[D].内蒙古师范大学,2008.
计算机视觉的主要任务范文
关键词:机器视觉;边缘检测;图象识别;滤波算法
中图分类号:TP242文献标识码:A文章编号:1674-7712(2013)02-0082-01
一、机器人系统的发展及机器人视觉
机器人的发展大致经历了三个成长阶段,也即三个时代。第一代为简单个体机器人;第二代为群体劳动机器人;第三代为类似人类的智能机器人。它的未来发展方向是有知觉、有思维、能与人对话。机器人向着智能化、拟人化方向发展的道路,是没有止境的。机器人视觉是计算机学科的一个重要分支,它综合了光学、机械、电子、计算机软硬件等方面的技术,涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。我国机器人视觉应用主要有以下目的:用以代替人类从事危险、有害和恶劣环境、超净环境下的工作;提高劳动生产率,改变产品质量,快速相应市场需求,加强在国际市场的竞争能力。
二、机器人视觉的原理
机器视觉是机器人感知周围环境的主要途径之一。它可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。目前成熟的光电成像技术都只能捕获二维明暗信息,而不能获得距离信息,所以直接通过这种途径获得的机器视觉也只能是二维的。随着科学技术的发展,三维立体视觉的解决方案也如雨后春笋般涌出,其中就包括双目立体视觉,狭缝光投影法,时间差法等。
(一)实现方法
1.图像的获取与预处理:用于进行三维特征提取的图像是一幅常规的二维灰度图,所以使用一个常规的CCD或CMOS图像传感器即可满足要求。图像需要进行量化处理,即把图像信息分成许多像素点,这些亮点经过A/D转换后即可输入计算机进行处理。2.边缘信息提取:边缘提取算法就是把一副灰度图像转化为二值图像,灰度图像中的轮廓在二值图像中用1表示,而非轮廓位置用0表示。边缘提取算法的种类非常地多,如Robert算子卷积法等。3.边缘检测与轮廓连结:边缘检测主要采用各种算子来发现、强化图像中那些可能存在边缘的像素点。边缘检测算子除了有Roberts算子外,还有索贝尔算子(Sobeloperator)和Prewitt算子、高斯偏导滤波器以及Canny边缘检测器等。4.利用线条分类识别三维物体:提取出二维图像的轮廓信息,还不足以分析出其中的三维特征,我们必须对轮廓信息进行进一步的模式化处理,从轮廓中提取特征。5.从二维图像中提取三维特征的局限性:虽然从二维图像中提取图像的三维特征的算法对设备的要求低,处理的数据量相对较小,输出地结果也比较规整。但是这种算法也有其局限性。
(二)摄像机模型及透视技术
透视技术实际是一个非线性映射,这在实际求解时可能需要大的计算量,而且如果透视效果不明显,直接使用该模型可能会使求解变为病态。透视逆变换把三维物体转变为二维图形表示的过程称为投影变换。
三、基于视觉的机器人路径规
针对移动机器人规避障碍和寻找最优路径问题,提出了在复杂环境下移动机器人的一种路径规划方法。采用了栅格法建立了机器人工作平面的坐标系,整个系统由全局路径规划和局部避碰规划两部分组成[8]。在全局路径规划中,用改进蚁群算法规划出初步全局优化路径;局部避碰规划是在跟踪全局优化路径的过程中,通过基于滚动窗口的环境探测和碰撞预测,对动态障碍物实施有效的局部避碰策略,从而使机器人能够安全顺利的到达目标点。这种方法能在较短时间内找到最佳路径并规避障碍。
四、机器人视觉处理程序
机器人视觉处理程序的主要功能包括:(1)从USB摄像头实时读取视频数据,进行简单的预处理;(2)随后进行图像处理,主要完成空域的图像增强。通过对图像进行二值化,将目标小球从背景中提取出来;(3)计算目标的位置,进而计算出机器人头部的旋转角度,通过舵机驱动程序,控制机器人头部转动到目标所在角度,实现对目标物体的跟踪。
经过实验,机器人头部可较好地跟踪目标,实现了视觉原型系统。
(一)机器人视觉的目标与任务
目标:使机器人具有感知周围视觉世界的能力。让机器人具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。
任务:图象的获取、预处理、图象分割与表示与描述、识别与分类、三维信息理解、景物描述、图象解释。红色部分就构成了图像分析的研究内容。
(二)视觉信息的处理
移动机器人视觉信息的处理通常由图象获取、图象分析、关系描述三部分组成。
五、结束语
移动机器人是目前机器人领域的研究重点之一,吸引着众多学者的注意。机器人的研究涉及到人工智能、控制理论、传感器技术和计算机科学等多门学科。通过阅读大量的期刊、学术论文用于进行三维特征提取的图像是一幅常规的二维灰度图,所以使用一个常规的CCD或CMOS图像传感器即可满足要求。图像需要进行量化处理。为了给形态学处理的图像提供统一的条件,计算机在把获得图像进行形态学处理前,必须先对其进行预处理。由于各方面客观条件以及个人研究能力的限制,在机器人技术中嵌入式系统的应用及视觉处理程序方面的研究还不够深入,还需要在今后的研究中不断深入探讨。21世纪是信息化的时代,随着信息技术的发展和普及,机器人视觉系统无论是在理论研究上上,还是在应用方面都将很大进展。
参考文献:
[1]段峰,王耀南.机器视觉技术及其应用综述[J].自动化博览,2002(3):43-47.
[2]李文锦,吴海彬,何祖恩.基于机器视觉的机械测量及识别技术研究[J].机床与液压,2010(1):32-51.
计算机视觉的主要任务范文篇11
一、计算机网络对商务英语教学环境的改善。
商务工作的过程实质上是一种交际过程。商务英语的教学目标是培养在国际商务环境中用英语进行沟通的能力。传统的商务英语教学环境基本上局限在教室和课本上,给学生提供的是零商务环境,导致学生在走上工作岗位时极有可能遭遇“环境休克”,难以将所学知识应用到实际工作中去。
计算机辅助语言学习(computer-assistedlanguagelearning)在我国已经得到重视和应用,并使许多新的教育理念在英语教学中得以实现。
(一)计算机网络能够营造自主学习环境。
HenriHolec提出,学校应该设立两个教学目标:一是帮助学生获得语言和交际能力;二是帮助学生获得自主学习能力。
在商务英语教学过程中,计算机网络使学生能够利用多媒体课件和网络丰富的学习资源进行自学,而不受时间、地点的限制。学生可以根据自身需求和兴趣爱好,自主选择学习内容,调控学习进度,探索学习方法,掌握与商务英语相关的经济、贸易、金融等知识,不断在自身原有经验的基础上建构其对新知识的理解并发展其认知结构。
除了丰富的商务知识外,计算机网络还为学生提供了大量的语言资料,使学生可以不必依赖教师和教材。
各种媒体资源及专门的商务英语教学网站为学生提供了丰富的资源,学生可以自主选择阅读或通过原声电影、英文歌曲、英文广播等多种手段,提高商务英语的听、说、读、写、译基本能力。
以计算机网络为媒介,学生还可以通过电子邮件(e-mail)、聊天室(chatroom),或者MOO(multiuserdomainobjectoriented)进行一人对一人、一人对多人,或多人对多人的共时(synchronous),或非共时交流(-asynchronous),解决自主学习时遇到的困难。
(二)多信息通道的配合使用有利于改善信息的识记效果。
乔姆斯基(AvramNoamChomsky)曾指出:“我们大概应该努力为正常人本身拥有的本能的直观判断能力创造一个丰富的语言环境。”人类自然接受信息是通过人的各种感官来进行的,其中包括视觉、听觉、触觉、嗅觉和味觉等,其中视觉和听觉起着最重要的作用。
多媒体技术在商务英语教学中,可以提供丰富的画面、视频、影像和文字,使学生在学习过程中视听结合,图像和声音信息同步输入,有效刺激大脑皮层,提高记忆能力,从而比传统的、单一的以语言为主的教学方式达到更好的教学效果。
(三)大量真实的商务英语材料使语言输入有足够的“重复率”。
VanPatten在谈到语言吸收时认为:“能够被吸收的语言知识在语言输入中必须有足够的‘重复率’(frequen2cy)和‘凸显性’(salience)”。计算机、网络和商务英语教学的有机结合,将商务活动方方面面的情景真实地展现在学生面前。学生不仅可以通过计算机、网络找到关于接待、谈判、会议、询盘、发盘、装运、保险等各种商务活动的文字材料,也可以找到相关的听力、视频、音像资料。
就商务活动的某一主题而言,比如询盘,学生可以在网上找到多种对话资料、听力资料、阅读资料、写作资料及文化背景资料。多种资料中商务术语、商务知识的重复出现,使学生潜移默化地提高了语言运用能力,扩大了自己的知识层面。另外,通过计算机网络,教师可指导学生通过网上实时进行国际贸易业务实训,或通过教学软件进行贸易流程的训练。这种真实的商务英语材料不受课本知识的局限,能够激发学生的学习兴趣和热情,将学生的理论知识和真实的商务环境连接起来,帮助学生有效地克服“环境休克”现象。[论/文/网LunWenData/Com]
二、商务英语教学中计算机网络应用的误区。
与传统的商务英语教学相比,计算机网络的应用使商务英语教学朝着个性化学习、自主式学习的方向发展。
但是,在许多高校的商务英语教学课堂上,教学的本质并未发生改变,还是一种传统的以教师为中心的教学模式。
与传统的黑板+粉笔+录音机的教学形式相比,只是多了光盘、计算机和网络,商务英语课堂教学仍是教师讲、学生听的局面。以商务英语教学中的课文讲解为例,一方面,教师过度依赖课件。教师往往将课本内容完全照搬到多媒体课件中,然后借助课件进行讲解。即使学生课后上网学习,网络版的内容也基本是课本内容的重复,意义不大。在这种情况下,要激发学生的学习潜能,促进学生自主化学习,突出学生的个性化学习,就显得非常困难。另一方面,计算机其及网络自身客观上存在局限性,多媒体教学固然生动,但是教师往往在教学过程中给学生提供过大的信息量,而忽视了学生的个体差异。学生在短时间内获得大量的教学信息,在一定程度上抑制了学生的想象力,不利于其解决问题、分析问题能力的发展。
由此可见,在许多高校的商务英语课堂上,普遍认为计算机作为辅助工具用于教学的目的是要帮助教师提高教学手段,其特点是:第一,辅助教师的演示工具(辅助教授难点或重点);第二,教学内容基于课本;第三,学生是被灌输知识的对象;第四,不改变教学内容和教学结构;第五,以教师为中心的教学结构。教学上使
用的计算机被认为能够增强教师所传授的信息,因为信息被放大在屏幕上。因此,计算机作为一种技术只能起到增强教学效果的辅助作用,而不能真正成为人们用以解决实际问题的工具(MorrisonandLowther,2005)。当今时代,随着信息技术的发展,计算机网络的作用早已远远超出其辅助功能。尤其是在商务领域,人和计算机已经成为一个整体,不能分离。商务活动中,许多具体业务都必须通过计算机及其网络来完成。比如,在电子商务(e-business)中,询盘、发盘、谈判、签订合同等都需要通过电子邮件(e-mail)、网络聊天等方式来完成。
计算机视觉的主要任务范文篇12
政府信息公开保密自查报告范文(一)
根据《彭州市政务公开办关于进一步做好政府信息公开保密审查工作的通知》(彭政务公开办发〔20**〕5号)的精神,我局高度重视,由保密工作领导小组,组织各有关部门和人员对本单位的门户网站上已公开的信息进行了全面自查,未发现泄密内容和不宜公开的政务信息,现将自查情况汇报如下。
一、主要工作
(一)提高认识、加强组织领导
为做好信息公开保密审查工作,我局领导高度重视。一是健全组织机构,确保领导到位。调整充实了保密工作领导小组,由局党组书记、局长唐奎同志任组长,分管保密、信息工作的副局长邓义浩同志任副组长,各科室负责人为成员。领导小组下设办公室,由邓义浩同志兼任办公室主任,并落实了办公室工作人员,负责信息公开保密审查工作具体事务。形成了主要领导亲自抓,分管领导直接抓,专职人员具体抓的良好格局,为开展信息公开保密审查工作奠定了坚实的组织基础。二是建立健全各项保密工作制度,确保制度到位。建立健全了信息公开保密审查机制,明确了审查职责。近几年来,我局严格落实领导干部保密责任制、涉密人员管理制度、涉密计算机保密管理制度、网络安全管理责任人、信息审查员(计算机安全员)管理制度,自《中华人民共和国政府信息公开条例》实施后,建立政府信息保密审查制度。在《条例》规定的基础上进一步明确有关保密审查的职责分工、审查程序和责任追究办法,确保不发生泄密事件,做到以制度管人、按程序办事,确保保密工作顺利开展。
(二)开展保密宣传教育情况
我局高度重视保密宣传教育工作,一是积极组织有关人员参加了上级部门举办的各种培训学习;二是深入开展保密法制宣传教育。结合实际制定规划,采取多渠道、多形式加强对领导干部、重点涉密人员、保密干部的保密法制宣传教育,认真组织开展保密宣传教育月活动,组织干部观看保密教育片,学习《中华人民共和国保守国家秘密法》,通过学习教育增强保密干部的保密意识,提高了业务能力;三是对干部职工进行保密知识考试,进一步提高了我局保密干部队伍的业务水平,为做好我局保密工作奠定了扎实的基础。
(三)政务信息公开保密审查工作开展情况
1、严格实施有关计算机网络信息保密管理制度,加大保密审查力度。对主动公开的政务信息,由相关科室确定并制作、更新,在起草公文和制作信息时,应当对文件内容是否公开提出拟定意见,对属于免于公开的政府信息应当说明具体理由,由科室负责人审核并报单位分管领导审批后报局信息公开保密审查领导小组审批。经审查,截止目前,我局在本单位的网站上向社会公开的信息,未发现涉密信息。
2、抓好计算机信息系统的保密管理和文件的管理。
重点加强对计算机信息系统保密防范和治理工作和文件的管理。指定懂业务、会管理的工作人员专门负责计算机的管理工作,按有关要求及时组织人员对机关各办公室的办公自动化设备配置、使用情况进行整理、协调。防止涉密信息上网,做到涉密信息不上网,上网信息不涉密,按照控制源头、加强检查、明确责任、落实制度和谁上网,谁负责的原则,加强了对计算机网络的检查。经审查,到目前止,上网公开的信息符合保密规定,未发生计算机泄密事件。
二、存在问题及建议
(一)保密工作的教育力度需要不断加强。开展保密工作的实践使我们认识到,加强干部、职工的保密教育,提高保密意识十分重要。利用计算机网络、电子邮件向外发送资料已是十分方便和快捷的方式,但因此也可能带来泄密的危险。针对这一情况,需要加强宣传力度,增强保密意识,提高做好保密工作的主动性和自觉性,还要制定出相应的规章制度,使事前行为得到规范,堵塞可能发生的失、泄密事件,消除隐患。
(二)制度还需进一步完善。虽然已经建立了有关保密审查制度,但审查的依据范围广,有时难以找到依据,因此,必须结合本单位的实际,进一步细化保密审查依据,完善本单位的保密规定。
政府信息公开保密自查报告范文(二)
根据屯溪区人民政府办公室《关于进一步做好政府信息公开保密审查工作的通知》(屯政办秘〔20xx〕33号)文件要求,我局在做好政府信息公开保密审查工作的基础上,按照文件要求,结合工作实际,对开展政府信息公开保密审查工作进行了认真自查,未发现泄密内容和不宜公开的政府信息,现将自查情况简要报告如下:
一、领导重视,责任落实。我局领导高度重视保密工作,始终坚持把保密工作摆上重要议事日程,纳入目标责任制管理内容,纳入本部门工作整体规划,同部署、同检查、同总结、同考核。成立了保密领导小组,带头落实领导干部保密工作责任制,自觉执行和遵守保密工作方针政策和法规、规章,对年度内单位保密工作及时作出批示、提出要求。并明确了一名分管领导全面负责政府信息公开保密审查,并确定由纪检室具体负责对全局政府信息公开保密审查工作的指导和监督。
二、健全制度,强化教育。一是进一步修改完善《屯溪区财政局信息公开保密审查制度》、《屯溪区财政局财政信息公开制度》,对保密职责、保密范围、保密措施做出具体规定,将制定的制度落实到每个岗位和个人,从制度上保证保密工作务实高效。二是有重点地开展对保密干部、涉密人员、和全体干部职工的保密教育,将学习《保密法》作为创建学习型机关活动的重要学习内容,按要求上报总结材料,定期组织保密兼职人员开展保密业务知识的学习,进一步提高了保密业务管理和业务指导能力。三是坚持及时组织全体干部职工学习保密工作有关会议、文件精神,不断强化保密意识。
三、措施到位,严格管理。加强对涉密信息传输保密管理和涉密载体保密管理。一是加强三密文件资料的管理。对三密文件实行专人管理、专人负责,责任到人,无有丢失文件现象。二是建立健全财政信息上报审核制度,严格遵守了谁公开、谁审查、谁审查、谁负责和先审查、后公开的原则,明确了政府信息的收集、整理、编辑、审核、、更新过程中每个人员的具体责任。政府信息在公开前,经分管领导保密审查批准后才进行公开。对单位信息设有专人报送,严格网上保密报送制度,采取了有效的防范措施,确保了单位信息工作的万无一失。三是提高计算机保密维护。我局共有计算机五十余台,其中涉密计算机7台,互联网的计算机与局域网物理隔离,上互联网的计算机无涉密信息资料。
四、下一步工作计划。
政府信息公开保密审查工作是一项十分重要的工作。今后我们要不断加强宣传力度,增强信息公开的保密意识,提高做好保密工作的自觉性和主动性,不断完善相应的规章制度,堵塞可能发生的泄密事件,消除隐患,确保政府信息公开有序进行;在工作方式上,要创新信息公开保密机制,建立适应新形势要求和信息公开工作的保密制度,依靠制度落实各项工作要求,促进政府信息公开工作全面推进。
政府信息公开保密自查报告范文(三)
根据屯溪区人民政府办公室《关于进一步做好政府信息公开保密审查工作的通知》(屯政办秘〔20xx〕33号)文件要求,我局在做好政府信息公开保密审查工作的基础上,按照文件要求,结合工作实际,对开展政府信息公开保密审查工作进行了认真自查,未发现泄密内容和不宜公开的政府信息,现将自查情况简要报告如下:
一、领导重视,责任落实。我局领导高度重视保密工作,始终坚持把保密工作摆上重要议事日程,纳入目标责任制管理内容,纳入本部门工作整体规划,同部署、同检查、同总结、同考核。成立了保密领导小组,带头落实领导干部保密工作责任制,自觉执行和遵守保密工作方针政策和法规、规章,对年度内单位保密工作及时作出批示、提出要求。并明确了一名分管领导全面负责政府信息公开保密审查,并确定由纪检室具体负责对全局政府信息公开保密审查工作的指导和监督。
二、健全制度,强化教育。一是进一步修改完善《屯溪区财政局信息公开保密审查制度》、《屯溪区财政局财政信息公开制度》,对保密职责、保密范围、保密措施做出具体规定,将制定的制度落实到每个岗位和个人,从制度上保证保密工作务实高效。二是有重点地开展对保密干部、涉密人员、和全体干部职工的保密教育,将学习《保密法》作为创建学习型机关活动的重要学习内容,按要求上报总结材料,定期组织保密兼职人员开展保密业务知识的学习,进一步提高了保密业务管理和业务指导能力。三是坚持及时组织全体干部职工学习保密工作有关会议、文件精神,不断强化保密意识。
三、措施到位,严格管理。加强对涉密信息传输保密管理和涉密载体保密管理。一是加强三密文件资料的管理。对三密文件实行专人管理、专人负责,责任到人,无有丢失文件现象。二是建立健全财政信息上报审核制度,严格遵守了谁公开、谁审查、谁审查、谁负责和先审查、后公开的原则,明确了政府信息的收集、整理、编辑、审核、、更新过程中每个人员的具体责任。政府信息在公开前,经分管领导保密审查批准后才进行公开。对单位信息设有专人报送,严格网上保密报送制度,采取了有效的防范措施,确保了单位信息工作的万无一失。三是提高计算机保密维护。我局共有计算机五十余台,其中涉密计算机7台,互联网的计算机与局域网物理隔离,上互联网的计算机无涉密信息资料。