时间:2023-08-03 09:19:18
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇数字图像处理综述范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
【中图分类号】G642 【文献标识码】A 【文章编号】1006-9682(2012)10-0001-03
一、引 言
数字图像处理作为一门学科大约形成于20世纪60年代初期,并首次在航空航天领域取得了成功应用。数字图像处理技术的发展除了与计算机技术、信息技术的快速发展密切相关以外,还得益于其在航空航天、工业、生物医学、军事、通信工程、商务、环境、林业等诸多领域的广泛应用,正是这些应用需求,促进了数字图像处理技术的深入研究和快速发展。“数字图像处理”课程是随着计算机和信息技术发展应运而生的一门新兴课程,已成为信息类专业本科生的重要专业课。通过该课程的学习,要求学生掌握数字图像处理的基本概念和原理,能够对图像进行各种处理,如图像增强、图像运算、图像编码、边缘检测等,为图像通信、模式识别、计算机视觉以及其他交叉学科等工程领域的应用奠定基础。
“数字图像处理”课程的理论教学很抽象,仅仅通过理论教学学生很难掌握数字图像处理的基本原理。如果把数字图像处理的广泛应用引入课堂理论教学,将具体知识点与其在实践中的使用相结合,同时为学生提供边学边实践的机会,不仅可以提高学生的学习兴趣,加深对抽象理论知识的理解,增强其动手实践的能力,还可以拓展学生的视野,与目前学科前沿技术相衔接。
二、视觉测量技术
在现代三维测量新技术中,视觉测量是由计算机视觉、图像处理、模式识别等多学科交叉结合而形成的科学。图1所示,视觉测量是一种非接触性测量手段,以数字图像作为信息载体,对被测目标进行成像,通过提取多个像面的二维像点信息,标定相机内、外参数,并重建、优化被测目标的三维信息,实现测量。视觉测量基于严谨的理论和现代的硬软件设施,可以达到相当高的精度和可靠性,便于对大型工件、设备的尺寸、位置、三维轮廓等进行高精度测量,而且移动方便,可快速灵活地构建适于不同测量对象的系统,进行现场测量。目前,视觉测量技术已经广泛应用于建筑工程、航空航天、汽车制造、生物医学、考古等各个领域。[1~5]因此,视觉测量技术正在深入工业生产和社会生活的各个领域,研究和应用新的基于光学、数字图像和视觉信息融合的三维测量方法,既具有重要的理论意义,又具有重大的实用价值,应用前景非常广阔。
根据视觉测量的基本原理,利用数字图像处理技术获取的二维信息是视觉测量中相机标定、三维重建等环节的基础,对于系统的测量精度、稳定性等方面具有决定性的影响,是视觉测量领域的关键技术。在长期的数字图像处理课程教学以及视觉测量研究工作中发现,可以将视觉测量中关于数字图像处理的应用内容引入课堂教学中,与具体理论知识相结合,加深学生对于课程理论的理解,使其接触到科学研究的前沿内容。此外,通过设置开放性实验等环节,引导有兴趣和能力的学生进行实践能力的培养,使学到的知识“活”起来。
三、视觉测量与数字图像处理课程的融合
为了改善数字图像处理课程的教学效果,提高教学效率,将视觉测量技术与数字图像处理课程相融合,本文主要在教学方法和教学手段改革、视觉测量需求与理论知识点结合、实践动手能力提高等方面进行了研究。
1.教学方法和教学手段改革
为了贯彻学生是教育主体的教育思路,使学生学会学习,并充分激发学生的创新能力和素质培养,促进学生个性的发展,同时有利于师生彼此促进共同进步的原则,针对数字图像处理课程的特点,采取了以下措施:
(1)重视数字图像处理课程的基础理论教学。数字图像处理内容丰富,应用灵活广泛,但学生在掌握某些具体应用技术时感到理解困难。因此,在实际教学上,首先需要注重相关的基础理论教学。[6]例如,数字图像的本质是数字信号,所以在课程前期阶段,专门有针对性地复习和讲解了信号分析与处理方面的基本理论,包括数字信号处理的常用方法、离散傅里叶变换和快速傅里叶变换、离散余弦变换等,这些理论在数字图像处理课程中有具体应用。这不仅有利于对数字图像处理内容的掌握,也可以反过来加深对相关理论的理解。另一方面注意授课内容的精选,内容不在于多,而在于少而精,突出重点,使学生在有限学时内有最大的收获。例如,在频域空间进行图像增强时,不能将频域空间的所有方法都对学生讲授,而是突出讲解了关于频域空间与时域空间处理之间的关系,针对频域图像平滑介绍一种低频滤波器,分析其原理和特点。这样不仅节省了教学时间,而且重点突出,同时也引导学生查阅其他相关方法,让他们自己去动脑思考,提高其思维能力。
(2)完善和改革课堂教学方法。在课堂教学过程中,我们始终重视启发式教学,遵循“提出问题”、“启发式思考”、“解决问题”的教学过程,使用“问题教学法”引导学生去思考、分析问题,激发学生学习的积极性,提高教学效果。课堂开始时,根据授课内容,提前向学生抛出相关问题,在讲课过程中则围绕该问题讲解课程内容,最后提出问题的解决方法。例如,在讲解“直方图均衡化图像增强技术”一节内容时,首先向学生展示了两幅曝光不足和曝光过量的图片,并且为了提高学生的学习兴趣,认识数字图像处理的实际应用,图片取自于视觉测量、航空交会对接定位等领域的实际图片,向学生提问,“如果实际应用中,由于环境光的影响,拍摄到了这样的图片,应该怎么办?”课堂讲解过程中,随着直方图、直方图增强技术的理论、直方图均衡化方法等内容的展开,使学生逐渐理解并掌握直方图均衡化方法,最后,给学生演示了直方图均衡化方法的实现,并看到了利用该方法对图片增强前后的图片效果。这种启发引导式的课堂教学方法,取得了良好的效果。
(3)传统和现代化教学手段相结合。随着计算机、通信技术应用的迅速普及,国内高校的课堂教学已普遍采用了多媒体技术,利用计算机、投影仪、幻灯机等现代化教学设备,结合计算机辅助教学(CAI)展示教学内容。这些现代化技术的确为课堂带来了很多丰富多彩的教学手段。数字图像处理是以图像为处理对象,其输出的形式主要以图像和图形为主,该课程也十分适宜将教学内容制成课件,采用多媒体计算机开展现代化教学。借助多媒体,使学生较直观地看到各种图像的处理需求、处理过程、处理效果等,这是普通教材和参考资料所无法比拟的。因此,我们针对课堂教学需求,进行了多媒体课程教学资源建设,如教学大纲、教学日历、授课教案和课件等通过多媒体平成,便于讲课,同时也便于学生课后的复习。例如,将视觉测量原理、过程等,通过多媒体课件的形式演示出来,相比较口头介绍等方法具有更加直观的效果。除了多媒体教学手段,传统的板书式教学作为补充手段也在数字图像处理课程中得到应用,主要用在课堂教学内容框架展示、理论推导等方面。
2.视觉测量与理论知识点结合
为了提高算法对于目标特征的识别效果,视觉测量通常采用圆形或方形特征点(图2),在获取的图像中对特征的成像位置进行识别和精确定位。视觉测量对于图像处理的要求主要包括图像预处理、特征粗定位、特征精定位等内容,对应数字图像处理课程中的图像增强、边缘检测、特征识别、几何运算等知识点。[7]
图2 视觉测量常用特征点
(1)图像预处理。图像预处理的主要方法包括彩色图像灰度化、图像增强等,为此,在讲解彩色图像内容时,介绍了RGB、HSI等彩色模型以及不同彩色模型之间的转换,并引出如何将彩色信息转换成灰度信息。通过分析彩色表示模型,建立了彩色到灰度图像的转换。
向学生展示常用视觉测量图像效果的基础上,为了减少图像噪声的影响、提高图像识别效果,提出改善图像质量的目标,需要进行图像增强。结合图像增强中常用的直方图增强技术、空域和频域图像增强方法在视觉测量图像处理中的实际应用,给学生展示直观的处理效果,加深对图像增强方法的理解。
(2)特征点粗定位。数字图像处理的边缘检测是该课程比较重要的一部分内容,边缘检测中包含了多种方法,便于学生对不同边缘检测算法的作用效果有直观印象,将各种算法应用于视觉测量图像征点的边缘检测,并有针对性地选择相应参数,使学生不仅学习了各种边缘检测算法的使用,也看到了算法的特点。
根据视觉成像的特点,圆形特征点成像后一般为椭圆,所以,利用边缘检测得到的边缘像点数据,讲解用边缘点进行指定特征识别的方法,如基于Hough变换的特征检测方法。为了引导学生思考,采用启发式讲课方法,讲解了Hough变换检测直线的方法,引出如何用Hough变换检测像面上的圆或椭圆,并鼓励有能力的学生实现相应算法。
(3)特征点精定位。特征点精定位的目的是在实现特征点粗定位的基础上,对圆形特征点中心在像面上的精确坐标进行定位。精确定位主要设计到数字图像处理中的点运算,但需要考虑采用的具体定位算法,如灰度重心法、加权灰度重心法、椭圆拟合法等。引导学生通过文献资料查找和实现相关定位算法,并且与国际领先的专业软件进行定位精度对比。通过比较,可以使学生发现不同算法之间的区别,并分析不同的原因。进一步,引导学生尝试对定位算法做一定的改进,这种改进,不需要从算法根本上做出很大的创新,只是从某一方面进行微小的变化,使其能够适合特定的应用需求。例如,如果对视觉测量像面上特征点定位采用加权灰度重心法时,通过调整加权系数,得到不用的效果,从而分析加权系数对于定位精度的影响,并据此得出适用于该需求的结论。
四、开放性实验
长期以来,“数字图像处理”课程教学主要采用课堂理论教学,教学内容也多为经典的内容,很难反映课程内容的时代特征。实验教学是高等教育的重要组成部分,是抽象思维与形象思维、传授知识与训练技能相结合的过程,在人才培养中具有课堂理论教学环节不可替代的作用,对培养理工科大学生的创造性是不可缺少的。虽然目前大多数课程都设置了实践环节,但也普遍存在着很多问题,[8]例如,实验课成绩占课程成绩比例小,学生对实验的重视度不够,存在着抄袭他人实验结果和报告的现象;实验模式单一,实验内容陈旧、呆板,多为验证性实验,缺乏创新性和挑战性,学生完全处于被动状态,最终导致实验不认真,敷衍了事,所学的知识和操作技术遗忘快;不能保证每个学生都有充分的时间和机会做实验,个别学生逐渐养成依赖心理,最终只有一部分学生得到了锻炼;理论课与实验课教学老师分离,造成理论和实践环节脱节等。
针对目前“数字图像处理”课程实验的现状,根据视觉测量像面特征点定位需求,开设相关开放性实验项目“视觉测量特征点提取定位实验”,实验要求学生结合数字图像处理课程知识理论,对视觉测量采集的数字图像进行处理,提取相关特征点。针对视觉测量中常用的特征点(圆形、方形)进行自动检测,并实现高精度定位,主要实验内容包括:图像预处理、特征点粗定位、特征点精定位、算法设计与实现、实验结果分析等。
教师在开放性实验项目中承担的角色主要是方案设计和实施过程中的指导、监督,对方案的具体实现方法不做限制性要求,主要由学生结合课堂教学内容以及查阅文献资料来设计并完成。为了提高项目完成的效率,教师可以通过适当的引导为学生指出主要方向。
对于单个学生来说,这样的实验项目有些困难,“团队合作”也是新时期对科技人才素质的要求,所以可以通过建立项目小组的方式开展实验。小组成员将实验内容进行分工,每人负责不同的部分,通过相互合作、帮助,完成整个实验项目。通过这种形式,也在某种程度上锻炼了学生的团队合作意识和合作方法。
五、结束语
通过将视觉测量领域研究成果引入“数字图像处理”课程,并在教学方法、教学手段、教学内容、开放性实践等方面的改革和尝试,逐步做到科学研究成果与课堂理论教学的有机结合,不仅丰富了课程的教学内容,提高了学生的学习兴趣,加深了对理论知识的理解,而且使学生接触到科学研究的前沿领域,开拓了视野,对创新能力的培养锻炼等方面也具有重要意义。
参考文献
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季铮、盛庆红.基于近景数字视觉测量的飞机表面模型重建[J].地理空间信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 刘常杰、邾继贵、叶声华.汽车白车身机器视觉检测系统[J].汽车工程,2000(6):373~376
5 彭三城、孙星明、刘国华.三维人体自动测量技术综述[J].计算机应用研究,2005(4):1~5
[中图分类号]TD52[文献标识码]A[文章编号]1007-9416(2010)03-0037-02
1 引言
胶带的纵向撕裂问题是一个在国内国际都普遍存在的问题[1]。如何设计一种能对胶带实行实时监控的、并且在纵向撕裂发生后快速可靠的胶带保护装置,在国内外都是一个正在努力攻克的难题。相比较而言,由于我国煤矿的数量和胶带输送机的数量远远超过国外任何一个国家,而国内的胶带质质量与国外相比有很大的差距,纵向撕裂识别和保护问题在我国煤矿生产中更加受到重视,其中亟待解决的问题之一是进行有效的实时识别纵向裂缝。
国内外从70年代就开始纵向裂缝的识别研究,己从接触式发展到非接触式,从单一化到智能化,除嵌入法、光电传感技术、超声波扫描技术之外,现在又有了改进后的嵌入法、超声波技术和最新研究探讨的原子物理方法等等。由于煤矿生产环境的恶劣,每种方法都有其不成熟和不稳定的地方。因此,本文利用数字图像处理技术灵活性高、再现性好、处理精度高、适用面宽以及处理算法和图像特点相关性高的优点,根据矿用胶带图像的特点,选取结构识别方法,利用裂缝处灰度跳变的特性,使用了符合其特点连通域检测,通过图像预处理,图像切割,以及连通域检测三个步骤实现了矿用胶带的纵向裂缝的识别。
2 图像的分析及其预处理
当大多数纵向撕裂发生后,胶带表面会有变化,用肉眼能辨别的出来,我们可以在胶带下安装若干个摄象头,然后用计算机进行图象识别,利用胶带撕裂前后的图象特征变化来进行即时的监控。即可以进行预防以及及早的对发生的撕裂进行处理。由于胶带下面的环境比较恶劣,我们可以使用低照长寿命ccd摄象机。摄象机的安装地点要兼顾实用性和经济性,基于以上两个原则,要安装在最容易发生胶带撕裂的部位,在胶带的机头、机尾以及转折点各安装一个,以一个适合的高度尽可能照顾大的范围。
本实验系统由CCD摄像头、数据采集卡及识别软件系统和电脑组成。其中硬件包括CCD采集卡、视频采集卡和电脑主机;识别系统模块包括图像采集模块,预处理模块,边缘检测模块以及识别模块。
首先对裂缝图像进行了整体、灰度、噪声三个方面进行了分析,得到其几何、数学、灰度分布上的特点,针对这些特点选择合适的图像处理算法。由于彩色图像其信息容量比灰度图像大,因此处理难度大、速度慢,而且在识别裂缝的过程中,灰度图像所含的信息量已经足够,因此先将彩色图像转换成为灰度图像。然后根据图像的灰度直方图进行像素分析,根据分析的结果进行自适应阈值分割,通过计算或设定一个概率值,根据总像素值和灰度分布来确定分割的阈值,然后调用阈值分割程序来进行阈值分割。图像预处理还包括最重要的一个部分:图像滤波,分析了图像噪声来源,选择了合适的滤波器,对滤波效果进行了分析,并对不同形状的裂缝选择了不同的滤波模板。
其次对图像进行形态学处理。由于在一幅裂缝图像中,在图像预处理的过程中或多或少的会对原始图像中的裂缝区域带来影响,例如:将属于裂缝区域的点去除,可能导致连续的一条裂缝被分割为几条或裂缝的区域减小,因此要对预处理后的图像进行形态学处理,使裂缝区域得到恢复和加强。图1(b)是使用中值滤波进行平滑处理的效果。
3 图像边缘分割
图像分割是实现图像识别胶带是否撕裂的重要步骤,分割效果的好坏直接影响这系统的识别率,是特征提取、裂缝识别的前提准备步骤,在系统视线中占有不可忽视的地位,因此如何提高分割效果,减轻识别难度也就成了我们的首要任务,也是课题实现的难点之一。主要体现在以下两个方面:首先,目前不存在适合所有类型图像的通用分割算法,现有的分割算法都是针对具体应用而设计的,因此我们必须根据胶带撕裂裂缝图像的特征,即直方图没有明显双峰,裂缝与背景的比例像素悬殊等特点,来设计适合本系统的分割算法,其次,由于本文中尽心分割的裂缝图像是从实际环境中获取的,受到的干扰很大,煤矿胶带下的情况恶劣,造成我们获得的原始图像质量较差,为进行有效分割带来困难,因此选择一个分割算法,使其能够最大程度去除噪声、边界、伪缺陷等非裂缝区域,保留裂缝区域,减轻后续处理的复杂度,是本步骤的关键。
常用的算子可以分为一阶微分算子和二阶微分算子。一阶微分算子通过梯度值来进行边缘检测,用此方法可以忽略细节,得到的边缘也较粗,如图2所示为一阶算子Sobel算子对胶带裂缝轮廓的提取图;二阶微分算子是通过寻找二阶微分中的零穿越来检测边缘。用此方法得到的边缘较细,在细节方面较好,但物体的整体轮廓不如一阶微分算子明显。由于纵向裂缝识别是以裂缝轮廓作为基础,而对其它细节可以不予考虑,从上面提取的裂缝轮廓图像可以看出Sobel算子符合识别的要求,所以选择Sobel算子。
4 纵向裂缝的提取和识别
对于二值图像的连通域标记处理操作就是从白色像素(通常用“1”来表示)和黑色像素(通常用“0”表示)组成的一幅点阵图像中,将互相邻接(一般研究的是4邻域连接)的目标“1”值像素集合提取出来,并为图像中不同的连通域填入不等的数学标记。该处理过程是图像处理和分析中一个非常重要的基础操作,有着广泛的应用领域。
为了对图像的连通域进行标记,需要对一幅图像作从左到右,从上到下的水平扫描。需检测当前被扫描到的点是不是和周围的点连通,需要检查当前的像素和以前标记过的邻近像素的值是否一样。如果当前像素的值和邻近像素的值一样,就表示它们连通,反之,就表示和此邻近像素不连通,此时当前点就要给一个新的标记,同时标记保留在一个与原二值图像像素点个数相同的二维数组中。
令S代表一幅图像中的像素子集,如果在S中全部像素之间存在一个通路,则可以说两个像素p和q在S中是连通的。对于S中的任何像素p,S中连接到该像素的像素集叫做S的连通分量。如果S仅有一个连通分量,则集合S叫做连通集。在很多场合,二值图像提取连通分量是许多自动图像分析应用的核心任务。
现场图像经过二值化处理后,形成多个互不相连的区域,而单个区域都是连通的,将连通域分开标记,就可以得到多个独立的区域,连通域标记算法可以找到图像中所有的连通成分,并对同一连通成分的所有点分配同一标记。
具体算法如下:
(1)将所有的白色像素(背景)赋值为0,所有黑色像素(裂缝连通域所在)赋值为-1,连通域个数置为0;
(2)寻找一个连通域开始的像素(值为-1),并将其值改为当前连通域数,存储,连通域个数增加1;
(3)所有像素搜索。找到值为-1的像素(表示没有被搜索过),正向搜索其周围有没有值为当前连通域数的像素。如果有,将当前像素赋以连通域的值;
(4)如果没有像素被搜索,表示当前所有像素已被遍历,转步骤2;
(5)如果步骤2中没有找到开始像素,表示所有连通域已经被遍历。
5 结语
本文利用图像处理技术,针对胶带撕裂图像中的裂缝进行识别,分析了该图像的特点,通过图像预处理,图像切割,以及连通域检测三个步骤识别裂缝。取得了以下的成果。
(1)裂缝图像预处理。分析裂缝图像的像素分布,得到其分布上有相似灰度级出现概率不同的特点。并且分析了裂缝图像中的噪声来源。针对其特点选用中值滤波。这个模块主要完成了彩色图像的灰度化、灰度拉伸、中值滤波处理。
(2)裂缝的边缘检测。比较了几种边缘检测的方法,得到了效果最好的Sobel边缘检测方法,方便下一步的裂纹检出。
(3)裂缝检出。经过前期处理后,图像中的裂缝从背景中分离出来,每个裂纹形成一个像素互相连通的区域,利用连通域检测算法,从而将裂纹检测出来。
[参考文献]
[1] 黄民,李恩等.钢绳芯输送带纵向撕裂监测方法研究[J].中国矿业大学学报,2002.31.
[2] 刘英林.输送带纵向撕裂的检测与监视[J].山西矿业学报,1995(13).
[3] 吴剑锋,张红卫.胶带输送机胶带损坏原因及运行理论分析[J].中州煤炭,2005,2.
中图分类号:TP309 文献标识码:A 文章编号:1673-9795(2013)07(a)-0152-01
网络的飞速发展,为教育资源的大规模开放和共享提供了一个高效的舞台。目前,世界各国都在充分利用网络优势,加强网络教学资源的建设与共享,如麻省理工学院(MIT)于2001年4月首次启动开放课件运动(OCW),截至2007年,该网站上已经有1800门课程在线共享。此外,比较有影响力的还有英国开放大学的OCI(Open Content Initiative)项目、卡耐基・梅隆大学的OLI(Open Learning Initiative)项目、美国索菲亚学院的OCI(Open Content Initiative)项目等[1]。2003年4月,我国教育部了《关于启动高等学校教学质量与教学改革工程精品课程建设工作的通知》,明确提出精品课程是具有一流教师队伍、一流教学内容、一流教学方法、一流教学管理等特点的示范性课程。各省市教育行政主管部门也相继下发了通知,提出了建设精品课程的规划和措施,在全国高校掀起了精品课程建设的热潮。
1 需求分析
精品课程网站的设计与开发,充分发挥了计算机在呈现信息、提供联系、激发动机、学习评价方面的优势,弥补了教师、课本、视听媒体的不足;计算机作为学习者收集和组织信息、探究与批判性思考、合作与交流的工具,能很好的激发学习者的学习动机,促进有意义学习的发生;另外,精品课程的设计与开发,突破了时空限制,具有传播范围广的特点,任何人、任何时间、任何地点都可以按各自的兴趣选择任何课程进行学习。总之,精品课程网站的设计很好的适应了当今世界国际化、信息化、知识化等特征的要求,学习者能更好的实现自主学习。
《遥感数字图像处理》是一门专业基础课,是以理论联系实践为主,注重运用,重视上机实践的一门课程。对于这样一门操作性较强的课程,设计与开发它的精品课程网站是非常有必要的。
《遥感数字图像处理》精品课程网站的设计与开发依托了校级《遥感数字图像处理》精品课程的建设,主要面向遥感数字图像处理专业的本科生,旨在辅助学习者完成对本门课程的自主学习,实现学习效果的最优化,其目的是为了让学习者通过学习,打牢遥感数字图像处理的基础知识,进而可以运用到实践中。通过本课程的学习,使学生树立正确的遥感数字图像处理的概念,培养学生良好的计算机实践习惯,实事求是的科学态度和严谨细致的工作作风,为后继课程的学习和将来参加社会生产实践打下基础。
2 理论基础
认知主义学习理论认为,学习过程是每个学习者根据自己的态度、需要、兴趣、爱好并利用过去的知识与经验对当前学习者的外界刺激做出的主动地、有选择地信息加工过程。
建构主义学习理论认为,“学习”被理解为意义的获得,意义是学习者通过新旧知识经验间的反复的、双向的相互作用过程而构建成的;学习的过程并不是简单的信息输入、存储和提取,而是由于新旧经验的冲突引发观念的转变与结构重组。
每一种学习理论都有自己的优势和缺陷,比如,给学习者更多的自主活动,能增强学习动机,但会降低学习效率;让学习者之间有更多的协作能帮助意义建构,但如果个体不能充分参与,可能会减少对个体差异的适应。
学习理论应用的一个基本原则是以不同的理论解释不同的学习现象,将不同的理论应用于不同的学习情境。《遥感数字图像处理》精品课程的设计与开发,参照国家精品课程评审指标,根据指导老师的要求以及课程的特点,综合运用了认知主义、建构主义学习理论的优点,以更好的促进学习者有意义学习的发生。
3 设计思路
在《遥感数字图像处理》精品课程网站设计与开发的过程中,主要从人机界面设计、认知活动设计出发。
(1)界面元素的清晰性和操作的流畅性:人机界面又称为用户界面,是学习者与软件的教学内容和教学流程相互作用的中介,因此,界面设计必须符合学习者操作的肢体和感官运动规律,以及感知心理规律,使界面操作简捷、自然、舒适。
(3)引导自主学习:提供电子教案下载、习题选编、模拟试题、学习帮助等栏目,并且设置在线答疑系统,提供了充分的人机交互,促进知识的记忆与迁移。
(4)科学性、教育性:精品课程作为一个多媒体教学软件,必须满足教育性、技术性、艺术性、科学性以及经济性等原则。所以,在进行具体的设计、开发之前,先是参照国家精品课程评审指标并根据指导老师的要求以及《遥感数字图像处理》这门课程的特点,确定网站的内容模块、栏目设置以及界面整体风格。
4 ACCESS技术简介
Microsoft Office Access(前名 Microsoft Access)是由微软的关联式数据库管理系统。它结合了Microsoft Jet Database Engine和图形用户界面两项特点,是 Microsoft Office的成员之一。Access能够存取Access/Jet、Microsoft SQL Server、Oracle,或者任何ODBC兼容数据库内的资料。
Access 数据库由七种对象组成,它们是表、查询、窗体、报表、宏、页和模块。
表(Table)――表是数据库的基本对象,是创建其他5种对象的基础。表由记录组成,记录由字段组成,表用来存贮数据库的数据,故又称数据表。
查询(Query)――查询可以按索引快速查找到需要的记录,按要求筛选记录并能连接若干个表的字段组成新表。
窗体(Form)――窗体提供了一种方便的浏览、输入及更改数据的窗口。还可以创建子窗体显示相关联的表的内容。窗体也称表单。
报表(Report)――报表的功能是将数据库中的数据分类汇总,然后打印出来,以便分析。
宏(Macro)――宏相当于DOS中的批处理,用来自动执行一系列操作。Access列出了一些常用的操作供用户选择,使用起来十分方便。
模块(Module)――模块的功能与宏类似,但它定义的操作比宏更精细和复杂,用户可以根据自己的需要编写程序。模块使用Visual Basic编程。
页(Page)――是一种特殊的直接连接到数据库中数据的一种WEB页。通过数据访问页将数据到Internet或Intranet上,并可以适用浏览器进行数据的维护和操作。
参考文献
[1] 吴美娇,项国雄.国家精品课程网络教学资源现状分析与优化[J].现代远程教育研究,2009(2):39-44.
摘要:为了预防矿井下电机车撞人事故的发生,提出了一种基于数字图像处理技术的轨道行人识别算法,首先对图像进行尺度变换,裁剪,中值滤波,维纳滤波,垂直边缘检测,二值化,密度模板匹配,阈值分割,连通域筛选和轨道拟合,识别出轨道,然后用行人和非行人样本对支持向量机的参数进行训练,最后运用支持向量机对轨道上的行人进行识别。运用该算法,对现场采集到的图片进行Matlab仿真实验,实验结果表明该算法能很好的识别出轨道上的行人,做到提前报警。
关键词 :电机车;数字图像处理;轨道检测;行人识别;报警
中图分类号:TD7文献标志码:A文章编号:1000-8772(2014)19-0202-01
1 引言
矿用电机车多年来一直作为矿井下的主要运输设备,由于矿井下情况复杂,机车运行频繁,可能会发生电机车撞人事故,因此急需要一种监测报警系统,对行人进行识别报警。
目前运用在车辆上的检测障碍物方法主要有:超声波检测、毫米波雷达检测、红外线检测、激光检测和摄像头检测等,在运动的电机车上,摄像头检测更具优势,摄像头检测即图像识别[1,2]。行人检测被广泛用于行人流量统计、智能车辆辅助驾驶、智能交通、防盗报警,行人报警等方面,具有广大的应用前景[3]。行人检测即从图像或视频中识别出行人,主要有两步:特征提取和分类定位,行人的特征包括HOG特征,纹理特征,SIFT特征等;行人检测的方法有:基于运动的方法、基于形状的方法、基于模板匹配的方法和基于统计分类的方法等[3,4]。
将现有的行人识别算法用于矿井下轨道上的行人识别,具有丰富的理论依据和广大的应用前景,可降低矿下机车撞人事故的发生。本文行人检测的思想是:先识别轨道,再识别轨道上的行人。
2 MATLAB仿真
设原图像的尺寸为:M×N M,N都为偶数,则下采样后图像的尺寸为:M/2×N/2。在下采样后图像中裁剪的区域为x坐标:x1x2,y坐标:y1y2。中值滤波的尺寸为3×3,维纳滤波的尺寸为5×5,垂直边缘检测算子为:。 密度匹配模板尺寸为3×3。垂直边缘检测出的图像和密度图像的二值化阈值都采用Otsu方法求得。检测窗口的大小为,块的大小为64×128,块的重叠率为,一个块内的单元数为4,单元的大小为8×8,在[-π/2,π/2]将梯度方向均匀的划分成9个区间[5-9]。图1中白色矩形区域为经支持向量机识别出的行人。
3、结论
一种基于数字图像处理技术的轨道行人识别算法能识别出轨道和行人,做到提前报警,本文仅从算法上实现,还需结合硬件,才能将该算法用到实处,在现实环境中,该算法的性能也有待检验。该行人识别算法可进一步推广,用到现实中各种场合的行人识别。
参考文献:
[1] 王荣本,赵一兵,李琳辉等.智能车辆的障碍物检测研究方法综述[J].公路交通科技,2007,11:109-113+124.
[2] 贾慧星,章毓晋.车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J].自动化学报,2007,01:84-90.
[3] 王兴宝.复杂场景下多姿态行人检测与识别方法研究[D].苏州大学,2012.
[4] 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东.行人检测技术综述[J].电子学报,2012,04:814-820.
[5] 范昕炜.支持向量机算法的研究及其应用[D].浙江大学,2003.
[6] 方莉,张萍.经典图像去噪算法研究综述[J].工业控制计算机,2010,11:73-74
[7] 陈刚.基于多特征的行人检测方法研究[D].吉林大学,2012.
中图分类号:G6 文献标识码:A 文章编号:1674-098X(2013)03(b)-0-01
1 研究背景
2003年4月,中国教育部了《关于启动高等学校教学质量与教学改革工程精品课程建设工作的通知》,提出精品课程是具有一流教师队伍、一流教学内容、一流教学方法、一流教学管理等特质的示范性课程。经过几年的推行实施,国家精品课程在数量上已具有一定规模,质量上也在逐年提高,但是在课程资源等方面仍然存在不足之处:(1)课程资源库建设。在《国家精品课程评价指标体系》中,课程资源主要是通过教学内容和教学条件两大项来评价,他们是课程的核心部分,是教学信息设计、组织与呈现等教学设计思想的具体化表现。经过这几年的努力,课程资源建设模块逐渐约定俗成,绝大多数课程均有课程介绍、教学大纲、教学安排、授课录像和试卷习题等,而实验/实践稍差,学习/教学指导、电子教材和素材库等最为薄弱;(2)课程资源类型。精品课程充分发挥现代教育技术强大功能,采用各种多媒体技术来呈现教学信息,如音/视频、PowerPoint、Word、Flash等,课程资源类型可以分为演示型、过程型、交互型、管理型和评价型5种,但是现在绝大多数课程都不重视过程型和交互型资源的建设,更是忽略知识管理型和评价型资源的建设[1]。
2 需求分析
精品课程网站的设计与开发,充分发挥计算机在呈现信息、提供联系、激发动机、学习评价方面等方面优势,弥补了教师、课本、视听媒体的不足;计算机作为使用者收集和组织信息、探究与批判性思考、合作与交流的工具,能很好的激发学习者的学习动机,促进有意义学习的发生;另外,精品课程的设计与开发,突破了时空限制,具有传播范围广的特点,任何人、任何时间、任何地点都可以按各自的兴趣选择任何课程进行学习。总之,精品课程网站的设计很好的适应了当今世界国际化、信息化、知识化等特征的要求,学习者能更好的实现自主学习。《遥感数字图像处理》是一门专业基础课,是以理论联系实践为主,注重运用,重视上机实践的一门课程。对于这样一门操作性较强的课程,设计与开发它的精品课程网站是非常有必要的。《遥感数字图像处理》精品课程网站的设计与开发依托了校级《遥感数字图像处理》精品课程的建设,面向遥感数字图像处理专业的学生,旨在辅助学生完成对本门课程的自主学习,实现学习效果的最优化,其目的是为了让学生通过学习,打牢遥感数字图像处理的基础知识,进而可以运用到实践中。通过该课程的学习,使学生树立正确的遥感数字图像处理的概念,培养学生良好的计算机实践习惯,实事求是的科学态度和严谨细致的工作作风,为后继课程的学习和将来参加社会生产实践打下基础。
3 主要技术简介
3.1 ASP技术简介
ASP是Microsoft Active Server Pages的简称,是服务器端脚本编写的环境,可以创建和运行动态、交互的Web服务器应用程序,即可以组合HTML页、脚本命令和Web页和基于Web的功能强大的应用程序。ASP不是一种语言,它所使用的语言是Javascript或VBScript,或者是这两种语言的结合体。总的来说,ASP具有以下的特点:(1)使用简单易懂的脚本语言(Javascript或VBScript等),结合HTML就可以快速开发出各种各样的应用程序;(2)不需要编译,容易编写,而且代码在服务器端直接执行;(3)ASP源程序在服务器端被执行后,将执行结果返回给客户端,从而提高了源程序的安全性;(4)可使用服务器端脚本来产生客户端脚本;(5)由于ASP程序在服务器端执行,因此只要客户端使用的浏览器可以执行HTML代码即可。这样便最高限度地保证了ASP程序的通用性;(6)可以使用VB等多种编程语言来开发ActiveX服务器组件来扩充服务器端程序的功能;(7)使用普通的文本编辑器即可对ASP程序进行设计、修改;(8)ASP提供了几种内置对象使得脚本功能更强大,在其他方面,这些对象完成从浏览器中检索或向浏览器发送信息的功能。总之,ASP是目前网页制作技术中最容易学习、灵活性也最大的工具之一。更重要的是它拥有非常好的可扩充性。像标准的HTML文件一样,ASP包含可以被Web浏览器显示并解释的HTML标签。通常放入HTML文件的Java小程序、闪烁文本、用户端脚本、用户端ActiveX控件都可以放入Active Server Pages中[4]。
3.2 ACCESS技术简介
Microsoft Office Access(前名 Microsoft Access)是由微软的关联式数据库管理系统,是 Microsoft Office的主要成员之一。Access能够存取 Access/Jet、Microsoft SQL Server、或者任何ODBC兼容数据库内的资料。Access 数据库由七种对象组成,它们是表、查询、窗体、报表、宏、页和模块。
表(Table)―是数据库的基本对象之一,是创建其他对象的基础。表由记录组成,记录由字段组成,表用来存贮数据库的数据,因此又称数据表。
查询(Query)―查询可以按索引查找到需要的记录,按要求筛选记录并能连接若干个表的字段从而组成新表。
窗体(Form)―窗体提供了一种方便的浏览、输入及更改数据的窗口。还可以创建子窗体显示相关联的表的内容。窗体也称表单。
报表(Report)―报表的功能是将数据库中的数据汇总,然后打印,以便
分析。
宏(Macro)―宏相当于DOS中的批处理,用来自动执行一系列操作流程。Access列出了一些常用的操作以方便用户选择,使用起来十分便捷。
模块(Module)―模块的功能和宏相似,但其操作比宏更加精细和复杂,用户可根据自己的需求编写程序。
页―是特殊的直接连接到数据库中数据的一种WEB页。通过数据访问页可将数据到Internet 或Intranet上,而且可以适用浏览器进行数据的维护和操作。
参考文献
[1] 许坦,石.精品课程发展现状综述[J].中国电化教育,2007(5):244.
【关键词】云计算 云架构 图像处理 交通流
1 引言
随着我国交通运输行业的快速发展,给人们生活带来了巨大便捷的同时,由于汽车数量的增多,造成了交通的日益恶化,交通堵塞现象十分严重。为了有效缓解这种局面,在现有交通资源下,挖掘已布设在各道路环境中的监控摄像机资源,主动利用其提供的视频图像数据来感知道路交通流参数,实现交通检测的目的。
交通流监测系统是依据交通流流体理论的空间和时间离散化数学模型,将交通线路上的摄像头获取的车流图像建立相对应的二维模型。同时随着城市规模的发展,传统的交通流参数计算方式已经无法满足大量视频数据的处理。对于这一问题,我们提出将云计算的技术运用到交通流监测中,作为一种新的计算模式和共享云计算的架构方法,云计算在高性能计算和海量数据存储方面具有明显优势,云计算平台能将资源虚拟化,同时进行有效且动态的资源划分和分配。
2 基于视频的交通流参数检测
2.1 交通流参数的提取
图2为现有交通流分布图,车辆检测是视频交通监控系统的关键和基础,其中交通流目标提取算法分为背景建模、帧差和目标跟踪等计算。背景建模方法避免了帧差法前景区域提取不完整的问题,采用高斯混合模型相较于其他算法(Kalman滤波算法、平均法、选择更新法)能利用高斯模型更好地给出像素点分布,多模型防止前景点对背景点的建模干扰,消除背景规律性晃动。
运用数字图像处理的技术,对图像进行数字化、编码、图像增强、恢复、重建、分析,获取道路的坐标映射以及车流量信息。
2.2 基于Kalman滤波理论的自适应背景预测与更新建模法
基于视频的车辆交通流检测,目前提出的车流量检测算法都存在一定的缺陷,不能解决影响检测精度和实时性等所有间题。因此我们提出了一种改进的具有一定自适应功能的基于Kalman滤波的背景预测与更新法,可实现建模函数的自适应修正和不同阶段的背景匹配更新。
实验表明:随着时间的推移,以上背景建模法将与场景匹配的权值逐渐增大,而不匹配的高斯函数的权值将日益缩小。
3 实验结果分析
系统在PC机上运行,在VS2010平台下,输入自拍的复杂城区道路上的视频流,利用以上自己研究的算法,自己设计开发了相应的软件,通过实验验证,效果较好。
当系统正常工作时,终端能够从服务器获取周边节点的路况信息,同时利用云计算的快速图像处理。按照等级将对应的路段按照不同的路段加以区分,在GIS系统中将不同的路段按照对应的交通等级进行颜色区分显示,当鼠标指向具体的路段时,也能够显示具体的数值,是个节点的交通信息能够非常直观的进行显示。
通过视频图像采集、视频图像预处理、背景建模等过程。在单位时间内,根据车辆计数就可以求出车流量。
经测量得到,车模的速度在1m/s左右,按照1:24的比例换算成实际速度在80km/h左右,宽度测量误差为4.25%,长度测量误差为2.28%,车型匹配准确率为100%。
4 结论
本文从交通流现状出发,介绍了云计算基础知识,并建立了私有云计算平台。然后针对道路环境实际应用需求,在现有的解决方法下,提出一种改进的具有一定自适应功能的Kalman滤波建模法;同时,解决了车辆的长度、宽度、车辆速度等参数测量,通过构建的私有云平台,能够快速精确的计算道路占有率、及交通运输能力分析,为交管部门提供了可靠的基础参数信息。
参考文献
[1]黄振宇.基于云计算的网络视频监控系统研究与实现[D].上海:上海交通大学,2011.
[2]杨文志.云计算技术指南:应用、平台与架构[M].北京:化学工业出版社,2010.
[3]王鹏.云计算的关键技术与应用实例[M].北京:人民邮电出版社,2010.
[4]张良将.Hadoop云平台下的并行化图像处理实现[D].上海:上海交通大学,2012.
[5]李新法.基于视频图像处理的交通流检测方法[J].城市建设理论研究,2013.
[7] 李刚.基于背景差法和帧间差法的运动目标检测方法[J].仪器仪表学报,2006(27) 962-964.
[8]高建平.基于图像处理的交通信息采集[D].上海:同济大学,2006.
中图分类号:TM76 文章编号:1009-2374(2016)21-0047-03 DOI:10.13535/ki.11-4406/n.2016.21.023
1 概述
随着信息技术的发展,人类逐渐步入信息化时代。在此过程中所引起的信息革命给许多传统行业带来了巨大的冲击,信息化时代的四大特点――智能化、电子化、全球化、非群体化成为了许多行业变革的风向标。而信息化时代的代表性象征――计算机在各行各业中的必要性与日俱增,在电力行业中也不可避免。
而电力行业作为关乎国计民生的传统行业,在信息化时代中也面临着如何更高效地利用能源、如何更安全可靠地供电、如何更好地了解用户需求等诸多方面的新挑战,于是“智能电网”的概念应运而生。
2 智能电网
2.1 智能电网的概念
智能电网是将信息技术,如通信技术、传感技术、计算机技术和控制技术等融入电力系统之中,使整个电力系统更加安全可控,成为高效智能的新型电网。由于各国的国情不同,因此各个国家对智能电网的具体要求也会有不同的侧重点。因为我国还是一个发展中国家,与国外发达国家的电力工业已步入成熟期不同,我国在发展智能电网的同时,还需要加强骨干电网建设。因此除了要建设能够充分满足用户对电力的需求和优化资源配置,确保电力供应的安全性、可靠性和经济性,满足环保约束,保证电能质量,适应电力市场化发展的坚强智能电网外,我国的智能电网建设还需要满足以特高压电网为骨干网架,各级电网高度协调发展。
2.2 智能电网的特点
智能电网一般包括有以下七个特点:
2.2.1 能量互联网:智能电网要求实现供电方和用户之间的交互,构建多向电力流,它主要由能量管理系统和配电管理系统组成。其中能量管理系统提供整个电网的实时状态信息,并根据实时信息选择最优发电方案,减少输电损耗,维护系统可靠性以确保供电稳定;配电管理系统提供配电网络的实时状态信息,允许供电方远程控制断电的隔离与恢复,管理可再生能源发电。
2.2.2 降低损耗:智能电网能够基于“能量互联网”中的实时信息,根据用户的需求来供电,通过电压控制来降低电力损耗。同时还可以沿输电线放置传感器和电容器,通过无功负载控制来减少电力损耗。减少电力损耗的同时还会降低二氧化碳的排放量,使电网系统更加低碳环保。
2.2.3 融入可再生能源发电:目前可再生能源发电的最大缺点在于可变性过大,产电不稳定。智能电网能够通过储电技术,在产电过剩时将多余电能存储起来,在供不应求时再通过智能电网的自动化技术供能,进而解决可再生能源产电不稳定的问题。
2.2.4 减少输电阻塞:智能电网能够检测输电线的实时度数,在可能发生输电阻塞时,传感器和控制器会及时地重新安排电力输送线路,使得电力能够最大限度地流过线路而不发生阻塞。
2.2.5 分布式发电:通过智能电网的双向电力流,用户自行通过太阳能、风能等可再生能源产生的电力可以出售给供电方,流入配电网络中,使电网系统在用电高峰期可以为用户提供更稳定的供电服务。
2.2.6 自愈:智能电网能够基于实时测量的概率风险评估确定最有可能失败的设备、发电厂和线路,及时进行隔离和恢复,从而减少大面积用电故障的出现。同时,智能电网还能实时分析电网的整体健康水平,及时触发可能导致电网故障发展的早期预警,并根据具体情况确定是否立即进行检查或采取相应措施。
2.2.7 用户需求管理:智能电网能够通过智能电表实时通知用户其电力消费成本、实时电价、电网的状况、计划停电信息等信息,使用户可以根据这些信息制定自己的电力使用方案,继而通过影响用户需求来促进电力供求平衡。
2.3 智能电网的相关技术
智能电网的关键基础技术主要包括集成的通信技术、先进的传感和测量技术、先进的电网设备技术、先进的控制技术以及决策支持和可视化技术。
3 计算机科学在智能电网中的应用
在电网智能化的过程中,计算机是必不可少的。而计算机科学在智能电网中也有诸多应用,其中云计算、数字图像处理、数据挖掘、人工智能和软件工程这些计算机科学相关技术在智能电网中尤为重要。
3.1 云计算
云计算是分布式计算的一种特殊形式,根据美国国家标准与技术研究院的定义,云计算可以实现随时随地、便捷、按需地从可配置计算资源共享池中获取所需的资源,资源可以快速供给和释放,使管理的工作和服务提供者的介入降低至最少。
云计算技术能够整合优化电网系统中的各种异构资源,如电力系统中的监控维护资源、配电管理资源和市场运营资源等。利用云计算支持广泛企业计算和普适性强的特点,能够构建更加高效的智能电网数据中心,实现基础设施资源的自动化管理。例如利用Google的Borg能够使大量服务器协调工作,继而实现大规模系统的可靠性管理。
而智能电网信息系统所产生的大量数据,更需要通过云计算来实现分布式存储和管理。利用云计算来实现海量数据的分布式存储,可以通过冗余存储和高可靠性软件来提高数据的可靠性,并能较好地达到成本、可靠性和性能的最佳平衡。例如利用Google的GFS文件系统可以实现数据的冗余存储,并大幅度降低主服务器的负担,使系统IO高度并行工作,从而提高系统的整体性能。智能电网所产生的数据种类众多,而云计算的数据管理技术能够较好地满足智能电网信息平台数据种类繁多的海量服务请求,因此云计算能够高效地管理智能电网信息平台中的多元数据。例如,利用Google的BigTable,通过一个巨大的分布式多维数据表,将数据都作为对象,并通过关键字、列关键字和时间戳来进行索引,满足各类数据的性能要求,进而实现多元数据的高效管理。
为了保证电网系统运行的安全稳定,智能电网需要通过大规模的电力系统计算来监控整个电网系统的运行状态,如暂态稳定计算、故障计算、拓扑分析、数据挖掘与智能决策等,计算量极大,而云计算可以为智能电网提供高性能的并行计算与分析服务。例如利用Google的MapRduce,可实现针对大规模数据集的并行计算。
3.2 数字图像处理
数字图像处理是指通过计算机对图像进行去噪、增强、复原、分割以及提取特征等处理,从而改善图示信息,以便人们解释或机器自动理解。
在智能电网系统所产生的海量数据中有不少的数据都是图像数据,例如对输电线路状态的远程监测常常通过线路图像/视频监控系统来实现。为了能够实现对输电线路状态全天候全方位的实时监控,采用智能化和自动化的手段来代替人工是必然的趋势。但原始图像中包含的噪声太多了,价值密度低,难以用于智能识别。在这种情况下,可以通过数字图像处理中的灰度变换、直方图修正、小波包去噪、图像锐化以及边缘检测等处理方式来增强图像对比度,去除噪声,加强图像的轮廓特征,以便于特征的提取和识别,进而产生价值密度较高的特征数据集,为输电线路状态的智能识别过程做好图像数据的预处理。
3.3 数据挖掘
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘的方法包括分类、聚类、关联分析、预测等。
由于智能电网系统中的数据具有数据量巨大、数据类型繁多、价值密度低以及处理速度快的特点,智能电网系统中的数据属于无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的“大数据”,需要通过数据挖掘来提取其中隐含的有价值的信息,从而实现对整个电网系统多角度、多层次的精确感知。例如,通过对长期的、大量的用户用电数据进行数据挖掘,对不同地区以及不同用户进行分类,可以得到有助于优化配电调度的信息,并能为电费定价调整提供参考;由于在当今社会中各行业的发展都离不开能源的使用,因此对用电数据进行挖掘甚至还可以归纳总结出各种指标增长率与社会用电情况的一般规律,便于政府了解和预测社会各行业发展状况及用能情况,为政府决策提供参考。而通过对长期的、大量的电动汽车充电数据进行数据挖掘,可以为充电站的布点提供参考。通过对长期的、大量的可再生能源发电情况进行数据挖掘,有利于降低可再生能源产电不稳定对供电网络的影响,进而更好地融入可再生能源发电。此外,数据挖掘还有利于用户能效的分析管理、业务拓展分析、供电舆情监测预警分析、电力系统的故障预测和状态检修、短期电网负荷预测、城市电网规划等。智能电网系统的数据特性表明了数据挖掘在智能电网中有着广泛的应用。
3.4 人工智能
根据著名人工智能科学家Michael R.Genesereth和Nils J.Nilsson在1987年提出的定义,人工智能是研究智能行为的科学,它的最终目的是建立关于自然智能实体行为的理论和指导创造具有智能行为的人工制品。人工智能是一门研究如何将人的智能转化为机器智能或者用机器来模拟或实现人的智能的学科。
数据挖掘在智能电网中有着广泛的应用,而数据挖掘需要人工智能技术来提供数据分析的技术支持,因此人工智能在智能电网中也有着十分重要的应用。例如,通过构建人工神经网络来对经过数字图像处理所得的典型线路状态的监控图像特征数据集进行训练识别来实现输电线路状态的智能识别。除了故障诊断外,人工神经网络还可应用于智能控制、继电保护、优化运算等
方面。
除了为数据挖掘提供数据分析的技术支持外,人工智能还可以通过人类专家提供的经验和知识来构建相应的专家系统,如电网故障诊断和调度处理专家系统和操作票专家系统等,模拟人类专家解决问题的过程来进行决策,从而实现电网自动化和智能化。
而采用遗传算法、粒子群算法等进化算法求解诸如发电厂和输电线架设的规划问题以及电力系统中各种控制参数的最优解等问题或利用模糊集理论来处理电力系统中难以实现精确控制的复杂问题,也是人工智能在智能电网中的重要应用。
3.5 软件工程
根据Fritz Bauer在NATO会议上给出的定义,软件工程是建立和使用一套合理的工程原则,以便获得经济的软件,这种软件是可靠的,可以在实际机器上高效的
运行。
为了便于管理和使用,无论是供电管理方还是用户方都会希望通过一个稳定可靠,功能完备,并具有友好人机界面的软件来方便操作。因此在建设智能电网的过程中势必需要开发相应的软件,软件工程便应用于其中。尤其是对用户端而言,在移动设备使用越来越广泛的今天,开发相应的移动端的APP无疑能够更好地促进用户参与到交互过程中。一个针对用户个体,能够实时显示如电力消费成本、实时电价、电网状况、计划停电信息等的智能电表提示信息,结合数字家庭技术,能够远程控制家电开关以便于用户随时随地调整自己的用电情况,并整合线上业务申请、缴纳电费等功能的APP能够极大程度地减轻用户的操作负担,方便用户的使用,使智能电网更加高效智能。
4 结语
计算机科学在智能电网中的广泛应用使电力行业在信息化时代中能够更好地应对各种新挑战,为整个社会的发展带来深远的影响。
参考文献
[1] 肖世杰.构建中国智能电网技术思考[J].电力系统自动化,2009,33(9).
[2] 李乃湖,倪以信,孙舒捷,等.智能电网及其关键技术综述[J].南方电网技术,2010,4(3).
[3] 杨德昌,李勇,C.Rehtanz,等.中国式智能电网的构成和发展规划研究[J].电网技术,2009,33(20).
[4] 王德文,宋亚奇,朱永利.基于云计算的智能电网信息平台[J].电力系统自动化,2010,34(22).
[5] 彭小圣,邓迪元,程时杰,等.面向智能电网应用的电力大数据关键技术[J].中国电机工程学报,2015,35(3).
[6] 宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4).
[7] 张东霞,苗新,刘丽萍,等.智能电网大数据技术发展研究[J].中国电机工程学报,2015,35(1).
[8] 金华,王民,昝涛,等.基于数字图像处理的输电线路状态智能识别技术[J].微计算机信息,2012,28(4).
[9] 韩祯祥,文福拴,张琦.人工智能在电力系统中的应用[J].电力系统自动化,2000,24(2).
视觉在人类生活中起着非常重要的作用,人们每天都通过眼睛采集大量的信息,这些信息经过大脑的处理,成为人们认知和理解世界的基础。机器人视觉信息主要指CCD摄像机采集的二维图像信息。视觉信息能否被正确、实时地处理直接关系到机器人对障碍物的避碰、对路标的识别以及对路径的跟踪,对系统的实时性和鲁棒性具有决定性的作用。视觉信息的处理技术是移动机器人研究中关键的技术之一。为了简化视觉信息处理,通常把移动机器人的工作环境分为结构化道路环境和非结构化道路环境。结构化道路的检测相对来说较易实现,其检测技术一般都以边缘检测为基础,辅以Hough变换、模式匹配等,并利用最小二乘法对应于道路边界的线条,得出道路的几何描述。由于非结构化道路的环境复杂、特征描述困难,使得非结构化道路的检测及信息处理复杂化。
近年来,机器人视觉导航技术有了很大的发展。移动机器人的工作环境可能比较复杂,因此,提高图像识别的准确性以实现移动机器人的准确定位是移动机器人完成其导航任务的首要前提;同时,由于移动机器人在导航过程中需要实时的采集并分析图像信息,从而实现对作业环境的识别以进行准确的路径跟踪。因此,如何在提高图像识别的准确性的同时达到较好的实时性是移动机器人视觉技术的一个发展方向
1.图像处理
数字图像处理,是对数字图像信息进行加工以满足人的视觉心理或应用需求的行为,数字图像处理的英文名称是"Digital Image Processing'',通常所说的数字图像处理是指用计算机对图像进行的处理,因此也称为计算机图像处理。图像处理就是用一系列的特定操作来改变图像的像素,以达到特定的目标,比如使图像更清晰,或者从图像中提取某些特定的信息等。
CCD摄像头的主要工作原理具体而言,就是摄像头连续地扫描图像上的一行,输出就是一段连续的电压视频信号,该电压信号的高低起伏正反映了该行图像的灰度变化情况。当扫描完一行,视频信号端就输出低于最低视频信号电压的电平(如0.3v),并保持一段时间。这样相当于,紧接着每行图像对应的电压信号之后会有一个电压"凹槽",此"凹槽"叫做行同步脉冲,它是扫描换行的标志。然后就需要跳行,跳过一行后(因为摄像头是隔行扫描的方式),开始扫描新的一行,如此下去,直到扫描完该行的视频信号,接着就会出现一段场消隐区。此区中有若干个复合消隐脉冲,其中会有个脉冲远宽于(即持续时间长于)其它的消隐脉冲,该消隐脉冲又称为场同步脉冲,它是扫描换行的标志。场同步脉冲标志着新的一场的到来,不过,场消隐区恰好跨在上一场的结尾部分和下一场的开始部分,要等到场消隐区过去,下一场的视频信号才真正到来。摄像头每秒扫描25幅图像,每幅又分奇、偶两场,先奇场后偶场,故每秒扫描50场图像。奇场时只扫描图像中的奇数行,偶场时则只扫描偶数行。
选择一款具有全电视信号输出的黑白CCD图像传感器,用LMl881进行信号分离,结合A/D采样,实现了视频信号的采集。在总线周期为400M的情况下,每行采集72个有效数据,摄像头每场信号有320行,其中第23到310行为视频信号。我们从中均匀采集了24行,最后得到一个24×72的二维数组。
CCD采集的原始数据包含了黑线的位置信息,为了稳定可靠地提取这一信息,有一下几种方法:
(1)二值化算法
算法的思路是:设定一个阈值value,对于视频信号矩阵中每一行,从左至右比较各像素值和阈值的大小。若像素值大于等于阈值,则判定该像素对应的是白色道路;反之,则判定对应的是目标指引线。记下第一次和最后一次出现像素值小于阈值时的像素点的列号,算出两者的平均值,以此作为该行上目标指引线的位置。该算法的思想简单,具体实现时还可以一旦检测到左边缘后就退出该行扫描,这样上面的流程图将变得更加简洁。但是这种提取算法鲁棒性较差,当拍摄图像中只有目标指引线一条黑线时,还能准确提取出目标指引线。但当光强有大幅度的变化,或图像中出现其它黑色图像的干扰时,并且离机器人比较近的黑线比较的明显,离机器人越来越远时黑线越来越淡,该算法提取的位置有可能与目标指引线的实际位置偏离较大。
(2)直接边缘检测算法
算法的思路是:设定一个阈值,对于视频信号矩阵中每一行,从左至右求出相邻两像素值的差值(左减右)。若差值大于等于阈值,则判定下一个的像素点对应的是目标指引线的左边缘,以此像点作为该列的特征点,记录下此像素点的列号,作为该行上目标指引线的位置。当然,可能出现差值始终小于阈值的情况,此时一种方法是令该行上目标指引线位置为0,通过进一步滤波或拟合来修正;另一种方法是让该行上目标指引线位置和通过上一场视频数据求得的位置一样。
该算法较二值化方法而言,抗环境光强变化干扰的能力更强.同时还能削弱或消除垂直交叉黑色指引线的干扰。因为该算法在视频信号矩阵中是由左至右来寻找目标指引线的左边缘的,所以当黑色图像出现在目标指引线左方时,该算法无法排除干扰,而当其出现在右方时,则可以排除干扰。
(3)跟踪边缘检测法
这种算法跟直接边缘榆测算法一样,也是寻找出目标指引线的左边缘,仍然用左边缘的位置代表目标指引线的位置。但跟踪边缘检测从视频信号矩阵每行中寻找左边缘的方法与直接边缘检测法不同。
因为目标指引线是连续曲线,所以相邻两行的左边缘点比较靠近。跟踪边缘检测正是利用了这一特性,对直接边缘检测进行了简化。其思路是:若已寻找到某行的左边缘,则下一次就在上一个左边缘附近进行搜寻。这种方法的特点是始终跟踪每行左边缘的附近,去寻找下一列的左边缘,所以称为"跟踪"边缘检测算法。
在首行边缘检测正确的前提下,该算法具有较强的抗干扰性,能更有效地消除垂直交叉黑色指引线的干扰,以及指引线外黑色图像的影响,始终跟踪目标指引线。
另外,较之前两种算法,跟踪边缘检测算法的时间复杂度更低,因此效率更高。但值得注意的是第一行的左边缘位置对整个目标指引线的搜寻影响 很大,一旦它的位置和实际导引线偏差较大,就会产生一连串的错误,这是不可容忍的。
通过比较本系统选择了效率更高,更可靠的跟踪边缘检测法。流程图如图所示:
2.结论
本文中图像处理和路径信息识别的方法,并对不同时刻不同位置采集到的图像的处理效果进行比较研究,结合实际环境中的图像特点,确定出适合于本研究的图像处理算法。提出了改善路径信息辨识速度和精度的方法。
参考文献:
[1]张文志,吕恬生.基于改进的遗传算法和模糊逻辑控制的移动机器人导航[J].机器人.2003,
25(1):1
[2]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报.2000,26(1):44-45
河北省张家口市 075000
2河北北方学院附属第二医院
河北省张家口市 075000
【摘 要】医学图像在现代医疗诊断中发挥着重要作用,医学图像分割是其处理的关键环节。医学图像具有信息量大、异构性、噪声显著性等特点,大多数方法对高容量的医学图像处理速度较慢,或未能充分考虑图像的细节及奇异点的变化,不能很好地表达医学图像的内容。为了有效解决上述问题,我们从医学图像的特点出发,灵活构造了一种跟随边缘变化的自适应提升方案,能够有效地保护医学图像的边缘细节,为医生临床诊断提供更可靠的依据。
关键词 自适应;提升小波;图像分割;边缘检测
1 引言
医学图像处理是一个多学科交叉的研究领域,涉及计算机图形学、数字图像处理、生物医药工程等学科的相关知识。医学图像分割技术是医学图像处理与分析中的关键技术,图像分割的目的是将原始图像分成不同性质( 如灰度、纹理等) 区域,并提取和显示出来,使其尽可能地接近解剖结构。近年来,已经研究出许多有效的技术,如阈值法、区域法、边缘检测法、小波变换法等[1]。
阈值法是一种简单而有效的方法,特别是对于背景与目标区域对比度较大的图像,分割结果更为理想。该方法从图像本身灰度值的变化出发,忽略了像素的空间分布,易受噪声影响,而且对灰度值变化丰富的医学图像效果较差。
区域生长法是选取种子像素点,随后将与其相似的像素合并到它所在的区域的方法。在医学图像病灶分割时,如果种子点选取得当,这种方法可以自动找到病灶的边界,能为医生的诊断提供定量及定性的依据。但是区域生长法对噪声敏感,如果种子像素点选取不当,分割结果就会出现错误,并且对于图像中灰度值,相近但不相邻的多个区域很难一次全部分割出来。
边缘检测经典算法有Canny 算子、Sobel 算子、Laplacian 算子、Prewitt 算子、LOG 算子等。算子的检测算法提高了医学图像分割的速度,主要基于像素值的梯度变化,容易受边缘的像素值变化影响,可能会得到不连续或虚假边界。
小波变换是对Fourier 分析的继承与发展,利用小波变换进行医学图像分割的基本方法是通过小波变换将图像直方图分解成不同级别的系数,用尺度控制并依照小波系数和给定的分割准则来选择阈值[2]。
小波变换在较大尺度上由噪音引起的细小突变较少,容易描述医学图像信号的整体行为,可检测出医学图像灰度值变化较大的轮廓,因此可以通过在不同尺度下逐步确定阈值来处理医学图像。这种传统的小波变换的方法将图像进行了全局平滑处理,忽略了医学图像的细节和突变信息,丢失了一部分重要特征[3]。我们根据医学图像复杂的纹理分布及影像图像的特殊性,改进了原有的提升小波方案,该算法能够实现对医学图像的实时定位和自适应处理,运行成本低,可以取得较好的图像分割和特征提取效果[4]。
2 自适应提升小波方案
2.1 基于提升的二维自适应提升小波格式
在该部分,我们设计了一种更新算子和预测算子同时自适应的提升小波结构,如图1 所示。
3 实验
选取肺部CT 图像作为测试,以检验本文所提自适应提升小波的应用效果。将该方法与经典的边缘检测算法如:roberts算子、sobel 算子、log 算子进行比较,检测结果如图。
通过实验分析我们可以得出:roberts算子采用对角方向相邻像素之差来估计梯度,对具有陡峭的低噪声的图像处理效果较好,但是利用roberts 算子提取边缘的结果是边缘比较粗,因此边缘定位不是很准确;sobel 对边缘定位比较准确;log 算子通过检测二阶导数过零点来判断边缘点,它的定位精度、单边缘响应和边缘的连通性都不错,而使用不同的模板产生的边缘有很大差别,自适能力较差。本文设计的提升小波可以自动跟踪图像各部分纹理的变化,有效保护图像的细节突变点。
4 总结
本文在传统提升小波的基础上设计了一种自适应更新算子和预测算子,凸显了图像细节分量在整个医学图像分割中的作用,避免了信息的丢失。实验结果显示了该方法对细节及边缘的保护作用,能够很好的分割图像。
参考文献
[1] 袁华, 岑人经, 藤奇志, 等. 医学图像处理中的边缘检测方法进展( 综述)[J]. 暨南大学学报( 自然科学版),2000,21(1):69-72.
[2] 康颐. 基于小波变换的医学CT 图像边缘检测技术研究[D]. 四川: 成都理工大学,2008.
[3] 王亚男. 基于提升小波和形态学的医学图像边缘检测[D]. 太原: 太原理工大学,2013.
[ 4 ] X u a n W a n g , J u n h u a L i a n g , O n - l i n efast palmprint identificationb a s e d o n a d a p t i v e l i f t i n gwavelet scheme,Knowledge-BasedSystems.2013,42:68-73.
作者简介
梁俊花(1985-), 女, 硕士学位。现为河北北方学院信息科学与工程学院助教, 研究领域为图像处理, 模式识别。
中图分类号:C37 文献标识码:A
一、概述
随着计算机视觉技术的发展,近年来利用机器视觉直接观察焊接熔池,对焊
接质量进行闭环控制是通过图像处理获取熔池的几何形状信息,已是当前研究的主要方向。
和传统的手工焊和半自动焊接过程相比,使用机器视觉进行直接观测焊接熔池有着很明显的优点,采集的数字图像信息丰富,表象直观,且数字化的图像数据可以实时传输到计算机高速缓存内,提取特征信息, 进行实时处理,同时作出在线判决,可以实现焊接过程质量实时控制和传感。
在传统的手工焊接和半自动焊接过程当中,对于一个有经验的焊工,通过直接观察熔池的行为、接头的位置、焊道外形及电弧形状,能够感知焊接的状态。若是感觉到实际焊接过程中同最佳状态不一致,为了达到最佳状态可以通过调节各参数,以获得高质量的焊缝。可以把这个过程划分为眼-脑-手的控制过程。图像处理在焊接过程中的重要意义就等同于手工焊接过程中人的眼睛,可以实现采集和处理焊接位置的传感、焊接时熔池、焊道对中、熔宽和熔深的信息,然后利用计算机发出指令,实现焊接过程的各种工艺参数如电流、电压、焊接速度的调节和电弧或焊丝的对中。
二、图像处理的概念
图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。一般图像处理就指的是对数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,匹配、描述和识别以及增强和复原这3个部分。常见的处理包括有图像复原、图像数字化、图像增强、图像编码、图像分析和图像分割等
三、焊接图像摄取方法
图像的处理一般包括量化、图像识别和图像预处理等几个步骤。图像预处理包括图像增强、图像变换和图像恢复,尽量把因为随机因素的干扰和摄像中各种条件的限制而产生的不足和噪声减小,继而可以获取焊缝位置的精确信息;量化由图像卡完成;图像识别包括边缘提取和图像分割等,可借助小波变换、快速傅立叶变换、概率统计等数学工具对图像进行理解、分析、模式识别和特征提取。
从国内外大量文献来看,利用机器视觉采集焊接熔池图像的方法主要分为被动式直接视觉传感和主动式直接视觉传感两大类,视觉传感器常采用CCD摄取原始图像。CCD是英文(Charge-Coupled Devices)的缩写,意即“电荷耦合器件”。具有体积小、耐震动、重量轻、稳定性好、寿命长、速度高,几何失真小及耐高压等一系列优点。CCD是固态图像传感器的一种,固态图像传感器是指把布设在半导体衬底上的许多感光小单元的光-电信号,用所控制的时钟脉冲读取出来的一类功能器件。
动式直接视觉传感利用窄带复合滤光系统滤除非连续光谱的电弧强光,并采用高强脉冲激光或具有图像增强器的高频闪光灯作为辅助光源,可有效地抑制弧光获得清晰图像。被动式直接视觉传感是利用焊接过程中的结构光进行成像。主被动式直接视觉传感存在强光干扰的问题,激光焊接中,通常采用中性减光的办法解决强光干扰的问题;在电弧焊中,对于短路电弧焊和脉冲电弧焊.可在短路期间或基值电流期间获取图像数据,或者在摄像机前通入部分保护气,减少烟雾和飞溅的影响;TIG/MIG/MAG焊时弧光在600~700nm波段内相对光强最弱最稳定,选用这一波段内的干涉滤光片和防热玻璃可有效地排除弧光及红外干扰。
四、图像处理在焊接中的应用
现如今,对于图像处理主要集中应用在脉冲机器人焊接、TIG焊、激光焊和焊缝质量的检测等领域。图像技术在机器人焊接领域应用较广。由于机器人需要有很强的适应能力,借助三维视觉传感系统和计算机图像处理技术,焊接机器人可对焊接环境进行实时控制。通过图像的采集,可帮助机器人进行焊缝的对中,为机器人焊接提供实时特征信息,如熔深、熔宽和熔池的形状等,从而实现焊接过程的智能控制。目前国内哈工大的吴林教授在这方面作了较深入的研究,从焊缝位置的传感到熔滴的过渡,从过程实时控制到最后焊接质量的检测都进行了较为系统的研究。
哈工大的何景山博士在脉冲TIG焊熔深及熔透的彩色图形法传感方面进行了较深入的研究。图像处理目前用得最广的领域是在脉冲TIG焊中,国内外许多学者都对该领域进行了积极的探索。首先创建了一套适用于脉冲TIG焊的彩色图像法熔深和熔透的传感系统,通过对脉冲峰值和脉宽的控制实现对熔深和熔透的控制,其控制信息来源于基值期间,进行图像信息的采集。
此外,图像处理还在焊接的其它领域中有一定的应用。有的将图像处理用于焊接缺陷的自动监测与缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者还将图像处理用于水下湿法焊接,通过复合滤光技术和水下CCD摄像系统,采集出了药芯焊丝水下湿法焊接电弧区域的图像,用中值滤波和梯度算子的电弧区域图像边缘检测方法,有效地区分了电弧燃烧区域和电弧气泡区域。哈尔滨工业大学的何景山、杨春利等人结合采用埋弧焊进行容器类焊接结构制造过程中的工艺特点及实际工况,设计了一种将微型摄像机、微型半导体激光发生器及具有滤光功能的光学系统三者集成一体的焊缝视觉传感器。
焊接控制过程中的一个重要环节就是焊接缝隙检测,图像处理在这方面的应用也有许多学者研究。为了实现电弧焊过程的自动对中和焊缝质量控制,必须对焊接缝隙的相对位置和坡口几何参数进行检测。西安交大的梁晋、贾昌申等在《图像法焊接缝隙检测的研究》一文介绍了一套自行设计的计算机焊接缝隙检测系统,包括图像采集卡、计算机接口、光学传感器、图像处理软件,分析了它们的基本结构和工作原理,讨论了提高光学传感器、图像处理软硬件等抗干扰能力的措施。该系统工作原理是:由光源和CCD摄像机组成的光学传感器摄取图象,CCD摄像机把图象转换为电信号,再经图象采集卡把模拟信号变为数字信号存储于计算机内,计算机对此信号进行必要的处理,即可得到缝隙位置和坡口几何参数信息,在监视器屏幕上显示出来,或经过D/A电路给执行机构,修正焊枪位置,实现闭环对中控制。有的将图像分割和小波分析应用于焊接领域,小波分析在焊缝视觉跟踪过程中检测焊缝,采用多次小波变换可获得清晰的焊缝边缘,大大简化了硬件设备;图像分割法可减小焊缝识别的图像处理的复杂性,使得焊接过程的实时性增强。
五、图像处理在焊接中应用的展望
为焊接现象的描述及内在规律的解释提供了极佳的条件和直接的证据,推动焊接理论和实践的发展就是通过图像传感的这种方法。同时也使得研究者能够观察到其它传感方法所不能观察到的被强光所淹没的丰富直观的信息。
把图像处理技术应用到现代焊接技术中,将会推动焊接过程质量实时传感与控制的发展和成熟,使得焊接过程通过闭环反馈控制而实现完全自动化,保证焊接质量,提高焊接生产效率。
总之,作为智能控制中关键技术―数字图像技术,在焊接过程中发挥的作用将会越来越大,将为焊接智能化生产作出贡献。现代工业正朝着信息化和智能化方向发展,现代焊接技术也必然要实现智能化。
参考文献:
[1]段佳佳,杨迎春.图像处理在自动焊接中的应用[J].电子测试,2012,02:12-15.
[2]陈彦宾,李俐群,陈凤东,陈杰.图像处理在自动焊接中的应用和展望[J].材料科学与工艺,2003,01:106-112.
中图分类号:TP391 文献标识码:A文章编号:1007-9599 (2011) 11-0000-01
Image Stitching Technology Overview
Cai Jian
(Nanjing University of Aeronautics and Astronautics,Nanjing210016,China)
Abstract:Today,more and more high-resolution digital images for domestic,industrial,medical and defense technology applied.With computer vision,image processing technology,using an ordinary camera computer digital image composition as a large high-resolution images of the image stitching technology came into being.
Keywords:Image;Stitching technology;Overreview
而在人们的实际生活应用中,所需要的目标场景往往超出普通数码相机、监控摄像机等的视角范围。这些相机,往往在增大视角会降低采集图像的精度,而提高精度又只能窥豹一斑。因此,为了得到应用所需的高分辨、大视角的图像,人们不得不使用广角镜头和全景拍摄相机,这加大了生产、生活的成本,且使用技术不为一般人所能熟悉。所谓图像拼接技术,就是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传感器获得的)拼成一幅大型的无缝高分辨率图像的技术。图像拼接的流程大致分为:获取待拼接的图像,进行图像预处理,图像重叠区域配准,图像的无缝融合,输出所得拼接图像。其中,图像配准和图像融合是图像拼接成功的关机,是拼接的关键技术。因此,国内外学者多围绕此两项技术展开研究和讨论。
图像配准是图像融合的基础,而且图像配准算法的计算量一般非常大,因此图像拼接技术的发展很大程度上取决于图像配准技术的效率。
一、图像拼接的应用价值
目前,图像拼接技术已经数据图像处理研究的热门方向之一,被广泛地应用在文物保护(古迹、古文字资料的拼接)、工业监控、刑事案件侦破、医学图像分析、摄影测量学、机器视觉、虚拟现实技术、超分辨率重构、军事地形图像生成等领域,有着实际的应用意义和研究价值。主要表现为:
(一)全景图和超宽视角图像的合成。将普通图像或视频图像进行无缝拼接,得到超宽视角甚至360°的全景图,这样就可以用普通相机实现场面宏大的景物拍摄;
(二)碎片图像的组合。将医学和科研的显微碎片图像或者空间、海底探测得到的局部图像合成大幅的整体图像;
(三)虚拟现实。图像拼接是虚拟现实领域里场景绘制(Image-based Rendering,IBR)方法中的一项基本技术,利用图像拼接技术可以生成全方位图像,用全景图表示实景可代替3D场景建模和绘制。
例如2003年,美国“勇气号”和“机遇号”火星探测器发回了大量的火星地面照片,科学家们就是运用图像拼接技术合成了火星表面的宽视角全景图像。
二、图像拼接的方法
图像拼接的方法很多,不同的算法步骤会有一定差异,但大致的过程是相同的。一般来说,图像拼接主要包括以下步骤:
(一)图像预处理。包括数字图像处理的基本操作(如去噪、边缘提取、直方图处理等)、建立图像的匹配模板以及对图像进行某种变换(如傅里叶变换、小波变换等)等操作。
(二)图像配准。就是采用一定的匹配策略,找出待拼接图像中的模板或特征点在参考图像中对应的位置,进而确定两幅图像之间的变换关系。
(三)建立变换模型。根据模板或者图像特征之间的对应关系,计算出数学模型中的各参数值,从而建立两幅图像的数学变换模型。
(四)统一坐标变换。根据建立的数学转换模型,将待拼接图像转换到参考图像的坐标系中,完成统一坐标变换。
(五)融合重构。将带拼接图像的重合区域进行融合得到拼接重构的平滑无缝全景图像。
三、国内外研究现状
1975年,Kuglin和Hines提出了相位相关算法,该方法具有场景无关性,能将纯二维平移的图像进行精确对齐。1987年,De Castro和Morandi等人使用傅立叶变换将具有旋转变换的图像做对齐,由此产生扩展相位相关法。1996年,Reddy和Chaterji改进了De Castro的算法,基于快速傅立叶变换,利用极坐标和互功率谱,实现了具有平移、旋转和缩放变换的图像配准。
相位相关法虽然计算简单精确,但要求待配准图像之间有较大的重叠比率,同时计算量和适用范围与图像的大小有很大的关系。因此,出现了基于图像几何特征的配准方法。
1997年,Zoghlami I.、Faugeras O.和Deriche R.提出了基于几何角模型的图像对齐算法。1999年,Bao P.和Xu D.利用小波变换提取保留边(edge-preserving)的视觉模型进行图像的对齐,Nielsen F.则提出了基于几何点特征优化的匹配方法。
随着人们对图像的分析和理解的深入,图像拼接技术的研究也趋于成熟,图像拼接利用的配准特征也从图像的低级特征发展到利用高级特征。
1996年,Richard Szeliksi提出了基于运动的全景图像拼接模型,模型通过采用Levenberg-Marquardt迭代非线性最小化方法(L-M算法)求出图像间的几何变换关系进行配准。此算法效果好、速度快,且能应对平移、旋转和仿射等变换图像的拼接,因此成为图像拼接领域的经典算法。2000年,Shmuel Peleg、Benny Rousso等在其基础上,根据相机的不同运动,自适应的选择拼接模型,通过把图像分割成条进行多重投影,提出了自适应的图像拼接模型,使自适应拼接成为拼接领域研究的又一方向。
国内学者也对图像拼接技术做了大量研究。张祖勋提出了多级影像概率松弛整体匹配技术,对不同传感器、不同空间分辨率的影像进行配准。杜威、李华二人将视频纹理和全景图结合起来,提出一种应用于动态场景的全景图表示方法。赵向阳、独立民提出了基于Harris特征点匹配的自动拼接算法。侯舒维、郭宝龙采用简单的边缘信息阈值法、金字塔式分层搜索策略,提出了一种灰度图像上的快速自动拼接算法。方青、王博亮提出了一种基于比值模版匹配的彩色图像拼接算法。
参考文献: