前往顾页
以后地位: 主页 > 收集编程 > 其他实例教程 >

计较机视觉概述

时候:2011-05-20 14:17来源:知行网www.zhixing123.cn 编辑:麦田守望者

1. 甚么是计较机视觉

计较机视觉既是工程范畴,也是迷信范畴中的一个富有应战性首要研究范畴。计较机视觉是一门综合性的学科,它已吸收了来自各个学科的研究者插手到对它的研究当中。此中包含计较机迷信和工程、旌旗灯号措置、物理学、利用数学和统计学,神经心思学和认知迷信等。

视觉是各个利用范畴,如制造业、查验、文档阐发、医疗诊断,和军事等范畴中各种智能/自主体系中不成豆割的一部分。因为它的首要性,一些先进国度,比方美国把对计较机视觉的研究列为对经济和迷信有遍及影响的迷信和工程中的重年夜根基问题,即所谓的重年夜应战(grandchallenge)。"计较机视觉的应战是要为计较机和机器人开辟具有与人类程度相当的视觉才气。机器视觉需求图象旌旗灯号,纹理和色彩建模,多少措置和推理,和物体建模。一个有才气的视觉体系应当把所有这些措置都紧密地集成在一路。"[Neg91]作为一门学科,计较机视觉开端于60年代初,但在计较机视觉的根基研究中的很多首要停顿是在80年代获得的。现在计较机视觉已成为一门不合于人工智能、图象措置、形式辨认等相关范畴的成熟学科。计较机视觉与人类视觉紧密密切相关,对人类视觉有一个精确的熟谙将对计较机视觉的研究非常无益。为此我们将先介绍人类视觉。

1.1 人类视觉

感受是人的年夜脑与四周世界联系的窗口,它的任务是辨认四周的物体,并奉告这些物体之间的关系。我们的思惟活动是以我们对客观世界与环境的熟谙为根本的,而感受则是外界是客观世界与我们对环境的熟谙之间的桥梁,使我们的思惟与四周世界建立某种对应关系。视觉则是人最首要的感受,它是人的首要感受来源,人类熟谙外界信息的80%来自视觉。人有多种感受,但对人的智力产生影响的主如果视觉和听觉。味觉和嗅觉是丰富多样的,但很少有人去思虑它们。在视觉和听觉中形状、色采、活动、声响等就很容易被连络成各种明白和高度复杂、多样的空间和时候的构造布局。所以这两种感受就成了明智活动得以利用和阐扬感化的非常适合的媒介和环境。但人听到的声响要想具成心义还需求联系别的的理性子料。而视觉则不合,它是一种高度清楚的媒介,它供应关于外界世界中各种物体和事件的丰富信息。是以它是思惟的一种最根基的东西。

视觉对正凡人来讲是生而有之,毫不吃力的才气。但实际上视觉体系所完成的服从却十分复杂的。有人以为视觉本身就包含了思惟的一切根基身分。假想你要在一个会场中寻觅一名朋友,闪现在你眼前的是由插手会议的人、桌、椅、主席台等构成的复杂风景。眼睛获得这些信息今后先要对风景的各部分进行分类,然后从当选出与朋友的外表有关的特性作出判定,那么在人的眼睛视网膜上映照的风景成象是不是就可以直接供应判定时所需求的有关特性呢?不是的,这里需求年夜脑的思虑。比方,固然人在不合间隔处察看同一物体时在眼睛中成象的年夜小是不合的。但人们在察看或人以便估计他的身高时却不会因为他在近处而感到他高些,也不会因他在远处而感到他矮些。这是因为年夜脑按照被察看物体的间隔和与四周物体的比较,并依托有关的知识对输入的图象信息进行措置,解释的成果。如果你是在一个灯光暗淡的剧院中寻觅朋友,这个问题就变得更加坚苦。

你刚走进剧院时开端会感到一片乌黑看不清东西,过了几分钟你的眼睛变得习惯于在黑暗中察看。究竟上你的视觉体系在此期间中对微光变得更敏感了。但这时候很多原本可用的信息丧失了,物体可能难以与背景相辨别,很多细节难以辩白。即便如许人也总能认出朋友。总之,视觉是一个复杂的感知和思惟的过程,视觉器官-眼睛接管外界的安慰信息,而年夜脑对这些信息经由过程复杂的机理进行措置和解释,使这些安慰具有明白的物理意义。

从以上阐发我们还可以看到敏感(Sansation)、感受(Perception)、认知(Cognition)这三个观点之间的联系和不同。敏感是把外界的各种安慰转换成人体神经体系可以或许接管的生物电旌旗灯号。它所完成的是旌旗灯号的转换,其实不触及对旌旗灯号的了解。比方,人眼是视觉的敏感器官,它使光旌旗灯号经由过程视网膜转换电旌旗灯号。与摄象机的光电传感器类似,视网膜的感光细胞对光旌旗灯号在平面上进行采样,产生点阵情势的电旌旗灯号,所不合的仅是摄象机的空间采样是均匀的,而视网膜的采样是不均匀的,在中心凹四周采样辩白率高,而在四周的辩白率低。而感受的任务是把敏感器官的各种输入转换和措置成为对外部世界的了解。比方,对视觉来讲就是能说出四周世界中有甚么东西和这些东西之间的空间关系。这些都是关于四周世界的观点。从输入的点阵情势的旌旗灯号到情势对客观世界的各种观点此中要颠末复杂的信息措置和推理。而认知是以人们对四周客观世界的观点为根本的。如果没有感受这小我与外部世界的桥梁或窗口,人的思惟活动就换去根基的根据。

1.2 计较机视觉

人类正在进入信息期间,计较机将愈来愈遍及地进入几近所有范畴。一方面是更多未经计较机专业练习的人也需求利用计较机,而另外一方面是计较机的服从愈来愈强,利用体例愈来愈复杂。这就令人在进行扳谈和通信时的矫捷性与目前在利用计较机时所请求的严格和古板之间产生了锋利的冲突。人可经由过程视觉和听觉,说话与外界互换信息,并且可用不合的体例表示不异的含义,现在朝的计较机却请求严格遵循各种法度说话来编写法度,只需如许计较机才气运行。为使更多的人能利用复杂的计较机,必须改变畴昔的那种让人来适应计较机,来举一反三计较机的利用法则的环境。而是反过去让计较机来适应人的习惯和请求,以人所习惯的体例与人进行信息互换,也就是让计较机具有视觉、听觉和说话等才气。这时候计较机必须具有逻辑推理和决定计划的才气。具有上述才气的计较机就是智能计较机。

智能计较机不单使计较机更便于为人们所利用,同时如果用如许的计较机来节制各种主动扮装配特别是智能机器人,便可使这些主动化体系和智能机器人具有适应环境,和自主作出决定计划的才气。这便可以在各种场合代替人的沉重事情,或代替人到各种伤害和卑劣环境中完成任务。

计较机视觉就是用各种成象体系代替视觉器官作为输入敏感手段,由计较机来代替年夜脑完成措置和解释。计较机视觉的终究研究目标就是使计较机能象人那样经由过程视觉察看和了解世界,具有自主适应环境的才气。要颠末持久的努力才气到达的目标。是以,在实现终究目标之前,人们努力的中期目标是建立一种视觉体系,这个体系能根据视觉敏感和反应的某种程度的智能完成必然的任务。比方,计较机视觉的一个首要利用范畴就是自主车辆的视觉导航,目前还没有前提实征象人那样能辨认和了解任何环境,完成自主导航的体系。是以,目后人们努力的研究目标是实现在高速公路上具有门路跟踪才气,可避免与火线车辆碰撞的视觉帮助驾驶体系。这里要指出的一点是在计较机视觉体系入彀较机起代替人脑的感化,但其实不料味着计较机必须按人类视觉的体例完成视觉信息的措置。计较机视觉可以并且应当按照计较机体系的特性来进行视觉信息的措置。但是,人类视体系是迄今为止,人们所晓得的服从最强年夜和完美的视觉体系。如在以下的章节中会看到的那样,对人类视觉措置机制的研究将给计较机视觉的研究供应开导和指导。是以,用计较机信息措置的体例研究人类视觉的机理,建立人类视觉的计较实际,也是一个非常首要和信人感兴趣的研究范畴。这方面的研究被称为计较视觉(ComputationalVision)。计较视觉可被以为是计较机视觉中的一个研究范畴。

有很多学科的研究目标与计较机视觉附近或与此有关。这些学科中包含图象措置、形式辨认或图象辨认、风景阐发、图象了解等。因为汗青生长或范畴本身的特性这些学科互有不同,但又有某种程度的相互重迭。为了清楚起见,我们把这些与计较机视觉有关的学科研究目标和体例的角度加以归纳。
1.图象措置
图象措置技术把输入图象转换成具有所希望特性的另外一幅图象。比方,可经由过程措置使输入图象有较高的信-噪比,或经由过程加强措置凸起图象的细节,以便于操纵员的查验。在计较机视觉研究中常常操纵图象措置技术进行预措置和特性抽取。
2.形式辨认(图象辨认)
形式辨认技术按照从图象抽取的统计特性或布局信息,把图象分成予定的类别。比方,笔墨辨认或指纹辨认。在计较机视觉中形式辨认技术经常常利用于对图象中的某些部分,比方豆割地区的辨认和分类。
3.图象了解(风景阐发)
给定一幅图象,图象了解法度不但描述图象本身,并且描述和解释图象所代表的风景,以便对图象代表的内容作出决定。在人工智能视觉研究的初期常常利用风景阐发这个术语,以夸大二维图象与三维风景之间的辨别。图象理消弭需求复杂的图象措置以外还需求具有关于风景成象的物理规律的知识和与风景内容有关的知识。

在建立计较机视觉体系时需求用到上述学科中的有关技术,但计较机视觉研究的内容要比这些学科更加遍及。计较机视觉的研究与人类视觉的研究紧密密切相关(见1.3.5中的阐述)。为实现建立与人的视觉体系附近似的通用计较机视觉体系的目标需求建立人类视觉的计较机实际。
 

 

------分开线----------------------------
标签(Tag):计较机视觉
------分开线----------------------------
保举内容
猜你感兴趣