第一章 机器视觉概述
1-1 机器视觉的定义
机器视觉(Machine Vision)简单的说就是机器的视觉。人类对于外部的信息大量是通过眼睛获得的,千百年来人类一直梦想着能够制造出智能机器,这种智能机器首先具有人眼的功能,可以对外部世界进行认识和理解。人脑中有很多组织参与视觉信息的处理因而能够轻易的处理许多视觉问题,可是视觉认知作为一个过程,人类却知道的很少,从而造成了对智能机器的梦想一直难以实现。随着照相机技术的发展和计算机技术的出现,具有视觉功能的智能机器开始为人类所制造,从而逐步形成了机器视觉产业学科。所谓机器视觉,美国制造工程师协会( SME Society of Manufacturing Engineers )机器视觉分会和美国机器人工业协会( RIA Robotic Industries Association ) 的自动化视觉分会的定义是:
定义1 “机器视觉是通过光学的装置和非接触的传感器自动地接收和处理一个真实物体的图像以获得所需信息或用于控制机器人运动的装置”。
机器视觉作为与人眼类似的机器仿生系统,从广义角度凡是通过光学装置获取真实物体的信息以及对相关信息的处理与执行都是机器视觉,这就包括了可见视觉以及非可见视觉,甚至包括人类视觉不可直接观察到的物体内部的信息获取与处理等。
1-1 机器视觉的应用
作为与人眼类似的机器视觉,其应用实际上是无止境的,这里给出几个方面的应用介绍,对于我们理解研究动机和研究方向将起到很好的作用。
1-2-1 安全防范
人类的活动首先要求进行安全防范以获得对自身权利的保障。目前已经开发出众多的安全防范视觉系统在各种场合发挥作用:自动柜员机(ATM)给人们的日常经济行为带来方便,但同时也给权利安全带来隐患,通过机器视觉可以扫描人眼来识别使用者的身份,也可以通过机器视觉来监控相关的行为;家庭视觉监控系统在保障家庭生活方面也起到了很好的保障作用,并且除了家庭之外,甚至已经把日常的监控设立到了小区范围之外;在锅炉、电力以及建筑方面,机器视觉也正在发挥着重要的作用,红外和紫外系统可以监测火情、电力以及裂痕,而基于机器视觉的建筑震动测量装置不仅仅可以预测建筑物的抗震性,也可以监测铁路或者桥梁的共振特性。
1-2-2 视频会议
随着信息时代的到来,人类之间的交流也变的日益方便,其中与网络技术相结合的视觉系统不仅给单位之间的交流带来方便,也让个人之间的交流更加直接与方便,同时也把监控扩展到了远程应用。
1-2-3 字符识别
把纸质文档转换成适合于信息系统的数字形式是信息社会一个常见问题,例如把一本书发布到因特网或者把蓝图转化成几何文件以便数控机床使用等,都需要机器视觉的扫描与识别,OCR技术为我们这类生活带来了方便。基于条码技术的机器视觉也已经广泛应用在超市、仓管或者海关,为人们对物品管理带来了极大的方便,也已经完全为人们所接受。
1-2-4 图象检索
海量数字存储、宽带传送和多媒体个人计算机促进了图象数据库的发展,有效采集与使用现有的众多图象需要合适的检索方法。标准数据库技术适用于加注文本关键字的图象,而基于内容(Content-based)的检索方法是当前研究的一个热点。假如一个公司要设计一个新图标并对它加以保护,如果图标与某个现有图标太相似将导致不能使用,所以要对现有图标进行检索。在企业产品开发方面也存在同样的图象检索需求。这样的技术还可以用来设计判断某个图象是否是裸体照片,对于想控制子女上网的父母来说就是不错的方式。
1-2-5 孔洞记数
20世纪70年代后期曾经有位工程师位卡车公司设计了一套机器视觉系统,可以成功的测量卡车支撑杆上的螺孔数目。卡车公司要求所有的交叉支撑杆在装运前必须要经过检查,因为在未装配完的卡车上如果少一个螺孔将会造成代价不菲的损失:要么生产停线重新钻孔,要么工人为了不让生产停线而少装必要的螺丝,这将未卡车带来巨大的隐患。为了获得卡车交叉杆的数字图象,把光源放在传送带下方,数字摄象机则安装在上方,当交叉支撑杆通过摄象机视野时,就会拍下图象。在图象上孔的部位时亮色,而没有孔的地方则是暗色,孔数可以通过外角(External Corner)数减去内角(Internal Corner)数然后除以4获得。类似的应用也在制药领域或电子电路领域发生着,对于包装成板的药片或者对于PCB板上孔位的记数也是必须的。
孔记数只是机器视觉的一个简单应用,但需要注意的是仅当孔是4-连通(4-connected)而且是简单连通(Simply Connected)时,也就是孔内没有背景图象时,孔记数算法才是有效的。这种孔记数方法,将在后面二值图象分析章节做进一步的讨论。
1-2-6 医学诊断
医学通常需要机器视觉。X光系统可以探测人体,对于诊断有着重大的作用;肠镜与胃镜系统可以帮助医生有效诊断肠胃的病变,而***镜系统对于妇科的诊断也起到了巨大的作用;磁共振成像(MRI)设备能感测到三维目标内部的组织,通过MRI所获得的头部血液流动的图片,人们可以看见重要的血管,医生通过MRI图象检查肿瘤或血流问题,例如反常的血管收缩和扩张。
1-2-7 遥感测控
卫星有规律的扫过地球表面的大部分地区并把数字图象传送到地面,对这些图象进行处理,抽取出各种各样的信息,例如河流分水岭上的积雪量对于调节大坝控制洪水、水供应或者保护野生动物很重要。
1-2-8 物体传送
在工业制造过程的许多环节中或者物流过程中,通过传送带或箱子搬送零件或物品,零件或物品必须分别用机器放置、包装或检查等。机器视觉系统可以识别零件或物体,并可以判断零件或者物品的准确位置,通过机械手既能拣起零件或物品并放到合适的地方。
1-2-9 产品检测
质量控制是企业的一项重要工作,利用机器视觉进行产品检查可以解决人眼的疲劳问题,同时可以解决人眼不能准确判断尺寸量化等问题。对于瓷砖生产厂需要检测表面纹理、表面伤痕以及斑块等,对于电子厂商也需要检测电路焊点、表面划痕等,而玻璃厂商则需要检测玻径等,类似的情形也同样发生在其他产品的生产与制造过程中,甚至在人眼不能直接看到的物体内部也可以利用机器视觉作为检测手段,比如检测已经包装好的盒子内部是否缺料或者检测金属内部有没有裂缝等。利用机器视觉将给产品检测带来巨大的绩效。
1-2-10 产品设计
钻石企业从自然界获得的钻石通常是具有一定晶体结构的毛坯,如何有效的对钻石毛坯进行设计与加工是企业获得效益最大化的一个基本保证。利用机器视觉测量钻石毛坯尺寸、重建钻石毛坯图形,然后对毛坯图形进行设计之后再去加工,可以保证钻石毛坯被最大程度的利用。对于客户提供的物体样品,通过机器视觉可以直接得到物体的数字蓝图,可以直接进一步控制生产或者对物体进行重新设计。
1-2-11 虚拟现实
医生要做一个头部骨骼手术,在诊断过程中得到了病人的头骨和大脑的三维图象,借助虚拟现实技术,医生可以在三维数据模型上进行演练而不需要拿实际的对象“实验”。通过尝试不同的入口路径、不同的操作手术,可以为病人选择一种最好的治疗方案。如果把总的大脑图谱(Atlas)和三维图象数据对应起来,使医生可以分层观察大脑结构,并对不同手术方案的结果进行评价,以免损坏重要的脑体组织。
现在的商业已经很发达了,即使化妆品,一个商场也会同时拥有众多的品牌与系列,对于消费者具体应该如何选择才能适合自己的需要,借助机器视觉虚拟现实技术就可以提供良好的帮助。首先消费者可以到一个装有视觉装置的梳妆镜前,梳妆镜内的机器视觉系统可以自动记录消费者的面部图象,根据对消费者的面部图象进行分析并给出使用哪种化妆品后的实际效果。这种技术已经在现实中得到了具体的应用。另外企业新开发了一款产品,也可以利用虚拟现实技术进行生产评价或进行预先的产品以及生产过程展示。可以说虚拟现实技术推动了虚拟手术、虚拟消费雨季虚拟制造的发展。
虚拟现实是一个新兴的学科,一般认为是计算机图形学的一个子领域,然而在实际应用中虚拟现实通常需要获取图象和处理图象、需要高质量的立体显示,使用户在虚拟环境中有身临其境的感觉、需要数学模型使实际空间与模型空间的三维点对应、也需要测量用户或其他实际物体的位置,因此虚拟现实也属于机器视觉范畴。目前在仿真工程、遥感操作以及计算机游戏等方面,虚拟现实技术已经走向了成熟。