第一章 图象图形学基础
2-1 图象图形的基本表述
对于图象,首先要了解模拟图象(Analog Image)和数字图象(Digital Image)两个概念。图象函数是个数学模型,经常用于分析图象,我们一般把图象看成是双变量的函数,这样分析图象就可以用所有的函数分析方法。数字图象只是具有离散值的二维矩阵。一幅数字图像可以表示一帧动画、一个物体、一张文本、一个人脸等等,多幅连续的数字图像则可用于描绘运动的物体或用于表示物体的整体。数字图像包含固定的像素(Pixel)行数与列数,象素是图像元素(Picture Element)的缩写。像素就象小方块,其数值范围通常为0到255之间,象素值表示图像上各点的亮度,0表示最暗、255表示最亮,或者255表示最暗、0表示最亮,这与编码方案有关。
定义2 模拟图象是指二维图象F(x,y),其空间参数 x,y具有无限精度,在每个空间点(x,y)的光强也具有无限精度。
定义3 数字图象是指二维图象I(r,c),用离散的二维光强阵列表示,光强的精度是有限的。图形的表达与数字图象类似,也是以象素点阵列来表达,但与图象的区别在于图形是人根据自己的思维或根据对外界信息的测量结果而绘制,并不是通过光学装置直接获取的外部信息。
定义4 灰度图象是单色数字图象I(r,c),其中每个象素只有一个强度值。当所有象素值要么为0要么为1的数字图象则称为二值图象。
定义5 多谱图象是二维图象M[x,y],在每个空间点或象素位置存在一个强度值向量。如果是以幅彩色图象,则该向量有三个元素。
定义6 标记图象L[r,c]是数字图象,其中的象素值是有限的字符标记。象素的字符值表示对该象素做某个判断的结果。主题图象和伪彩色图象的概念与此相关。
数字图象的每个象素表示实际图象中某个基本区域的采样结果,如果把该象素从图象平面反投影到场景中的实物上,那么场景元素的大小就是传感器的标称分辨率(Nominal Resolution)。例如一张10in.的方形纸片对应500*500的数字图象,则传感器的标称分辨率为0.02in.。如果场景的深度变化比较大,这个概念就没有意义,因为标称分辨率随着深度和表面方向而变化。成像传感器的视场(Field Of View,FOV)是对传感器能看到的场景范围的度量。传感器的分辨率(Resolution)则与它进行空间测量或细微特征检测的精度有关。如果使用得当再加上模型信息,一幅500*500的像素图象做出的测量精度可达1/5000,这个精度称为亚像素精度(Subpixel Resolution)。由于图象中的一个像素度量的是实际场景中的一个区域而不是一个点,所以像素值经常是不同目标的混合结果。
2-1 二维图象与三维世界
人类视觉系统综合不同的线索特征对三维世界的结构进行感知。与人一样,机器视觉的成像过程记录了三维世界结构和二维图象之间的复杂关系,通常采用透视投影变换和正交投影变换两种映射方式,可以表示为:
f:R3 à R2
或者 (x,y,z)à(x’,y’)
透视投影(Perspective Projection)是最常用的成像模型,可以用针孔(Pinhole)成像模型来近似的表示,其特点是所有来自场景的光线均通过一个投影中心,它对应于透镜的中心。
正交投影(Orthogonal Projection)指用平行于光轴的光将场景投射到图象平面上,因此也称为平行投影(Parallel Projection),正交投影是透视投影的一个特例,当透视投影模型的焦距F可以很大且物体距离投影中心很远时,透视投影就可以用正交投影来近似。
2-2 视觉图象色彩原理
人的颜色感觉是不同波长的可见光刺激人的视觉器官的结果,对于人类视觉,可见光的波长分布在380~780nm之间,在可见光波长范围内,随着波长的增长,使人产生紫、蓝、青、绿、黄、橙、红等颜色的感觉。实践证明,光谱上的大多数颜色都可以用红色、绿色、蓝色三种单色加权混合产生,基于RGB三基色的颜色表示称为RGB颜色模型。RGB颜色模型在工业中得到了广泛的应用,例如视频监视器用的就是RGB颜色模型,彩色摄象机输出的也是RGB颜色模型。常用的颜色模型还有CMY、XYZ、YIQ、HSV以及HLS颜色模型等,他们可以适应不同的应用,同时也可以实现相互之间的转换。