时 间 记 忆
最 新 评 论
专 题 分 类
最 新 日 志
最 新 留 言
搜 索
用 户 登 录
友 情 连 接
博 客 信 息


 
《机器视觉》卷一 《原理、方法和实现》(续) 
[ 2006-05-12 20:59:00 | By: 机器视觉 ]
 

2-3-1         RGBCMY颜色模型

根据RGB三基色原理,各种颜色光都可以通过红、绿、蓝三种基色加权混合而成,这可以用RGB直角坐标单位立方体来说明:坐标原点(000)表示黑色,坐标(111)表示白色,在坐标轴上的三个顶点表示RGB的三个基色,因此彩色空间是三维的线性空间,任意一种具有一定亮度的颜色光都可用空间中的一个点或一个矢量表示,因此我们可以选择具有确定光通量的红、绿、蓝三基色作为这个三维空间的基,这样组成的系统称为RGB表色系统,国际公认的RGB表色系统的三基色光的波长为:

λr=700.0nm

λg=546.1nm

λb=435.8nm

标准白色光按照如下比例混合而成:

R):(G):(B=14.59070.0601 

  C=0.06*(R)+0.31*(G)+0.63*(B)

另外根据RGB直角坐标单位立方体可知,在坐标轴上的另外三个顶点青(Cyan)、品红(Magenta)、黄(Yellow)和RGB一样,也可以构成一组基色,称为CMY颜色模型,各种颜色的光也可以由CMY三基色加权混合而成。CMY模型主要用来描述绘图和彩色打印输出的颜色,因为这类颜色的形成是一个由白到黑的减色过程。

RGB模型与CMY模型的关系为:

C

M

Y

R

G

B

1

1

1

 


=        -

 

 

2-3-2         XYZYIQ颜色模型

在使用RGB模型生成颜色时,用于产生颜色的原基色比例系数出现负数使用起来不方便,同时不同使用者对白色的标准不同,使结果往往难以比较,为此国际照明委员会()规定了一种新的颜色表示系统,定义为CIE-XYZ颜色模型,表示为:

C=X(X)+Y(Y)+Z(Z)

XYZ表色系统需要满足三个条件:

1、  三色比例系数XYZ都大于0

2、  Y的数值正好是彩色光的亮度;

3、  X=Y=Z时仍然表示白色光。

XYZ表色系统与RGB表色系统的转换关系为:

 

(X)

(Y)

(Z)

R

G

B

2.7689   1.7517   1.1302

1.0000   4.5907   0.0601

0.0000   0.0565   5.5943

 


=

 

 

2-3-3         HSVHSI颜色模型

从视觉角度来说,颜色可以分为彩色和非彩色两大类,非彩色是指黑色、白色以及两者之间深浅不同的灰色,称为非彩色或者无色系列(Achromatic Series),彩色系列或有色系列(Chromatic Series)是指除了白色系列以外的各种颜色。为了定量的描述颜色对人眼的视觉作用,可以用亮度(Brightness)、色调(Hue)、色彩饱和度(Saturation)这三个与视觉特征有关的量来计算描述。将色调、色饱和度和亮度编码成RGB彩色值不利于机器视觉算法使用,因此人们按照色调(Hue)、色饱和度(Saturation)和明亮度()值来建立HSV模型,也有用光强(Intensity)代替明亮度值的,称为HIS彩色模型。

HSVRGB表色系统的关系为:

V=1/3*(R+G+B)

CosH=(2R-G-B)/(2*(R-G)2+(R-G)(G-B))

S=1- (3/(R+G+B))*min(R,G,B)

2-1        图象编码与图象格式

数字图象在通信、数据库以及机器视觉中广为应用,并且已经开发了标准格式以便不同的硬件和软件共享数据,但遗憾的是目前有多达几十种不同的视觉图象格式再同时使用,有的图象格式最初是由公司规定的,有时可以得到公开的文档和转换软件,但大多数情况下是得不到的,这为数据共享带来了一定程度的障碍。这里我们只对几种图象格式进行简单的讨论,以便大家对图象能有更深入的理解。

原始图象(Raw Image)只是字节流,图象象素按一行一行的顺序编码,这种顺序称为光栅顺序(Raster Order),图象行与行之间允许用换行符进行分割,但图象的类型、大小、生成时间和创建方法等信息并不是原始图象的一部分,标准图象格式包含着一个头文件,文件头中记录着标记数据和解码所必须的非图象信息。

2-2-1         图象头文件

图象头文件(File Header)是图象的自我说明,通过文件头图象处理工具能同时把他们一道工作。文件头应该包括图象的维数、类型、创建日期和某类标题,它也可以包含用于解释象素值的颜色表或编码表。很不错的特征是历史段(History Section),其中包含如何建立和处理图象的信息,但这个特征并不容易得到。

2-2-2         图象数据

有的图象格式只能处理有限类型的图象,如二值图象和灰度图象,至今依然再使用的图象格式,通过发展大多数能够包括更多的图象类型和特征。文件格式不同,对象素大小与图象大小的限制一般也不同,甚至有的格式可以处理帧序列,多媒体(Multimedia)格式同时包括图象数据、文本和声音等。

2-2-3         数据压缩

许多格式提供了对图象数据的压缩(Compression),不是对所有的象素值直接进行编码。图象压缩能使图象数据减少到原来的30%甚至3%,这取决于需要的图象质量和所用的压缩方法,压缩可以是无损(Lossless)的或是有损(Lossy)的。使用无损压缩能完全恢复出原始图象,而使用有损压缩则不能恢复出原始图象,有时甚至能观察出图象质量的损失。为了实现压缩,图象文件必须包括一些关于压缩方法和参数的抬头信息。许多数字图象和数字符号信息不同,丢失或改变几位数字图象数据,不管对于人还是对于机器的影响都不达。图象压缩是个振奋人心的研究领域,涉及范围从信号处理到目标识别,以后会有所进一步讲解,但并不打算做系统性的讨论。

2-2-4         游程编码

对于二值图象或标记图象来说,游程编码(Run-coding)是一种有效的编码方法,它不仅能够减少存储空间而且能够加速图象运算速度,可以满足适时检测的需要。当图象行象素存在大量冗余时,游程编码会非常有效。对于二值图象的每一行,我们可以记录下0的数目,接着是1的数目,如此下去直到完全成行。游程编码常常是标准格式的压缩方法。

2-2-5         常用图象格式

这里我们将简单的讨论几种机器视觉经常使用的图象格式,并对个别格式适当给予程序实现方法以便更好的理解与应用。

(2)       BMP格式

BMP格式是Microsoft公司为其Windows操作系统设置的标准图象格式,在Windows系统软件中包含了一系列支持BMP图象处理的API函数。基于Windows的广泛应用,今天BMP文件不仅是个人计算机上最常见的图象文件格式之一,也是机器视觉最常使用的图象文件格式。BMP文件可描述多达32位彩色的图象,通常以非压缩方式储存,但也可以进行压缩处理,其常用的压缩算法是行程长度编码(Run Length EncodingRLE),由于BMP的压缩效果并不太好,在现实中很少采用带压缩的BMP格式。BMP文件结构包括:BITMAP FILEHEADERBMP文件头)、BITMAP INFOHEADERBMP文件信息头)、RGBQUADBMP文件调色板)、BITMAP DATABMP文件数据)几个部分。在Windows系统中BITMAPFILEHEADER结构定义为:

Typedef struct tagBITMAPFILEHEADER{

     UINT bfType;

     DWORD bfSize;

     UINT bfReserved1;

     UINT bfReserved2;

     DWORD bfOffBits;

}BITMAPFILEHEADER;

 
 

发表评论:

    大名:
    密码:
    主页:
    标题: