首页 产品 商务 新闻 案例 聚焦 企业 技术 人物 人才 下载 学术 展会 媒体 杂志 高手 V空间 小组 博客 论坛
您所在的位置:中国视觉网 >> 人物 >> 人物专访 >> [组图]王郑耀:问渠那得清如许,为有源头活水来  
王郑耀:问渠那得清如许,为有源头活水来
作者谢再红 文章来源中国视觉网 点击数:   更新时间:2008-2-19

 

 2007年12月7日 王郑耀在ViEW的POST交流会上

2007年12月,在由日本精密工学会图像应用技术专门委员会组织的缺陷检查算法竞赛中,法视特(上海)图像科技有限公司获得了第一名的佳绩,一时间,法视特(上海)图像科技有限公司在日本机器视觉业界名声大震!
    为了详细了解缺陷检查竞赛的前因后果,并深入探析法视特(上海)图像科技有限公司取得辉煌战绩的幕后背景,中国视觉网(以下简称视觉网)记者几经努力终于采访到了参加过此次竞赛的王郑耀先生,通过对他的专访,希望更多人能了解法视特(上海)图像科技有限公司以及他们的团队,同时,我们也希望通过王郑耀先生的精彩讲述,为读者展示出一位机器视觉从业者的心路故事。
    视觉网:日本精密工学会图像应用技术专门委员会组织的缺陷检查算法竞赛在日本图像领域非常知名,但是国内的视觉图像领域从业者对其了解的并不是很多,王先生可否为我们介绍一下缺陷检查竞赛的基本情况。
    王郑耀:外观检查算法竞赛(Algorithm Contest)是由日本精密工学业协会图像应用技术专门委员会组织的一项比赛,英文缩写为Alcon,网址为http://www.tc-iaip.org/alcon/
    为了促进基于图像的外观检查技术的发展,日本精密工学会图像应用技术专业委员会与研究人员和技术人员一起,推进着通用外观检查图像数据库的建设。作为重要的一部分,图像应用技术专业委员会从2001年开始组织外观检查算法竞赛。竞赛以实际应用为背景,使用实际制造现场产生的图像作为比赛的对象,逐渐广为人知。
    竞赛的流程每年都是大致类似的。7月公开题目和样本图像,7月底前接受报名,9月中下旬提交结果:程序可执行文件、使用说明和简单的算法说明。十一月初得到比赛结果,12月初日本图像展进行的同时,会有全国性的学术交流会,在这个学术交流会上举行颁奖仪式,前三名会有5分钟的演讲;并且参加学术交流会的POST交流会。
    竞赛规则如下:
    【1】预先给定有代表性的50幅图像(其中,20幅有缺陷并给定缺陷区域,30幅无缺陷)作为算法开发和测试的标准,供参赛各队设计算法和调整参数。
    【2】比赛时,另外给200幅图像(其中包括没有缺陷的图像,有缺陷的各个图像都在事前指定了正确的缺陷区域)作为评价标准。参赛的程序需要连续读入这些图像,将检出结果(是否有缺陷,缺陷区域中心坐标)保存到指定的文件。
    【3】根据正确率和处理时间进行评价:100分为满分, 缺陷只要在这个预先设定区域的外接矩形内就算正确。
    【4】标准评价环境为CPU:Cereron2.4Ghz,内存512MB,操作系统为 Windows XP。平均一个图像处理时间少于50ms时,加5分,多于500ms时减5分
    我与我同事一起参加了2006年和2007的比赛,并分别获得了第三名和第一名的成绩。
    视觉网:这样一个知名的行业技术竞赛,一般都有哪些人士参加呢?
    王郑耀:除了法视特(上海)图像科技有限公司外,参赛者都是日本国内的与图像处理、机器视觉相关的大学、科研机构和公司。作为日本FAST公司的子公司,法视特(上海)图像科技有限公司也报名参加了竞赛。每年大约有20多个队报名参赛。
竞赛的课题都是日本有关公司实际现场出现的缺陷检查问题中比较困难的,值得研究的题目。尤其是最近几年的题目,缺陷出现在复杂的背景上,很难进行检查。从下面的竞赛结果来看,除了2002年以外,获奖的基本上都是公司。因为这个原因,从2007年开始,增加了最优秀学生奖,来鼓励学校参赛。
    具体比赛结果如下:
    届 时间    题目                                       第一名     第二名     第三名
    1  2001年  玻璃上显著缺陷的检查       Art logic     旭硝子    日本电子
    2  2002年  低对比度图像上缺陷检查     中央大学 三菱原子燃料     芝浦工大
    3  2003年  复杂背景下缺陷检查        Lumine + 名古屋工业研究所    三菱原子燃料 欧姆龙
    4  2004年  低对比度、周期性噪声条件下缺陷检查   住友电气工业  三菱原子燃料 法視特
    5  2005年  不特定形状伤痕检查 欧姆龙 Techno System  法視特
    6  2006年  随机模式图像上显著缺陷的检查 住友电气工业  日本电子 法视特(上海)
    7  2007年  半导体模式上显著缺陷的检查 法視特(上海) 欧姆龙 旭硝子 
   视觉网:我们看了历届的比赛结果发现行业公司的比赛成绩要比学校的成绩好,产生这种结果的主要原因您认为是什么呢?
   王郑耀:这个原因是比较复杂的。学生的优势在于,他们有充足的时间可以来做程序,而公司的员工大部分只能在工作之余参与这个比赛。其它公司我不是很清楚,我们公司规定,只能工作之余做竞赛的程序。所以,真正花在做竞赛的程序上的时间,按照每天八个小时来算,学生可以有至少三个月时间,我们只有2周多一点时间。除此之外,学生还有教师指导,可以用比较前沿的、新的方法来解决问题。但是,尽管如此,学生还是没有公司员工做到好。
    我觉得原因主要在于:首先是经验少。由于问题本身很复杂,需要综合使用多种方法来解决。学生们总是希望用自己擅长的单一的方法来解决问题。相反,由于是专业的图像处理公司,公司员工有很多缺陷检查的经验,更容易找到最合适的算法来解决问题。
    其次,学生们编程没有经验,所以算法运行时间太长。但是,比赛时运行时间长短是重要的评价因素。时间太慢的算法,由于在实际中很难应用起来,会被扣分。
    视觉网:您能详细介绍一下贵公司参加比赛的情况吗?
    王郑耀:2007年比赛的题目是“半导体模式上显著缺陷的检查”。给了50幅图像作为样本,其中有20幅图像是有缺陷的并且已经告诉我们缺陷的位置,供我们分析问题,研究算法,调整参数。
由于工作需要,我从去年7月5号开始就到日本FAST进行为期9个月的产品开发。所以,参加比赛的这段时间我一直在日本。刚到日本,有很多事情,所以截止日期前的最有一天,也就是7月31号我们报名参加竞赛,所以实际上从八月才开始考虑比赛的事情。
    由于工作比较忙,能利用的时间基本上只能是节假日。幸运的是,八月份日本有一长达九天的假期。我就是利用这段时间分析了所有图像和缺陷,完成了算法构思。
把图像分为有纹理和没有问题两种;每种图像上,都可能有3-5类缺陷,比如说水渍、不均匀、线型划伤等等;对每种图像上的每类缺陷,分析为什么它是缺陷,有什么视觉上的特征,如何找到这种缺陷。这些工作完成后,九天假期已经结束了。
    剩下的工作就是将这些方法整合成一个整体,主要目的就是加快速度并且减少误捡出。这些工作我在剩下的几个周末完成了。首先,研究了如何快速的区分纹理图像和非纹理图像,任意给一个图像,我就能知道用那些方法去分析这个图像上的缺陷,从而加快了速度、减少了误判的可能性。然后研究对纹理图像(或者非纹理图像)那种缺陷的检查算法应该放在前面,在什么时候可以认为图像没有任何缺陷直接返回,这个主要是为了最大可能的提高检测速度。最后,调整参数以尽大可能的提高检测的准确性。
在这个过程中,日本法视特的刘伟、马嶺,上海法视特在日本参与开发的人员宁兆彬、鞠正、郑敏东、马宁和我在一起开了两次讨论会给我出主意想办法。另外,参加竞赛的界面程序是上海法视特的施俊做的。在这里我感谢他们对我的支持和帮助。
    视觉网:您在Fast公司主要负责哪部分工作?Fast公司派您和您和其它同时组成的技术团队参加了竞赛并获得了一等奖,你有什么感想呢?你认为在日本做开发与在中国做开发相比而言有哪些不同?
    王郑耀:根据公司的需要,正式工作后我就开始做字符识别底层库的开发,并和同事一起开发了在线印刷序列号、序列条形码、二维码识别检查软件FV-PrintChecker。FV-PrintChecker主要用于标签、票据和邮政大批量印刷过程中,印刷在上面的序列号的识别和检查,检查漏号、错号、重号和号码不一致等的错误。经过尽两年的努力,目前已经开发完成了第一版,并开始投入市场。对外观缺陷检查也做了一些思考和研究,这次比赛的能获得好成绩,与平时的准备是分不开的。
另外,我个人还对基于互联网的图像检索很感兴趣。所以业余时间看了很多相关的资料。对我来说,视觉和图像不仅仅是我的职业,还是我的爱好。
日本是自动化程度非常高的国家,有着成熟的机器视觉市场。我到日本三次了,这次又连续工作、生活了半年,在这期间参加了很多次与机器视觉有关的展会、见了很多客户,与中国机器视觉的现状做对比,确实有很多感触。
    成熟的学会。日本的精密工学会图像应用技术专门委员会(以下简称学会)组织了各种活动,促进技术交流。协会下面有很多会员,包括公司、研究机构和学校,他们会定期举行技术报告。我有幸参加了一次,虽然由于语言的问题,我只能从他们演示的PPT来理解他们的意思,但确实受益匪浅。举行讲座的都是像日立,三菱电机等日本各大公司研究机构的一线的研究开发人员,他们将最现实的问题转化为工程问题去解决,有些还尝试着用理论去研究的整个过程都作了介绍。 缺陷检查竞赛结果是在ViEW(Vision Engineering Workshop)上公布的,ViEW是一个技术研讨会,全日本做图像的大学、研究所和公司都会参加。与之同时举行的就是日本国际图像展。将技术研讨会和专业展览会放在一起举行,这就大大促进了技术和市场的结合。
成熟的客户。由于工作的原因,我接触了几家客户。我发现他们与中国客户的不同。日本客户在关心价格的同时,还很关心技术的可靠性,他们会仔细的询问他们能理解的技术方面的问题。另外,在用我们的技术给客户开发产品的时候,我们经常去客户那里,有时他们还会请我们吃饭,而不是相反。可能在他们的哲学中,我们是在给他们开发产品,所以应该请我们吃饭。
    获奖,这是对我长期以来学习和工作的肯定。但是,获得第一名确实是很意外的事情。因为,做技术的都知道,目前的机器视觉实际上是依赖于算法的参数的。对于这个比赛而言,参数全是事先调整好的。由于成绩之间的差距并不是非常大,所以比赛成绩很大程度上取决于参数。我觉得,获奖靠实力,但获得第一名还要靠运气了。
    视觉网:我们知道您是研究生毕业之前就到上海FAST实习了。那您感觉实习与工作有什么不同呢?
    王郑耀:2004年,因为发布在网络上的本科毕业论文《数字图像边缘检测》被法视特的先辈发现,所以   我有机会到刚成立不久的法视特(上海)图像科技有限公司实习。从2004年10月10日开始到2006年4月正式工作为止,刚好一年半。前半年安排的工作少,主要就是学习,比如说光源的选择和打光、如何拍照等等,这些在到法视特之前是没有一点点概念的。还有编程也是在实习期间培养起来的,刚到法视特时我只有一点点c 语言的基础,到正式工作时我已经能编写出很好的代码了。公司大部分都是刚毕业的学生,大家都互相学习,每周都会举行技术报告会,互相讲讲以前做的东西。在公司这段时间,我完成了研究生毕业论文《图像的视觉信息表象理论及其数学基础》,对我从2003到2006年学到的视觉知识做了一个理论总结。
因为干的很顺利,所以研究生毕业后,就直接留在法视特了,倒是节省了很多找工作的时间。
实习的时候虽然也做了很多事情,但是基本上都是配合别人工作。正式工作后,立刻感觉不一样了,要自己独立的工作,就觉得压力很大。总之,对人而言,我觉得实习的时候主要是学习,压力小;正式工作的时候要把自己的智慧变成产品,压力大,大脑很累。我觉得,研究生学完第一年课程有,如果有机会应该争取去公司实习。
    视觉网:刚刚进入机器视觉行业时间不长就取得了一定的成绩,中国视觉网的读者对您的从业经历和学习经历都比较感兴趣,您能给大家介绍一下吗?在进入行业之出,您就走出了坚实的第一步,能谈谈感想吗?
    王郑耀:这个说来话长。我是1999年考入西安交通大学的,专业是信息与计算科学。大学前两年,找不到方向和目标。那时候最大嗜好就是到处听演讲和报告,其中印象最深的就是微软亚洲研究院的一些关于图形图像处理的技术报告。到了大三的时候,也就是2001年9月,我和同学组队参加了2001年全国大学生数学建模比赛。我们做的题目是《血管三维重建》,是利用100幅血管断面图像恢复血管三维模型的问题,这是我第一次自己做图像处理,不过当时我们做的不是很好,只获得陕西赛区一等奖。
当时我们学院的老师程正兴教授正在给我们上数值逼近课。程老师早先是研究逼近论和样条函数的,从九十年代开始研究小波分析。程老师的课讲的非常好,我自己也看了很多有关的书籍。小波分析和样条函数主要用在信号处理、图形图像处理中。所以,我从那时候起就将重点集中在图形图像方面。
考研究生的时候,我选了程正兴教授做我的导师。按照惯例,他指导我的本科毕业设计。程老师给了一些题目让我选,我就选了与图像处理有关的题目。2003年非典期间,很长时间不允许出校门。那段时间,就像是上天赐给我的一样,没有别的选择,就是呆在宿舍或者图书馆研究程老师让我学习的一个法国工程师2000年发表在IEEE Transactions On Image Processing上的论文。
    经过半年多的努力,本科毕业设计《数字图像的边缘检测》终于完成。这篇文章长达130页,总结了各种边缘检测算法的思想并重点研究了Canny准则及其发展。这篇文章入选当年全校优秀本科毕业设计论文。后来我把这篇文章上传到中国视觉网等网站上,阅读的人很多,被大量的论文所引用。经常有人给我发电子邮件,希望我帮他解决边缘检测方面的问题。
    我感谢并赞同视觉网用坚实的第一步来评价我在Fast公司的表现,对于这坚实的第一步,我应该感谢我的导师程正兴教授。另外,我应该感谢西安交大钱学森图书馆。做研究需要阅读大量的文献,尤其对于一个刚入门的人来说。对于九十年代以后的期刊,目前各个大学的图书馆的网络电子期刊中都能找到,但在这之前的文献,就比较难找。不过,西安交大钱学森图书馆里能找到八十年代的参考资料,甚至更早的。比如说PAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence)和CVGIP(Computer Vision, Graphics, and Image Processing),八十年代很多非常好的图像处理文献都发在这些期刊上。这两份期刊钱学森图书馆中基本上是完整的,这让我受益匪浅。
    视觉网:对于机器视觉行业的学习,您能给即将进入的行业新兵什么建议吗?您提到过您经常阅读文献,那么我们知道很多文献的发表时间已经很长了,这些文献对于学习机器视觉还有用吗?

[1] [2] 下一页

短信联系:
人物录入:杨清秀    责任编辑:杨清秀             
【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
  其他文章  
 
  • 上一个人物:

  • 下一个人物: 没有了
  •   相关文章  
      没有相关人物
    点击今日
     
    最新热门
    最新推荐
    聚焦
     
     
     
    姓 名: * 游客填写  ·注册用户 ·忘记密码
    主 页:
    • 请遵守《互联网电子公告服务管理规定》及中华人民共和国其他各项有关法律法规。
    • 严禁发表危害国家安全、损害国家利益、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容的评论。
    • 用户需对自己在使用本站服务过程中的行为承担法律责任(直接或间接导致的)。
    • 本站管理员有权保留或删除评论内容。
    • 评论内容只代表网友个人观点,与本网站立场无关。
    评 分: 1分 2分 3分 4分 5分
    内 容:
     
       小组
       博客
       论坛