物体识别
物体识别是计算机视觉领域中的一项基础研究,它的任务是识别出图像中有什么物体,并报告出这个物体在图像表示的场景中的位置和方向。目前物体识别方法可以归为两类:基于模型的或者基于上下文识别的方法,二维物体识别或者三维物体识别方法。对于物体识别方法的评价标准,Grimson 总结出了大多数研究者主要认可的 4 个标准:健壮性(robustness)、正确性(correctness)、效率(efficiency)和范围(scope)。
基于模型的物体识别方法
现在主流的物体识别的基本方法都可以集合为一类:基于模型的物体识别。基于模型的物体识别方法首先需要建立物体模型,然后使用各种匹配算法从真实的图像中识别出与物体模型较相似的物体,它的主要任务就是要从二维或三维图像抽取的特征中,寻找出与模型库中已建好的特征之间的对应关系,以此来预测物体是什么。
这个方法主要涉及到两个难点,一是如何选取合适的图像特征以及如何改进,二是如何恰当的定义物体模型并建立抽取的特征与模型库中特征的对应关系。
物体识别的困难与前景
虽然物体识别已经被广泛研究了很多年,研究出大量的技术和算法,物体识别方法的健壮性、正确性、效率以及范围得到了很大的提升,但是现在依然存在一些困难以及识别障碍。这些困难主要有:
信息载体问题:
物体本身是一个高纬信息的载体,但是图像中的物体只是物体的一个二维呈现,并且在人类目前对自己如何识别物体尚未了解清楚,也就无法给物体识别的研究提供直接的指导。目前人们所建立的各种视觉系统绝大多数是只适用于某一特定环境或应用场合的系统,而要建立一个可与人的视觉系统相比的通用视觉系统是非常困难的。