物体识别
物体识别是计算机视觉领域中的一项基础研究,它的任务是识别出图像中有什么物体,并报告出这个物体在图像表示的场景中的位置和方向。目前物体识别方法可以归为两类:基于模型的或者基于上下文识别的方法,二维物体识别或者三维物体识别方法。对于物体识别方法的评价标准,Grimson 总结出了大多数研究者主要认可的 4 个标准:健壮性(robustness)、正确性(correctness)、效率(efficiency)和范围(scope)。
物体识别
当时MIT的计算机老师组织了一个面向本科生的两个月的Summer Project。这个Project的目的是设计一个系统,能够智能识别场景里头的物体,并区分出类别。当时他们低估了这个问题的难度,结果可想而知。
原因是我们看到的这个物体的样子,只是它在某种背景下某一种光线条件下特定角度的投影的,换一个角度可能就是完全不同的样子。即使是同一个物体,例如人,躺着或者站着,形态都是不一样的。
物体识别的主要方法
基于统计的方法与基于物体部件的方法:
根据识别方法是否对局部特征之间的关系建模,可以把识别方法分为基于统计的方法与基于物体部件的方法。
1、基于统计的物体分类方法(BoW:Bag of Words)
BoW模型严格上讲并不是一种物体识别方法,而是一种物体分类方法。这种模型的灵感来自于NLP中的BoW模型。。一幅图像可以看作是一篇“文档”,而图像中提取出的特征认为是“词语”。
1)生成性方法的学习与识别
生成性的学习方法通过先验知识去拟合并解释图像中的信号。在中,有两种主要的生成性方法,一种是NB(朴素贝叶斯),另外一种是pLSA(概率潜语义分析)与LDA(线性判别分析)。
物体识别的困难与前景
虽然物体识别已经被广泛研究了很多年,研究出大量的技术和算法,物体识别方法的健壮性、正确性、效率以及范围得到了很大的提升,但是现在依然存在一些困难以及识别障碍。这些困难主要有:
获取数据问题:
在不同的视角对同一物体也会得到不同的图像,物体所处的场景的背景以及物体会被遮挡,背景杂物一直是影响物体识别性能的重要因素,场景中的诸多因素,如光源、表面颜色、摄像机等也会影响到图像的像素灰度,要确定各种因素对像素灰度的作用大小是很困难的,这些使得图像本身在很多时候并不能提供足够的信息来恢复景物。