SIFT

By Dean

这是视频处理课程上的一个作业,说起来是有点难的,但我感觉还挺有意思的,写一写免得自己以后忘了。
Scale-invariant feature transform,尺度无关特征变换,可以说是很棒的一个东西了。
尺度,在我看来就是大小和清晰度的结合,尺度用来描述这个物体离观察者有多远。因为在日常生活中,近大远小,以及远处的东西一般要模糊一点,用尺度来描述物体离观察者的距离还是不错的。在计算机中,可以用“高斯金字塔”这种结构来模仿不同尺度下的物体,其中大小用图片分辨率实现,模糊清晰可以用高斯滤波实现。
顾名思义,SIFT就是想要找到两幅图像中和尺度无关的特征。
比如我离一辆车10米拍了一张照片,和离同一辆车100米拍了一张照片,而且还有一定程度的旋转平移。我们寄希望于寻求一种算法,能找出两章图片中相同的特征。
更有甚者,如果两章照片照了一个物体的不同部分,根据重叠部分的特征,可以将这两个图片拼接起来。

什么样的点可以作为特征点呢?

Harris角点,角点是梯度变化最快的地方。