回归和尺度不变性
边框回归:我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口G(即使得默认框逼近真实框的平移和缩放比例,从而在预测中使得默认框趋近于预测框)
即给定(Px,Py,Pw,Ph)寻找一种映射ff, 使得f(Px,Py,Pw,Ph)=(Gx^,Gy^,Gw^,Gh^),并且(Gx^,Gy^,Gw^,Gh^)≈(Gx,Gy,Gw,Gh))
原理:平移+尺度放缩:
平移量(tx,ty) 和尺度缩放(tw,th)如下:
tx=(Gx−Px)/Pw
ty=(Gy−Py)/Ph
tw=log(Gw/Pw)
th=log(Gh/Ph)
边框回归的目的
如何做边框回归
输入
输出
学习的目的以及损失函数
疑问1
解答疑问
当边框相差过大的时候就不是线性模型能够解决的了,所以边框回归只能用于进行“微调”
为什么边框回归只能用于进行微调
尺度不变形:(仅关注只提取关键点点附近矩形区域的sample,即无论多大像素的同一张图片,其在关键点一定区域内都会出现极值(即,关注梯度的变化,边缘的变化))
总结:无论尺度变化,关键点附近一定会出现极值
下面直观的看一系列不同scale的LoG作用在图像上一个角点会出现什么情况:
随着作用的scale增大,这一点的灰度值都出现了一个峰值。这就是尺度函数的精华所在,我们称之为scale signature。虽然这两张图样,初始尺度不一但是它们都在某个scale下出现了极值。那么被不同scale 的 LoG选出来的点有什么特性呢?
LoG长这个样子:
中间凸起的区域真是被LoG选中起作用的点,当scale变化时,被选中的范围是这么变的:
举个例子,有一条边缘曲线,全局看过去的时候是这样的:
我们用不同的圈去框那个角点,也就是不同尺度作用在图像上,在红色框时灰度值达到最大值。现在我们将图像放大,继续用不同的圈去框那个角点:
这样在红色大框下达到最大值,最重要的一点是:这两个框框出来的图像信息其实是一样的,只是原图尺寸不一样,导致达到极值时需要的框不一样大!
比如说一张美女图片,想要框出帽子的信息,图像尺寸小时框要这么大:
图像尺寸大时,框也要相应调大:
回归和尺度不变性
边框回归:我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口G(即使得默认框逼近真实框的平移和缩放比例,从而在预测中使得默认框趋近于预测框)
即给定(Px,Py,Pw,Ph)寻找一种映射ff, 使得f(Px,Py,Pw,Ph)=(Gx^,Gy^,Gw^,Gh^),并且(Gx^,Gy^,Gw^,Gh^)≈(Gx,Gy,Gw,Gh))
原理:平移+尺度放缩:
平移量(tx,ty) 和尺度缩放(tw,th)如下:
tx=(Gx−Px)/Pw
ty=(Gy−Py)/Ph
tw=log(Gw/Pw)
th=log(Gh/Ph)
边框回归的目的
如何做边框回归
输入
输出
学习的目的以及损失函数
疑问1
解答疑问
当边框相差过大的时候就不是线性模型能够解决的了,所以边框回归只能用于进行“微调”
为什么边框回归只能用于进行微调
尺度不变形:(仅关注只提取关键点点附近矩形区域的sample,即无论多大像素的同一张图片,其在关键点一定区域内都会出现极值(即,关注梯度的变化,边缘的变化))
总结:无论尺度变化,关键点附近一定会出现极值
下面直观的看一系列不同scale的LoG作用在图像上一个角点会出现什么情况:
随着作用的scale增大,这一点的灰度值都出现了一个峰值。这就是尺度函数的精华所在,我们称之为scale signature。虽然这两张图样,初始尺度不一但是它们都在某个scale下出现了极值。那么被不同scale 的 LoG选出来的点有什么特性呢?
LoG长这个样子:
中间凸起的区域真是被LoG选中起作用的点,当scale变化时,被选中的范围是这么变的:
举个例子,有一条边缘曲线,全局看过去的时候是这样的:
我们用不同的圈去框那个角点,也就是不同尺度作用在图像上,在红色框时灰度值达到最大值。现在我们将图像放大,继续用不同的圈去框那个角点:
这样在红色大框下达到最大值,最重要的一点是:这两个框框出来的图像信息其实是一样的,只是原图尺寸不一样,导致达到极值时需要的框不一样大!
比如说一张美女图片,想要框出帽子的信息,图像尺寸小时框要这么大:
图像尺寸大时,框也要相应调大:
发布评论