一文读懂few
前提: 有一点代码基础,理解数据的维度。
目的: 用少量的样本训练模型,使模型具备分类能力。
数据集CUB: 200类,100 base class(训练集),50 valid class,50 novel class(测试集)。
训练方法:
1:直接用base class训练一个200类别的CNN分类器。
2:meta-learning method(训练和测试保持一致),以5-way 5-shot(从base class中随机取5个类别,每个类别随机取5张图,这里25张图片为support set)为例,假设query set 有16张图片(5个类别剩余的其他图片)。输入网络的数据为(5-way,5-shot+16,3,h,w)=(5,21,3,h,w),然后放入CNN中得到support set的特征(5,5,1600)和query set的特征(5,16,1600),接下来平均support set中每个类每张图片的特征mean((5,5,1600),dim=1)=(5,1600),reshape query set=(80,1600),最后计算两个set的距离得到(80,5)维向量,这可以表示query set中每张图片与support set中哪张图片比较相似,然后用一下交叉熵损失即可。【meta-training task】
note:每次随机取的五个类,重新定义标签为[0,1,2,3,4],所以才可以对(80,5)使用交叉熵损失。base class中的support set和query set都拿来训练,只是最后计算损失时,分开计算它们之间的距离。
验证:
简单的同训练方法1,直接把所有测试集valid class放进网络查看分类精度。
测试:
训练完网络后,得到特征提取器(backbone),固定其权重,把novel class放入其中得到每张图片的特征,假设每张图片1600维。【 接下来,从novel class中随机取5类,每类里面取5张图片5-way 5-shot(support set)和16张图片(query set),得到(5x(5+16),1600)=(5x5,1600)+(5x16,1600),把support set(25,1600)放入一层的分类器中分类,训练100个epoch,最后把query set(80,1600)放入测试得到结果。】【称为一个episode,要测试几百个episode取平均】【meta-test task】。这里你也许有疑问,这样训练(fine-tune)不是测试集也进行拟合了吗,其实每个meta-test task中的那层分类器都是重新定义的。
点个赞哦,亲(づ ̄3 ̄)づ╭❤~
一文读懂few
前提: 有一点代码基础,理解数据的维度。
目的: 用少量的样本训练模型,使模型具备分类能力。
数据集CUB: 200类,100 base class(训练集),50 valid class,50 novel class(测试集)。
训练方法:
1:直接用base class训练一个200类别的CNN分类器。
2:meta-learning method(训练和测试保持一致),以5-way 5-shot(从base class中随机取5个类别,每个类别随机取5张图,这里25张图片为support set)为例,假设query set 有16张图片(5个类别剩余的其他图片)。输入网络的数据为(5-way,5-shot+16,3,h,w)=(5,21,3,h,w),然后放入CNN中得到support set的特征(5,5,1600)和query set的特征(5,16,1600),接下来平均support set中每个类每张图片的特征mean((5,5,1600),dim=1)=(5,1600),reshape query set=(80,1600),最后计算两个set的距离得到(80,5)维向量,这可以表示query set中每张图片与support set中哪张图片比较相似,然后用一下交叉熵损失即可。【meta-training task】
note:每次随机取的五个类,重新定义标签为[0,1,2,3,4],所以才可以对(80,5)使用交叉熵损失。base class中的support set和query set都拿来训练,只是最后计算损失时,分开计算它们之间的距离。
验证:
简单的同训练方法1,直接把所有测试集valid class放进网络查看分类精度。
测试:
训练完网络后,得到特征提取器(backbone),固定其权重,把novel class放入其中得到每张图片的特征,假设每张图片1600维。【 接下来,从novel class中随机取5类,每类里面取5张图片5-way 5-shot(support set)和16张图片(query set),得到(5x(5+16),1600)=(5x5,1600)+(5x16,1600),把support set(25,1600)放入一层的分类器中分类,训练100个epoch,最后把query set(80,1600)放入测试得到结果。】【称为一个episode,要测试几百个episode取平均】【meta-test task】。这里你也许有疑问,这样训练(fine-tune)不是测试集也进行拟合了吗,其实每个meta-test task中的那层分类器都是重新定义的。
点个赞哦,亲(づ ̄3 ̄)づ╭❤~
发布评论