一个完整的深度学习图像分割例子(三):数据准备

在[项目简介][环境搭建]中我们已经为模型训练做好了准备,但是,接下来,还不能开始训练,我们要完成训练前的一项重要内容:数据预处理。

数据预处理应该属于特征工程的范畴,是人工智能必备的步骤,我们通常将数据划分为训练集,验证集,测试集,训练过程就是让模型从训练集中学习经验,然后在验证集和测试集中评估模型,最终在未见过的数据中评估模型泛化能力,在未见过的数据中模型表现的好才是真好,那如何才能做到呢?目前除了在模型上下功夫外,还有就是从数据上做文章,如何优化模型我们以后再讲,今天我们主要讲数据预处理。

首先就是数据增广,如果模型在训练数据中没见过某种类型的数据,那模型学到的知识就会受限,在未来预测中,当输入这种数据类型时,他还是不认识,所以针对这种情况,我们可以增加训练数据集的分布广度,让训练数据集的分布更加接近真实的数据分布。

在图像领域,常见的数据增广手段包括随机对比度,图像随机缩放,图像水平垂直翻转,图像随机旋转,随机裁剪等等,具体要使用哪种手段要根据实际使用场景来决定,举个例子,自然条件下拍摄的图像,由于拍摄时间的不同,光照条件不同,致使图像对比度不同,我们可以改变对比度来模拟光照变化,医疗图像虽然不会受到自然光的影响,但在不同扫描参数下,图像的对比度也会不同,这时就可以用对比度增强手段模拟不同的扫描参数,还有

一个完整的深度学习图像分割例子(三):数据准备

在[项目简介][环境搭建]中我们已经为模型训练做好了准备,但是,接下来,还不能开始训练,我们要完成训练前的一项重要内容:数据预处理。

数据预处理应该属于特征工程的范畴,是人工智能必备的步骤,我们通常将数据划分为训练集,验证集,测试集,训练过程就是让模型从训练集中学习经验,然后在验证集和测试集中评估模型,最终在未见过的数据中评估模型泛化能力,在未见过的数据中模型表现的好才是真好,那如何才能做到呢?目前除了在模型上下功夫外,还有就是从数据上做文章,如何优化模型我们以后再讲,今天我们主要讲数据预处理。

首先就是数据增广,如果模型在训练数据中没见过某种类型的数据,那模型学到的知识就会受限,在未来预测中,当输入这种数据类型时,他还是不认识,所以针对这种情况,我们可以增加训练数据集的分布广度,让训练数据集的分布更加接近真实的数据分布。

在图像领域,常见的数据增广手段包括随机对比度,图像随机缩放,图像水平垂直翻转,图像随机旋转,随机裁剪等等,具体要使用哪种手段要根据实际使用场景来决定,举个例子,自然条件下拍摄的图像,由于拍摄时间的不同,光照条件不同,致使图像对比度不同,我们可以改变对比度来模拟光照变化,医疗图像虽然不会受到自然光的影响,但在不同扫描参数下,图像的对比度也会不同,这时就可以用对比度增强手段模拟不同的扫描参数,还有