Shortcuts

教程 2:自定义数据管道

  • 教程 2:自定义数据管道

    • Pipeline 概览

    • Pipeline 中创建新的数据增强

Pipeline 概览

DataSourcePipelineDataset 的两个重要组件。我们已经在 add_new_dataset 中介绍了 DataSourcePipeline 负责对图像进行一系列的数据增强,例如随机翻转。

这是用于 SimCLR 训练的 Pipeline 的配置示例:

train_pipeline = [
    dict(type='RandomResizedCrop', size=224),
    dict(type='RandomHorizontalFlip'),
    dict(
        type='RandomAppliedTrans',
        transforms=[
            dict(
                type='ColorJitter',
                brightness=0.8,
                contrast=0.8,
                saturation=0.8,
                hue=0.2)
        ],
        p=0.8),
    dict(type='RandomGrayscale', p=0.2),
    dict(type='GaussianBlur', sigma_min=0.1, sigma_max=2.0, p=0.5)
]

Pipeline 中的每个增强都接收一张图像作为输入,并输出一张增强后的图像。

Pipeline 中创建新的数据增强

1.在 transforms.py 中编写一个新的数据增强函数,并覆盖 __call__ 函数,该函数接收一张 Pillow 图像作为输入:

@PIPELINES.register_module()
class MyTransform(object):

    def __call__(self, img):
        # apply transforms on img
        return img

2.在配置文件中使用它。我们重新使用上面的配置文件,并在其中添加 MyTransform

train_pipeline = [
    dict(type='RandomResizedCrop', size=224),
    dict(type='RandomHorizontalFlip'),
    dict(type='MyTransform'),
    dict(
        type='RandomAppliedTrans',
        transforms=[
            dict(
                type='ColorJitter',
                brightness=0.8,
                contrast=0.8,
                saturation=0.8,
                hue=0.2)
        ],
        p=0.8),
    dict(type='RandomGrayscale', p=0.2),
    dict(type='GaussianBlur', sigma_min=0.1, sigma_max=2.0, p=0.5)
]
Read the Docs v: latest
Versions
latest
Downloads
pdf
html
epub
On Read the Docs
Project Home
Builds

Free document hosting provided by Read the Docs.