+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новости

Команда Google AI рассказала о новом алгоритме AutoAugment, который дополняет данные для обучения моделей компьютерного зрения изображениями, созданными на основе существующих

Команда Google AI рассказала о новом алгоритме AutoAugment, который дополняет данные для обучения моделей компьютерного зрения изображениями, созданными на основе существующих. Система трансформирует картинки путем отражения, обрезания или изменения цвета. Это позволяет увеличивать объем тренировочных наборов без добавления новых данных.

Качество работы интеллектуальной системы напрямую зависит от количества и разнообразия данных, на которых ее обучали. Однако собрать достаточно широкие наборы бывает сложно. Один из способов преодолеть этот барьер — жестко прописать правила изменения изображения, чтобы на основе одного создать несколько: перевернутую или симметрично отраженную копию.

Специалистам Google AI удалось с помощью обучения с подкреплением создать алгоритм, самостоятельно определяющий правила, по которым необходимо изменить то или иное изображение, чтобы получить уникальное и при этом не исказить его.

Google отмечает, что некоторые правила очевидны для человека, а до других додуматься сложно. В пример приводится метод mixup, когда нейросеть анализирует пару изображений, в которой одно располагается над другим.

AutoAugment умеет отражать изображения по вертикали и горизонтали, поворачивать, менять цвет и так далее. Кроме того, алгоритм комбинирует правила преобразования, а также предотвращает создание копий с одинаковыми изменениями

Система учитывает и специфику конкретного набора. В случае изображений с номерами домов (набор SVHN) она использует геометрические преобразования, к примеру, сдвиг, а также изменение цвета. Похожие картинки встречаются и в самом наборе.

В наборах CIFAR-10 и ImageNet AutoAugment не пользуется сдвигом и полным изменением цвета — это может привести к созданию нереалистичных фотографий. Вместо этого алгоритм, сохраняя основную цветовую гамму, немного корректирует оттенки.

В качестве теста специалисты Google обучали распознающую нейросеть, дополняя набор данными с помощью своего алгоритма. Для ImageNet получили новый рекорд точности — 83,54 %. На CIFAR10 уровень ошибок составил 1,48 %, что на 0,83 % лучше, чем показатель других алгоритмов расширения наборов. В отношении SVHN AutoAugment помог уменьшить процент ошибок с 1,3 % до 1,02 %.

 

 

 

 

Другие новости

Лучшая цена