+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новини

Команда Google AI розповіла про новий алгоритм AutoAugment, який доповнює дані для навчання моделей комп'ютерного зору зображеннями, створеними на основі наявних

Команда Google AI розповіла про новий алгоритм AutoAugment, який доповнює дані для навчання моделей комп'ютерного зору зображеннями, створеними на основі існуючих. Система трансформує зображення шляхом відображення, обрізання або зміни кольору. Це дозволяє збільшувати обсяг тренувальних наборів без додавання нових даних.

Якість роботи інтелектуальної системи безпосередньо залежить від кількості та різноманіття даних, на которих її навчали. Однак, зібрати досить широкі набори буває складно. Один із способів подолати цей бар'єр — жорстко прописати правила зміни зображення, щоб на основі одного створити кілька: перевернуту або симетрично відбиту копію.

Фахівцям Google AI вдалося за допомогою навчання з підкріпленням створити алгоритм, що самостійно визначає правила, за яким необхідно змінити те чи інше зображення, щоб отримати унікальне і при цьому не спотворити його.

Google зазначає, що деякі правила очевидні для людини, а до інших додуматися складно. В приклад наводиться метод mixup, коли нейромережа аналізує пару зображень, в якій одне розташовується над іншим.

AutoAugment вміє відображати зображення по вертикалі та горизонталі, повертати, змінювати колір і так далі. Крім того, алгоритм комбінує правила перетворення, а також запобігає створенню копій з однаковими змінами.

Система враховує і специфіку конкретного набору. У випадку зображень з номерами будинків (набір SVHN) вона використовує геометричні перетворення, наприклад, зсув, а також зміна кольору. Схожі картинки зустрічаються і в самому наборі.

У наборах CIFAR-10 і ImageNet AutoAugment не користується зсувом і повною зміною кольору — це може призвести до створення нереалістичних фотографій. Натомість алгоритм, зберігаючи основну колірну гаму, трохи коригує відтінки.

У якості тесту фахівці Google навчали розпізнавальну нейромережу, доповнюючи набір даними за допомогою свого алгоритму. Для ImageNet отримали новий рекорд точності - 83,54%. На CIFAR10 рівень помилок склав 1,48%, що на 0,83% краще, ніж показник інших алгоритмів розширення наборів. У відношенні SVHN AutoAugment допоміг зменшити відсоток помилок з 1,3% до 1,02%.

 

 

 

 

Інші новини

Найкраща ціна