+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новини

Нова нейронна мережа Convolutional neural networks CNN Google значно точніше і швидше, ніж популярні аналоги

Нова нейронна мережа Convolutional neural networks CNN Google значно точніше і швидше, ніж популярні аналоги

Згорткові нейронні мережі (англ. Convolutional neural networks — CNN), натхненні біологічними процесами в зоровій корі людини, добре підходять для таких завдань, як розпізнавання об'єктів та осіб, але підвищення точності їхньої роботи потребує стомливого та тонкого настроювання. Ось чому вчені з дослідницького відділу Google AI вивчають нові моделі, які «масштабують» CNN «структурованішим» способом. Результат своєї роботи вони опублікували в статті «EfficientNet: переосмислення масштабування моделей для згорткових нейронних мереж», розміщеної на науковому порталі Arxiv.org, а також у публікації у своєму блозі. Співавтори стверджують, що сімейство систем штучного інтелекту, назва EfficientNets, що перевищує точність стандартних CNN і підвищує ефективність нейронної мережі до 10 разів.

«Звичайна практика масштабування моделей полягає у довільному збільшенні глибини або ширини CNN, а також використанні більшої роздільної здатності вхідного зображення для навчання та оцінки», — пишуть штатний інженер-програміст і провідний науковець у Google AI. «На відміну від традиційних підходів, які довільно масштабують параметри мережі, такі як ширина, глибина та роздільна здатність, наш метод рівномірно масштабує кожен вимір з фіксованим набором коефіцієнтів масштабування».

Для подальшого підвищення продуктивності дослідники виступають за використання нової базової мережі - мобільного інвертованого згортки вузького місця (англ. mobile inverted bottleneck convolution - MBConv), яка є основою для сімейства моделей EfficientNets.

У тестах EfficientNets продемонструвало як більш високу точність, так і кращу ефективність порівняно з існуючими CNN, на порядок зменшивши вимогу до розміру параметрів та обчислювальних ресурсів. Одна з моделей - EfficientNet-B7, продемонструвала в 8,4 рази менший розмір і в 6,1 разу кращу продуктивність, ніж відома CNN Gpipe, а також досягла 84,4% та 97,1% точності (Топ-1 та Топ- 5 результат) у тестуванні на наборі ImageNet. У порівнянні з популярною CNN ResNet-50, інша модель EfficientNet - EfficientNet-B4, використовуючи аналогічні ресурси, продемонструвала точність у 82,6% проти 76,3% у ResNet-50.

Моделі EfficientNets добре показали себе і на інших наборах даних, досягнувши високої точності у п'яти з восьми тестів, включаючи набори CIFAR-100 (точність 91,7 %) та Flowers (98,8 %).

«Забезпечуючи значні покращення ефективності нейронних моделей, ми очікуємо, що EfficientNets потенційно може стати новою основою для майбутніх завдань у галузі комп'ютерного зору».

Вихідний код та навчальні сценарії для хмарних тензорних процесорів (TPU) від Google знаходяться у вільному доступі на Github.

Інші новини

Найкраща ціна