NVIDIA опублікувала вихідні тексти системи машинного навчання SPADE (GauGAN)

+38/050/370-3627
+38/093/220-0872
+38/044/257-2444

Головна › Новини › NVIDIA опублікувала вихідні тексти системи машинного навчання SPADE (GauGAN)

14 квітня 2019

NVIDIA опублікувала вихідні тексти системи машинного навчання SPADE (GauGAN)

NVIDIA опублікувала вихідні тексти системи машинного навчання SPADE (GauGAN), що дозволяє синтезувати реалістичні пейзажі на основі грубих начерків, а також пов'язані з проектом натреновані моделі. Система була продемонстрована в березні на конференції GTC 2019, але код було опубліковано лише вчора. Напрацювання відкриті під невільною ліцензією CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), що допускає використання лише з некомерційною метою. Код написаний мовою Python із застосуванням фреймворку PyTorch.

Малюнки оформляються у вигляді сегментованої карти, що визначає розміщення приблизних об'єктів на сцені. Характер об'єктів, що генеруються, задається за допомогою колірних міток. Наприклад, блакитна заливка перетворюється на небо, синя у воду, темно-зелена на дерева, світло-зелена на траву, світло-коричнева на каміння, темно-коричнева на гори, сіра на сніг, коричнева лінія перетворюється на дорогу, а синя лінія на річку. Додатково на основі вибору еталонних зображень визначається загальний стиль композиції та доба. Пропонований інструмент для створення віртуальних світів може виявитися корисним широкому колу фахівців, від архітекторів та планувальників міського середовища до розробників ігор та ландшафтних дизайнерів.

Об'єкти синтезуються генеративно-змагальною нейронною мережею (GAN), яка на основі схематичної сегментованої карти створює реалістичні зображення, запозичуючи деталі з моделі, попередньо навченої на кілька мільйонів фотознімків. На відміну від систем синтезу зображень, що раніше розвивалися, запропонований метод заснований на застосуванні адаптивного просторового перетворення з наступною трансформацією з урахуванням машинного навчання. Обробка сегментованої карти замість семантичної розмітки дозволяє досягти точної відповідності результату та контролювати стиль.

Для досягнення реалістичності застосовуються дві конкуруючі один з одним нейронні мережі: генератор і дискримінатор (Discriminator). Генератор формує зображення з урахуванням змішування елементів реальних фотографій, а дискримінатор виявляє можливі відхилення від реальних зображень. У результаті формується зворотний зв'язок, на основі якого генератор починає компонувати все більш якісні зразки, доки дискримінатор не перестане відрізняти їх від справжніх.

Інші новини

Найкраща ціна

Chaos Group
VRScans

4 514.00 грн

Chaos Group
VRScans

5 016.00 грн

Chaos Group
VRScans

9 576.00 грн

Авторизація

Реєстрація

Нагадати пароль