Опубліковані результати MLPerf HPC 1.0, набору галузевих тестів для оцінки продуктивності машинного навчання
Нові бенчмарки MLPerf зосереджені на обчисленнях, які прискорюють і доповнюють моделювання на основі штучного інтелекту на суперкомп'ютерах. Системи на базі рішень NVIDIA виграли чотири з п'яти тестів MLPerf HPC 1.0.
За даними компанії, останні досягнення в молекулярній динаміці, астрономії та моделюванні клімату стали можливими завдяки спільному використанню HPC і AI. Ця тенденція сприяє впровадженню систем ШІ класу exascale (в даному випадку мова йде про обчислення зниженою точності) як в науці, так і в промисловості.
Тести MLPerf підтримуються MLCommons, галузевою групою, до складу якої входять Alibaba, Google, Intel, Meta, NVIDIA і т.д. Бенчмарки MLPerf HPC включають в себе два види тестів. Перший вимірює час, необхідний для навчання моделі (сильне масштабування, сильне масштабування), другий - загальну пропускну здатність системи, тобто скільки моделей можна навчити за заданий проміжок часу.
У першому варіанті випробувань в порівнянні з кращими результатами в MLPerf 0,7 в минулому році NVIDIA поліпшила результати в тесті CosmoFlow (обробка знімків з телескопів), а в DeepCam (виявлення ураганів і повітряних потоків) - майже в 7 разів. А суперкомп'ютер Perlmutter лідирує в бенчмарку opencatalyst (відстежуючи, наскільки добре прогнозуються міжмолекулярні взаємодії) за допомогою прискорювачів NVIDIA A100 2048.
У тестах другого типу NVIDIA лідирує в DeepCam - 16 вузлів на одну роботу і 256 одночасних завдань. Всі випробування проводилися на NVIDIA Selene, власній системі NVIDIA і найбільшому в світі промисловому суперкомп'ютері. Nvidia DALI (Прискорення даних) і графіки CUDA (зменшення затримки для невеликих частин даних для ефективного масштабування до 1024 і більше прискорювачів) використовувалися для профілювання робочих навантажень.
Компанія також використовувала NVIDIA SHARP, ключовий компонент NVIDIA MagnumIO, для прискорення обміну даними та завантаження даних у мережу комутатора NVIDIA Quantum InfiniBand. Всі ці кошти не закриті. Все програмне забезпечення для проведення самих тестів доступно в репозиторії MLPerf. NVIDIA також регулярно оновлює необхідні компоненти в своєму каталозі NGC.
Всього в цьому раунді MLPerf HPC сім з восьми учасників використовували прискорювачі NVIDIA. Серед них німецький суперкомп'ютерний центр Jülich Supercomputing Centre, Швейцарський національний обчислювальний центр, а також Аргоннська національна лабораторія і Національна лабораторія Лоуренса, Національний центр додатків для суперкомп'ютерів і Техаський центр передових обчислень в США. У компанії зазначили, що хороші результати в тестах є результатом зрілості апаратної та AI-платформи NVIDIA.