NVIDIA представила на конференції Microsoft Ignite 2023 сервіс NVIDIA AI Foundry
NVIDIA представила на конференції Microsoft Ignite 2023 сервіс NVIDIA AI Foundry
NVIDIA AI Foundry дозволить підприємствам прискорити розробку та налаштування користувацьких додатків генеративного ІІ з використанням власних даних, що розгортаються у хмарі Microsoft Azure.
NVIDIA AI Foundry поєднує три елементи: набір базових моделей NVIDIA AI Foundation, платформу та інструменти NVIDIA NeMo, а також суперкомп'ютерні сервіси NVIDIA DGX Cloud AI. Разом вони надають підприємствам комплексне рішення для створення користувацьких моделей генеративного ІІ. Компанії зможуть потім розгортати свої індивідуальні моделі за допомогою платформи NVIDIA AI Enterprise для створення програм ІІ, включаючи інтелектуальний пошук, узагальнення та генерацію контенту.
«Підприємствам потрібні кастомні моделі для реалізації спеціалізованих навичок, заснованих на власній ДНК їхньої компанії — їхніх даних, — повідомив голова NVIDIA Дженсен Хуанг (Jensen Huang), — Сервіс NVIDIA AI Foundry поєднує в собі наші технології моделей генеративного ІІ, досвід навчання LLM та гігантську фабрику ІІ. Ми створили це в Microsoft Azure, щоб підприємства по всьому світу могли підключити свою власну модель до хмарних сервісів Microsoft, що ведуть у світі».
Сервіс NVIDIA AI Foundry можна використовувати для налаштування моделей для програм на базі генеративного ІІ в різних галузях, включаючи корпоративне програмне забезпечення, телекомунікації та медіа. При розгортанні компанії зможуть використовувати метод генерації з розширеним пошуком (RAG), щоб прив'язати свої моделі до бази корпоративних даних для отримання актуальних відповідей.
У сервісі NVIDIA Foundry клієнти зможуть вибирати з кількох моделей NVIDIA AI Foundation, включаючи нове сімейство Nemotron-3 8B у складі каталогу моделей Azure AI. Розробники також можуть отримати доступ до моделей Nemotron-3 8B у каталозі NVIDIA NGC та до популярних моделей Llama 2, Mistral та Stable Diffusion XL. NVIDIA повідомила, що одним з перших новим сервісом для створення моделей скористалися SAP, Amdocs та Getty Images.
Нарешті, в Azure стала доступна і платформа NVIDIA DGX Cloud AI, в рамках якої клієнти зможуть орендувати кластери, що складаються з тисяч прискорювачів NVIDIA і скористатися NVIDIA AI Enterprise, включаючи NeMo, для прискорення налаштування LLM. Клієнти Azure можуть використовувати існуючі кредити Microsoft Azure Consumption Commitment для прискорення розробки ІІ-моделей.