+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новости

Inspire 2023: Microsoft анонсировала ряд новых технологий искусственного интеллекта для облачной платформы Azure

Inspire 2023: Microsoft анонсировала ряд новых технологий искусственного интеллекта для облачной платформы Azure

Объявлено о предстоящем выходе системы распознавания речи OpenAI Whisper. Модель OpenAI Whisper обеспечивает точную транскрипцию человеческой речи на 57 языках и перевод на английский язык. Она также создаёт стенограммы с улучшенной читабельностью. В числе преимуществ использования модели OpenAI Whisper в Azure компания назвала безопасность корпоративного уровня, элементы управления конфиденциальностью и возможности обработки данных, которые позволяют создавать настраиваемые решения в соответствии с конкретными потребностями бизнеса.

Служба Azure OpenAI позволяет разработчикам запускать модель OpenAI Whisper в Azure, отражая API-интерфейс OpenAI Whisper по функциям и функциям, включая возможности транскрипции и перевода.
 
API-интерфейсы REST модели Whisper для расшифровки и перевода будут доступны на портале службы Azure OpenAI.
 
В Azure AI Speech пользователи смогут использовать модель OpenAI Whisper для пакетной транскрипции, чтобы легко транскрибировать большие объемы аудиоконтента в нужном масштабе. Эта возможность особенно полезна для обработки обширных коллекций аудиоданных, хранящихся на платформе Azure.
 
Пользователи Whisper в Azure AI Speech смогут воспользоваться нашими существующими функциями, в том числе асинхронной обработкой, диаризацией говорящего, настройкой и большими размерами файлов. Azure AI Speech улучшает транскрипцию Whisper, позволяя использовать файлы размером до 1 ГБ, а также возможность обрабатывать большие объемы файлов, позволяя пакетировать до 1000 файлов в одном запросе. Кроме того, при использовании Azure AI Speech результат распознавания будет включать временные метки на уровне слов, предоставляя возможность определить, где в аудио было произнесено каждое слово. Диаризация говорящих — еще одна полезная функция Azure AI Speech, которая идентифицирует отдельных говорящих в аудиофайле и помечает сегменты их речи. Эта функция позволяет клиентам различать говорящих, точно расшифровывая их слова, и создавать более организованную и структурированную расшифровку аудиофайлов.
 
Vector search in Azure Cognitive Search - это метод поиска информации в различных типах данных, включая изображения, аудио, текст, видео и многое другое. Он определяет результаты поиска на основе сходства числовых представлений данных. В отличие от подбора ключевых слов, Vector Search сравнивает векторное представление запроса и содержимого, чтобы найти релевантные результаты для пользователей.
 
Доступный в режиме превью через Azure Cognitive Search, Vector Search использует с целью ускорения поиска машинное обучение для определения значения и контекста неструктурированных данных, включая изображения и текст. Microsoft отметила, что Vector Search можно использовать в приложениях и сервисах для генерации персонализированных ответов на естественном языке, предоставления рекомендаций по продуктам и выявления закономерностей данных.
 
«Vector Search интегрированный с Azure AI, позволяет клиентам создавать приложения на основе чата с поддержкой поиска, преобразовывать изображения в векторные представления с помощью Azure AI Vision и извлекать соответствующую информацию из больших наборов данных, чтобы автоматизировать процессы, — пишет компания в блоге. — Интеграция Vector Search плавно распространяется на другие возможности Azure Cognitive Search».
 
Сервис Document Generative AI на основе Azure AI Document Intelligence (ранее Azure Form Recognizer) и Azure OpenAI Service, который позволит «общаться» со документами в чате, создавать из них увлекательный контент и использовать возможности моделей Azure OpenAI для имеющихся данных. Беспрепятственное взаимодействие с документами на естественном языке позволит легко находить ответы и получать ценную информацию. Сервис поддерживает несколько типов документов, оптическое распознавание символов (с исправлением ошибок на основе ИИ) и извлечение информации.
 
Также обеспечивается конфиденциальность информации, то есть пользователь может быть уверенными, что его данные останутся изолированными и под его контролем. Кроме того, сервис обеспечивает масштабируемость: документы могут быть как небольшими, так и огромными, а библиотека документов может быть корпоративного масштаба.

Другие новости