Azure Cognitive Services Computer Vision OCR получил поддержку 164 языков
Azure Cognitive Services Computer Vision OCR получил поддержку 164 языков
Computer Vision's OCR (Read) API расширяет количество поддерживаемых языков до 164
- Поддержка оптического распознавания символов для печатного текста расширена до 42 новых языков, включая арабский, хинди и другие языки, использующие арабский алфавит и сценарии деванагари.
- Поддержка OCR для рукописного текста распространяется на японский и корейский языки, а также на английский, упрощенный китайский, французский, немецкий, итальянский, португальский и испанский языки.
- Усовершенствования включают улучшенную поддержку извлечения рукописных дат, сумм, имен и полей с одним символом.
- Общие улучшения производительности и качества ИИ.
По умолчанию служба будет использовать последнюю модель общедоступной версии для извлечения текста. Начиная с Read 3,2, model-version
параметр позволяет выбрать между общедоступными и предварительными моделями для заданной версии API. Указанная модель будет использоваться для извлечения текста с операцией чтения.
При использовании операции чтения используйте следующие значения для необязательного model-version
параметра.
Значение | Используемая модель |
---|---|
Не предоставлено | Новейшая модель и языки для общедоступной версии |
последняя | Новейшая модель и языки для общедоступной версии |
2021-09-30 — Предварительная версия | Предварительная версия модели с дополнительными языками и функциями предварительной версии. Включает любые улучшения предыдущей модели общедоступной версии. |
2021-04-12 | общедоступная Дата, в настоящее время то же самое, что и последняя |
Язык ввода
По умолчанию служба извлекает весь текст из изображений или документов, включая смешанные языки. Операция чтения имеет необязательный параметр запроса для языка. Предоставьте код языка только в том случае, если требуется принудительно обработать документ в качестве конкретного языка. В противном случае служба может вернуть неполный и неправильный текст.
API чтения принимает локальные и удаленные изображения. Чтобы передать локальное изображение, поместите двоичные данные этого изображения в текст HTTP-запроса. Чтобы передать удаленное изображение, укажите в тексте запроса его URL-адрес в следующем формате: {"url":"http://example.com/images/test.jpg"}
.
При вызове Read API чтения, в качестве входных данных принимается изображение или документ PDF и из него асинхронно извлекается текст.
https://{endpoint}/vision/v3.2/read/analyze[?language][&pages][&readingOrder]
Вызов возвращается с ответным полем-заголовком под названиемOperation-Location
. Значение Operation-Location
— это URL-адрес, содержащий идентификатор операции, который будет использоваться на следующем шаге.
Instance | Features | Price |
---|---|---|
Free - Web/Container 20 transactions per minute |
5,000 transactions free per month | |
S1 - Web/Container 10 transactions per second |
Tag Face GetThumbnail Color Image Type GetAreaOfInterest |
0-1M transactions - $1 per 1,000 transactions1-10M transactions - $0.65 per 1,000 transactions10-100M transactions - $0.60 per 1,000 transactions100M+ transactions - $0.40 per 1,000 transactions |
S2 - Web/Container | OCR Adult Celebrity Landmark Detect, Objects Brand |
0-1M transactions - $1 per 1,000 transactions1-10M transactions - $0.65 per 1,000 transactions10-100M transactions - $0.60 per 1,000 transactions100M+ transactions - $0.40 per 1,000 transactions |
S3 - Web/Container | Describe+ Read |
0-1M transactions - $1.50 per 1,000 transactions1M+ transactions - $0.60 per 1,000 transactions |
Not available | Spatial analysis | Free during preview |