Azure Cognitive Services Computer Vision OCR получил поддержку 164 языков
Computer Vision's OCR (Read) API расширяет количество поддерживаемых языков до 164
- Поддержка оптического распознавания символов для печатного текста расширена до 42 новых языков, включая арабский, хинди и другие языки, использующие арабский алфавит и сценарии деванагари.
- Поддержка OCR для рукописного текста распространяется на японский и корейский языки, а также на английский, упрощенный китайский, французский, немецкий, итальянский, португальский и испанский языки.
- Усовершенствования включают улучшенную поддержку извлечения рукописных дат, сумм, имен и полей с одним символом.
- Общие улучшения производительности и качества ИИ.
По умолчанию служба будет использовать последнюю модель общедоступной версии для извлечения текста. Начиная с Read 3,2, model-version
параметр позволяет выбрать между общедоступными и предварительными моделями для заданной версии API. Указанная модель будет использоваться для извлечения текста с операцией чтения.
При использовании операции чтения используйте следующие значения для необязательного model-version
параметра.
Значение | Используемая модель |
---|---|
Не предоставлено | Новейшая модель и языки для общедоступной версии |
последняя | Новейшая модель и языки для общедоступной версии |
2021-09-30 — Предварительная версия | Предварительная версия модели с дополнительными языками и функциями предварительной версии. Включает любые улучшения предыдущей модели общедоступной версии. |
2021-04-12 | общедоступная Дата, в настоящее время то же самое, что и последняя |
Язык ввода
По умолчанию служба извлекает весь текст из изображений или документов, включая смешанные языки. Операция чтения имеет необязательный параметр запроса для языка. Предоставьте код языка только в том случае, если требуется принудительно обработать документ в качестве конкретного языка. В противном случае служба может вернуть неполный и неправильный текст.
API чтения принимает локальные и удаленные изображения. Чтобы передать локальное изображение, поместите двоичные данные этого изображения в текст HTTP-запроса. Чтобы передать удаленное изображение, укажите в тексте запроса его URL-адрес в следующем формате: {"url":"http://example.com/images/test.jpg"}
.
При вызове Read API чтения, в качестве входных данных принимается изображение или документ PDF и из него асинхронно извлекается текст.
https://{endpoint}/vision/v3.2/read/analyze[?language][&pages][&readingOrder]
Вызов возвращается с ответным полем-заголовком под названиемOperation-Location
. Значение Operation-Location
— это URL-адрес, содержащий идентификатор операции, который будет использоваться на следующем шаге.
Instance | Features | Price |
---|---|---|
Free - Web/Container 20 transactions per minute |
5,000 transactions free per month | |
S1 - Web/Container 10 transactions per second |
Tag Face GetThumbnail Color Image Type GetAreaOfInterest |
0-1M transactions - $1 per 1,000 transactions1-10M transactions - $0.65 per 1,000 transactions10-100M transactions - $0.60 per 1,000 transactions100M+ transactions - $0.40 per 1,000 transactions |
S2 - Web/Container | OCR Adult Celebrity Landmark Detect, Objects Brand |
0-1M transactions - $1 per 1,000 transactions1-10M transactions - $0.65 per 1,000 transactions10-100M transactions - $0.60 per 1,000 transactions100M+ transactions - $0.40 per 1,000 transactions |
S3 - Web/Container | Describe+ Read |
0-1M transactions - $1.50 per 1,000 transactions1M+ transactions - $0.60 per 1,000 transactions |
Not available | Spatial analysis | Free during preview |