Анонсирована система искусственного интеллекта Hieroglyph, позволяющая настроить распознавание любых удостоверяющих документов
Анонсирована система искусственного интеллекта Hieroglyph, позволяющая настроить распознавание любых удостоверяющих документов
Hieroglyph — система искусственного интеллекта, предназначенная для распознавания любых используемых в мире удостоверяющих документов.
В основе Hieroglyph лежат собственные научные разработки компании в области зрительного интеллекта. Для решения задач детекции, классификации и распознавания большого количества типов документов в Hieroglyph применяются глубокие целочисленные нейронные сети.
Технология вычислительно эффективной зрительной памяти в Hieroglyph, в свою очередь, основана на построении для изображений компактных описаний, инвариантных к яркостным и пространственным искажениям (включая проективные) в виде векторов многомерного метрического пространства. Это особенно важно для получения высокого качества распознавания при работе с видеопотоком в мобильных приложениях при неизвестном освещении.
Реализованная в Hieroglyph технология синтеза выборок для обучения нейронных сетей позволяет добавлять распознавания новых типов документов, имея всего 2 изображения этого типа документа. Одно — для обучения системы, а второе — для проверки результата.
Smart Engines представила технологию распознавания иероглифов. Ее разработка стала возможна благодаря применению глубоких разреженных дискретных нейронных сетей, которые позволяют распознавать свыше 45 000 иероглифов на документах со сложным фоном и при различных условиях освещения. Из них 20 941 китайский, 12 912 японских и 11 172 корейских иероглифов.
Как сообщили в Smart Engines, представленная функциональность интегрирована в систему искусственного интеллекта Hieroglyph, которая на уровне платформы поддерживает распознавание 800+ типов удостоверяющих документов на более чем 40 языках. Это ID-карты, паспорта, водительские права, визы и другие документы более 170 стран мира. Распознавание иероглифической письменности позволило расширить потенциальную пользовательскую аудиторию продуктов Smart Engines более чем на 1,5 млрд человек.
Распознавание иероглифов является сложной научно-технической задачей, в которой разработчики искусственного интеллекта имеют дело с десятками тысяч символов, многие из которых незначительно отличаются друг от друга. В процессе разработки специалисты Smart Engines смогли преодолеть важный технологический барьер и перейти от методов классических OCR, рассчитанных на распознавание символов на белом фоне на качественных сканах, к компьютерному зрению, способному распознавать иероглифы даже в удостоверениях личности в видеопотоке и на фотографиях.
«К сложному устройству самих иероглифов в нашем случае добавляются визуальные помехи, вызванные наличием на изображении фона у документа, и искажения, обусловленные разной яркостью освещения и ракурсом съемки. Нам удалось создать специальную архитектуру нейронных сетей, которая обеспечивает быстродействие и качество распознавания иероглифов в документах на уровне символов латинского алфавита и кириллицы»
Со слов разработчика, представленная технология предназначена для использования в процессах регистрации, идентификации и верификации пользователей в мобильных приложениях и интернет-сервисах банковского сектора, страхования, финтеха, шеринговой экономики, транспорта, телекома и др. По информации на март 2019 года разработчикам доступны библиотеки распознавания удостоверяющих документов Китая, Гонконга, Японии и Кореи для iOS, Android, Linux, Windows, macOS и Solaris. Протестировать распознавание китайских, японских и корейских иероглифов в видеопотоке и на фотографиях можно установив бесплатное демонстрационное приложение Smart IDReader из Google play или App Store.