Разработали OCR-платформу для автоматического распознавания паспортных данных в FinTech-инфраструктуре клиента. Ранее компания использовала сторонние OCR-сервисы, что приводило к высоким регулярным затратам, зависимости от провайдеров и ограниченной гибкости. Цель — создать собственное решение с высокой точностью, масштабируемостью и полным контролем над конфиденциальными данными.
Мы реализовали ML-пайплайн с предобработкой изображений (коррекция поворота и перспективы, нормализация освещения, подавление шумов), детекцией текстовых областей и распознаванием ключевых полей документа. Модели обучались с учетом реальных сценариев: фото паспортов с мобильных устройств, искажения, разные условия съемки.
Сервис построен на stateless-архитектуре и интегрирован во внутренние системы через REST API. Распознанные данные проходят очистку и валидацию, после чего передаются в бизнес-процессы. Изображения и персональные данные не сохраняются, что повышает уровень безопасности.
Команда: project manager, ML-инженер, QA. Срок разработки — 2 месяца.
Результат: снижение затрат на внешние OCR-сервисы, рост точности и стабильности распознавания, увеличение скорости обработки документов и полный контроль над чувствительными данными. Решение масштабируется и легко адаптируется под новые форматы документов и требования бизнеса.
Подробнее о кейсе: https://2people.io/cases/ocr_passports