Деперсонализатор
Деперсонализация (обезличивание) - процесс разделения скана документа на части (поля) и передача полей на распознавание в таком составе и последовательности, при которых восстановить документ практически невозможно.
Это дополнительный модуль, который устанавливается в контур клиента и обеспечивает сегментирование изображений перед отправкой их в CORRECT: Сервис распознавания документов.
Как это работает
- система клиента отправляет документы в деперсонализатор;
- все документы разрезаются на поля;
- поля перемешиваются между собой и всеми документами;
- добавляются «мусорные поля», которые не относятся к какому-то реальному документу, дополнительно используются специальные алгоритмы для защиты от восстановления документа по распознаваемым страницам;
- формируются изображения с набором полей. Информация о том, на каких страницах размещены поля документа, содержится только в модуле деперсонализатора;
- созданные изображения отправляются на сервис распознавания;
- сервис распознавания извлекает информациюи и возвращает результат распознавания в модуль деперсонализатора;
- деперсонализатор получает результаты распознавания и формирует результат распознавания всего документа «склеивая» полученные данные по полям;
- результат передается в систему клиента.
Для примера, паспорт разделяется на отдельные поля: Фамилия, Имя, Отчество, Номер паспорта, Серия паспорта, Дата выдачи, Дата рождения и т.д.
Система клиента взаимодействует с удаленным Сервисом CORRECT через Деперсонализатор, находящийся в инфраструктуре (на вычислительных мощностях) клиента.
Использование деперсонализатора возможно в любом вариантов поставки сервиса для обработки персональных документов.