Перейти к основному содержимому

Деперсонализатор

Деперсонализация (обезличивание) - процесс разделения скана документа на части (поля) и передача полей на распознавание в таком составе и последовательности, при которых восстановить документ практически невозможно.

Это дополнительный модуль, который устанавливается в контур клиента и обеспечивает сегментирование изображений перед отправкой их в CORRECT: Сервис распознавания документов.

Как это работает

  • система клиента отправляет документы в деперсонализатор;
  • все документы разрезаются на поля;
  • поля перемешиваются между собой и всеми документами;
  • добавляются «мусорные поля», которые не относятся к какому-то реальному документу, дополнительно используются специальные алгоритмы для защиты от восстановления документа по распознаваемым страницам;
  • формируются изображения с набором полей. Информация о том, на каких страницах размещены поля документа, содержится только в модуле деперсонализатора;
  • созданные изображения отправляются на сервис распознавания;
  • сервис распознавания извлекает информациюи и возвращает результат распознавания в модуль деперсонализатора;
  • деперсонализатор получает результаты распознавания и формирует результат распознавания всего документа «склеивая» полученные данные по полям;
  • результат передается в систему клиента.

Для примера, паспорт разделяется на отдельные поля: Фамилия, Имя, Отчество, Номер паспорта, Серия паспорта, Дата выдачи, Дата рождения и т.д.

о программе

Система клиента взаимодействует с удаленным Сервисом CORRECT через Деперсонализатор, находящийся в инфраструктуре (на вычислительных мощностях) клиента.

Использование деперсонализатора возможно в любом вариантов поставки сервиса для обработки персональных документов.