Сканирование документов с распознаванием и без
Оцифровать документ — для работы с его электронной копией, создания архива и более удобного хранения информации — можно как с помощью обычного сканирования, так и посредством сканирования с последующим распознаванием. Второе вариант позволяет обработать большой массив документов быстрее. Команда из двух специалистов в среднем за день обрабатывает более 15 тыс. документов, тогда как без распознавания создавать реестр такого же количества документов придется не меньше 3-4 месяцев. Тем не менее, используются оба варианта. В зависимости от целей заказчика, количества документов в архиве и его структуры заказчик может выбрать как простое потоковое сканирование, так и сканирование и распознавание документов.
Когда можно просто сканировать документы
Сканирование без распознавания применяется в случаях, когда в архиве мало документов — опыт показывает, что если в архиве менее 50 тыс. позиций, можно обойтись без распознавания. Основная единица архива не документ, а папка, и система поиска в архиве ведется именно по папкам, а не отдельным документам. Архивный фонд включает в себя документы разных типов, как текстовые, так и графические (чертежи, схемы, эскизы), источники его пополнения — разные отделы, со своими типами документов.
Распознавание нужно, когда:
- архивный фонд включает в себя 50-60 тыс. документов и больше;
- документы в архиве однотипные;
- предполагается использовать полнотекстовый поиск.
Если архив формируется из документов после сканирования с распознаванием, с ним проще работать. Даже массив из большого количества одинаковых (типовых) документов легко обрабатывать — сортировать, оценивать ценность и актуальность. Просто сканированные цифровые копии для разбора потребуют больше времени. Чем с большим количеством документов придется работать, тем ощутимей разница.