Технологии ввода данных в информационных системах финансовых учреждений

Сейчас невозможно представить себе финансовое учреждение (банк или страховую компанию), которая бы могла работать без использования современной компьютерной информационной системы, обеспечивающей своевременное введение и обработку всех необходимых для работы данных. Но если скорость обработки зависит от мощности компьютерной системы и в наше время не является проблемой, то скорость ввода данных определяется многими факторами и существенно зависит от методов и средств, используемых для этого.

Данные могут быть представлены как на электронных, так и на бумажных носителях. Ввод данных с электронных носителей обычно не требует ни много времени, ни больших трудозатрат, а вот ввод данных с бумажных документов, наоборот, требует и времени и трудозатрат. В данном исследовании очерчены пути автоматизации ввода бумажных документов.

Характеристика бумажных документов

Бумажные документы, которые обрабатываются в финансовых учреждениях, обычно представляют собой стандартизированные бумажные бланки (формы) с набором полей, которые должны заполняться вручную или с помощью печатной машинки, например, платежные поручения или заявления о страховании физических лиц. Некоторые поля используются для записи идентификационных данных, которые позволяют однозначно определить, кем эти данные сформированы), а другие - для записи самих данных.

Автоматизированные рабочие места для ввода отчетных данных и формирования отчетов

Для введения в память компьютера отчетных данных с бумажных форм, заполненных от руки, часто используются программно-аппаратные комплексы, включающие персональные компьютеры (ПК) с программным обеспечением, ориентированным на введение операторами данных определенного типа. Такие комплексы обычно называют автоматизированными рабочими местами (АРМ) для ввода данных. Экранные формы, выводимых АРМьом на экран ПК, содержат набор полей, соответствующих полям бумажных форм. Поэтому с помощью АРМ можно автоматизированно формировать базу отчетных данных, то есть вводить данные в поля экранной формы непосредственно из бумажной формы, редактировать их, проводить автоматический контроль корректности и обработку данных, а также формировать базу данных.

Если выходные данные уже были представлены в электронном виде (в виде набора файлов или базы данных), то есть полученные в результате предварительной обработки, для ввода в компьютер достаточно превратить их (конвертировать) во входной формат, который используется для ввода в базы данных АРМ , а затем инициализировать процесс автоматического ввода. Разработка программы-конвертора обычно не вызывает затруднений.

Однако доля ручного труда при вводе данных остается весьма существенной и приводит к перегрузкам нервной системы операторов, особенно, если разработчики АРМьа не учитывают эргономических факторов. Как показывает опыт использования подобных АРМьив, производительность труда операторов по введению отчетных данных составляет в среднем от 60 до 200 документов за восьмичасовой смену (в зависимости от типа документа).

При увеличении объемов отчетных данных существенно повысить производительность труда операторов практически невозможно и нужно увеличивать количество АРМьив, то есть компьютеров и операторов (если для этого есть возможности.

Комплексы сканирования и распознавания

В последние годы для введения отчетных данных из заполненных от руки машинописные бумажных форм все шире используются оптические сканеры с автоматическими претендентами бумаги и системы автоматического распознавания рукописных текстов (OCR / ICR).

Современные промышленные сканеры обеспечивают ввод в 200-300 страниц в минуту, а ICR обеспечивают достаточно высокое качество распознавания, верификацию (проверку правильности распознавания данных) и экспорт результатов в базы данных.

Процессы сканирования и распознавания происходят автоматически, а верификация результатов распознавания (не всех, а только неуверенно распознанных системой распознавания) и их корректировки должны проводиться автоматизировано оператором-верификаторов. Как показывает опыт использования таких систем, один оператор может проверить и откорректировать 400 - 500 и более документов за смену (в зависимости от типа документов и процента их заполнения. Необходимо особо подчеркнуть принципиальное изменение роли человека (оператора-верификаторы) в этом процессе по сравнению с ручным вводом: оператор не вводит данные как при работе с АРМьом, а только проверяет и корректирует неуверенно распознанные данные, что и дает возможность существенного повышения производительности труда . Но стоимость систем автоматического распознавания (ICR) достаточно велика и они решают проблему ускорения только одного этапа-ввод данных, а для автоматизации других этапов необходимо разрабатывать отдельные средства

Можно провести аналогию между введением перфокарт и введением документов с помощью оптических сканеров (последние являются намного универсальнее средством, поскольку обеспечивают введение образов любых документов, а не стандартных перфокарт, и относятся к электронно-оптико-механических, а не электро-механической устройств) .

Надо также отметить, что качество автоматического распознавания существенно зависит от качества самих форм для записи данных.

Во-первых, формы должны быть напечатаны на качественной бумаге, не будет рваться при сканировании сканером с автоподатчика листов.

Во-вторых, для уменьшения ошибок распознавания лучше использовать формы, на которых служебные надписи и линии распределения полей напечатаны красным или зеленым цветом, так как при сканировании эти надписи и линии можно удалить путем использования лампы соответствующего цвета или соответствующим налаживанием сканера и не будут ошибочно восприниматься как текст, который необходимо распознать.

В-третьих, формы должны быть напечатаны на качественной типографском оборудовании и качественной краской, то есть стоимость форм, которые необходимы для обеспечения сканирования и автоматического распознавания, будет существенно выше стоимости форм, из которых можно вводить данные с помощью АРМьа ввода данных.

Кроме того, для обеспечения сканирования, распознавания, верификации и экспорта документов необходимо создать достаточно сложный и достаточно дорогостоящий программно-аппаратный комплекс сканирования и распознавания (КСР)

Если сравнить описаны средства ввода данных, то можно сделать следующие выводы:

— Технология ввода данных с помощью АРМьив введения простая и дешевая, но производительность ввода данных довольно низкая;

— Технология сканирования и автоматического распознавания значительно ускоряет ввод данных, но требует вложения достаточно крупных средств в аппаратное и программное оборудование комплекса сканирования и распознавания и печать специальных форм;

— На текущий момент одним из актуальных вопросов в разработке информационных технологий финансовых учреждений является создание дешевых и производительных средств ввода данных с бумажных носителей.