1 - 2004

Перевод бумажной документации в электронный вид

Марина Авдеева, Анатолий Чиркин

Опыт работы

Технические средства

Наш опыт

Опыт работы

Перевод бумажных архивов в электронную форму интенсивно осуществляется на предприятиях во всем мире. Не осталось в стороне и Комсомольское-на-Амуре авиационное производственное объединение (КнААПО). Четыре года назад для централизованной обработки документов был создан участок перевода информации в электронную форму (участок сканирования). Работая в тесной связи с подразделениями объединения (отделы главного конструктора, главного технолога, главного метролога, планово-экономический отдел, сектор стандартизации, цеха основного и вспомогательного производства, бухгалтерия, отдел кадров и многие другие), он перевел в электронный вид более 200 тыс. листов бумажных документов формата А4.

Технология перевода документов в электронную форму

ЛВС — локальные вычислительные сети, КВС — корпоративные вычислительные сети. Технология перевода документов в электронную форму

Подразделения, воспользовавшиеся нашими услугами, освобождаются от рутинного труда, связанного с большими затратами времени и требующего освоения программных продуктов, которые могут им в дальнейшем и не понадобиться. Процесс перевода документации в электронный вид регламентируется временным положением, действующим на предприятии.

Все необходимые сведения заносятся в карту заказа, которую с помощью инженера по АСУП участка сканирования заказчик заполняет при сдаче документов на обработку. В карте заказа указываются параметры форматирования, имена файлов и каталогов, особенности обработки и адреса хранения готовой электронной формы.

Сегодня мы предлагаем заказчикам следующие виды электронных документов:

• качественные копии бумажной технической документации, доступные для редактирования в графических редакторах (*.tif, *.jpg и др.);

• чертежи в формате AutoCAD (*.dwg);

• эскизы векторного качества для приложений Windows и баз данных в виде метафайлов Windows (*.wmf);

• книги Microsoft Excel (*.xls);

• Web-страницы (*html);

• документы, подготовленные для печати на типографском оборудовании в формате Adobe Acrobat (*.pdf) и т.д.

Кроме того, мы размещаем информацию в базах данных корпоративной сети предприятия. Таким образом, заказчики, сдав в обработку бумажные документы (зачастую ветхие и плохого качества), получают их электронные аналоги, доступные целой группе пользователей.

Стимулом к созданию участка стала потребность сопровождать изделия на экспорт документами в электронном виде. Первыми заказами, выполненными участком сканирования, были технологические карты и руководства по эксплуатации изделий, послужившие основой для создания интерактивных электронных технических руководств.

На создание первых книг общим объемом 10 тыс. листов формата А4 конструкторам и технологам понадобилось бы (по их собственным подсчетам) около полутора лет, но благодаря новой технологии эта работа была выполнена за три месяца.

Окно базы данных Scandoc, форма Книги, вкладка Регистрация

Окно базы данных Scandoc, форма Книги, вкладка Регистрация

Сегодня производительность участка составляет около 6 тыс. листов формата А4 в месяц. Количество обработанной документации зависит от качества оригинала и выбранной технологии. Разработаны технологические процессы разной сложности: например, перевод в электронный вид Документ Microsoft Word простых текстов без рамок форм имеет сложность 1, а перевод чертежей в электронный вид Рисунок AutoCAD — сложность 4. Благодаря систематическому обучению персонала поддерживается высокая квалификация специалистов, что позволяет создавать качественные электронные версии различных документов.

Поступающие на обработку документы регистрируются в специальной базе данных Scandoc. В ней содержатся сведения о заказчиках и исполнителях работы, технологическом задании, сроках выполнения, адресах размещения электронных версий документов в корпоративной сети и т.д.

В начало В начало

Технические средства

Первые работы по переводу в электронный вид были выполнены нами на сканерах Vidar TruScan Select с помощью программы TruInfo. Эти сканеры и сегодня продолжают исправно работать, позволяя выполнять сканирование на отдельных листах в черно-белом изображении шириной от 150 до 965 мм и длиной до 10 м. Возможность подбора различных настроек монохромного сканирования в программе TruInfo, удобный интерфейс с укрупненным просмотром сканируемого изображения, небольшой размер конечного файла в формате tif CCIT Group4 — основные преимущества программы TruInfo. В то же время были и определенные трудности. Например, нарушение выравнивания камер сканирования требовало полной переустановки программы TruInfo с получением от фирмы-поставщика нового кода авторизации. Неудовлетворительный результат на этих сканерах дает и сканирование в режиме Grayscale.

Для сканирования книг, технических журналов и сшитых документов, формат которых не превышает А3, мы с успехом используем цветные планшетные сканеры Paragon 1200 A3 SP PRO.

Чтобы сканировать цветные документы большого формата, иногда очень плохого качества, мы приобрели широкоформатный цветной сканер Contex с программным обеспечением RasterID, которое предлагает различные варианты настроек, благодаря чему можно повысить качество сканирования. Положительные отзывы получила автоматизация процессов обработки. Кроме того, программа поддерживает технологию ActiveX, что еще больше расширяет наши возможности.

В начало В начало

Наш опыт

Для большинства документов хорошее качество изображений при небольших размерах файлов обеспечивает сканирование с разрешением 300 dpi. Сканирование калек, мятых и разорванных чертежей удобно проводить при помощи специальных прозрачных пакетов, приобретенных нами у компании Consistent Software.

Быстро и качественно сканируются документы, обладающие высоким контрастом, сочностью цвета, однородностью и постоянной плотностью. В этом случае оцифрованное изображение занимает незначительный объем дисковой памяти и практически не требует дальнейшей обработки. К сожалению, процент таких документов невысок (около 30%).

Участок сканирования КнААПО

Участок сканирования КнААПО

Для других документов получение качественного растра требует времени. При обработке такого документа используются разработанные компанией Consistent Software программные продукты серии Raster Arts. С программами RasterDesk Pro и Spotlight Pro мы работаем начиная с третьей версии и считаем их наиболее эффективными для улучшения качества монохромных растровых изображений. В четвертой версии появилась возможность выбора растровых объектов, что позволяет редактировать растр, применяя привычные методы работы с вектором. Длительное время мы, руководствуясь пожеланиями заказчиков, обрабатывали чертежи, сохраняя их либо в растровом, либо в векторном виде, однако сегодня считаем, что пора переходить к гибридным чертежам, так как работа с ними наиболее целесообразна для быстрого создания электронных архивов. Действительно, вряд ли имеет смысл перерисовывать в AutoCAD качественные растровые фрагменты!

В программе Spotlight есть и весьма полезный режим пакетной обработки, позволяющий обрабатывать пакет растровых файлов без участия оператора. Правда, этот прием можно применять только для изображений одинакового качества.

Для чертежей плохого качества быстрее получить векторную копию растрового оригинала средствами CAD-программ, чем проводить очистку сильно загрязненного растра. Программы Raster Arts позволяют автоматически векторизовать растровые объекты, однако мы эту возможность используем редко, так как выполняем работу для разных подразделений предприятия. Настройка параметров векторизации на разные виды часто меняющихся чертежей требует существенных временных затрат. Конечно, при больших объемах однотипных чертежей более целесообразно подобрать параметры векторизации, сохранить их в виде шаблонов и автоматизировать процесс перевода документации в электронный вид, но это требует участия специалистов подразделений, которые пока делают лишь первые шаги в освоении программ серии Raster Arts.

Обычно мы используем метод сколки: вставляем растр в рисунок AutoCAD в виде ссылки в масштабе 1:1, а затем средствами инструментов панели рисования получаем векторную копию растрового оригинала. Для работы с цветными документами (мы сканируем в цвете документы очень плохого качества) RasterDesk 5 и Spotlight 5 также предлагают набор инструментов, но их применение требует больших ресурсов памяти, которые есть не на всех рабочих местах, поэтому обработка таких документов замедляется. Цветные документы в Spotlight можно преобразовать в монохромные при помощи программы Color Image Processor и далее воспользоваться инструментами, улучшающими битональные изображения.

Качественные тексты хорошо распознаются большинством OCR-программ и требуют минимальной обработки.

Для текстовой документации плохого качества, которую и прочитать-то трудно, сканирование и распознавание применять нецелесообразно. Предпочтительнее ручной набор информации (время на сканирование, распознавание и редактирование может оказаться больше, чем на ручной набор).

Информацию в электронном виде мы формируем так, чтобы при просмотре на экране компьютера ее расположение было удобным для пользователя. Листы с книжным расположением информации должны иметь книжную ориентацию, а с альбомным расположением — альбомную. При выводе на печать соответствие бумажному оригиналу сохраняется путем настройки параметров принтера.

Слои рисунка AutoCAD

Слои рисунка AutoCAD

При наличии в бумажном оригинале технической документации символов, написанных или нарисованных от руки, мы определяем для них вариант замены из таблицы символов или используем качественно нарисованное электронное изображение данного символа. Для рисования желательно выбирать векторный редактор и отслеживать, чтобы в электронной версии один и тот же символ не обозначался разными знаками. Для этого необходимо создать единую библиотеку символов предприятия. В бумажной документации 70-80-х годов символы чаще всего вписывались от руки, в результате чего один и тот же символ мог иметь разное написание. В Windows одни и те же символы в разных шрифтах также различаются. При выборе того или иного варианта, наряду с внешним видом, нужно учитывать наличие соответствующего шрифта на компьютерах предприятия и в выбранной программе. Например, не все знаки, написанные в Microsoft Word (*.doc), будут отображаться в рисунке AutoCAD (*.dwg) или в таблицах баз данных. Отсюда возникает проблема: установку программного обеспечения и настройку компьютеров предприятия необходимо проводить так, чтобы одни и те же документы смотрелись на всех машинах одинаково и желательно в соответствии со стандартами на электронные документы.

Инженеры Марина Авдеева и Анатолий Чиркин

Инженеры Марина Авдеева и Анатолий Чиркин

Для CAD-программ необходимо использование (создание) типов линий по ГОСТ, единство текстовых и размерных стилей, систем слоев, выработка единых принципов формирования и сохранения чертежей (особенно при применении гибридных технологий). Мы, например, для удобства работы в AutoCAD выбрали светло-серый цвет экрана.

Основной шрифт, принятый для использования на предприятии, — GOSTW. Но многие подразделения начали использовать AutoCAD раньше, чем были предприняты попытки стандартизации данного процесса. Как следствие, появился большой объем электронных чертежей с разнообразными настройками, удобными для конкретных пользователей. В результате сегодня существует большое количество текстовых и размерных стилей, типов линий и т.д.

Ряд проблем возникает при переводе в электронный вид текстовых документов, оформленных по ГОСТ. Текстовую часть документа нередко требуется поместить в рамки форм. Однако создать универсальные рамки, которые полностью печатаются на любом принтере и при этом удовлетворяют требованиям стандартов, — трудная задача.

Эту проблему можно решать по-разному. Создано много вариантов рамок в Word, Excel, в растровых и векторных редакторах. Но обидно тратить на это время, да еще и подгонять результат под параметры принтера. Кроме того, нужно ли сохранять рамки для электронного вида? Можно, конечно, установить на все компьютеры специализированное программное обеспечение для работы с отсканированными формами, но насколько это целесообразно?

Благодаря тесному сотрудничеству с компанией Consistent Software мы всегда в курсе ее новых разработок. (К сожалению, не со всеми интересующими нас фирмами удалось достичь столь тесного контакта.) Из перспективных разработок Consistent Software нас заинтересовала программа PlanTracer. Она предоставляет просто фантастические возможности для создания трехмерных чертежей из растровых рисунков. Хотелось бы попробовать ее на планировках наших зданий. Быть может, недалек и переход к моделям?

Надеемся, что с помощью таких партнеров, как Consistent Software, мы сможем более профессионально решать проблемы, возникающие в процессе работы.

В начало В начало

«САПР и графика» 1'2004