Векторизация — мифы, реальность, альтернативы, или Как работать со сканированными чертежами
Основные проблемы переходного периода
Как работать со сканированной графикой
Как правильно поставить и решить задачу?
Российская компания Consistent Software — один из ведущих производителей программного обеспечения для работы со сканированными техническими изображениями: чертежами, схемами, картами.
Самый первый созданный в Consistent Software программный продукт — автоматический векторизатор растровых чертежей Vectory для DOS, продажи которого начались еще в 1990 году, — дал начало целому семейству приложений для работы со сканированной инженерно-технической графикой. За десять лет компанией Consistent Software создана целая серия программных средств для послесканерной обработки, коррекции, специализированного редактирования и векторизации растровых изображений.
Новое поколение программных продуктов серии Raster Arts работает с изображениями любых размеров и типов, использует уникальную технологию гибридного редактирования и совершенные, не имеющие аналогов алгоритмы распознавания геометрических объектов. В результате более чем десятилетней работы созданы программные средства, с помощью которых можно работать со сканированными чертежами с легкостью и удобством, доступными ранее только при работе с векторной графикой САПР.
Огромные, пыльные бумажные архивы, в настоящее время представляющие собой кладбища интеллекта поколений инженеров и технологов, архитекторов и топографов, строителей и связистов, могут и должны обрести новую жизнь. Сканирование, использование специализированных программных средств для работы с растровой графикой — наиболее продуктивный и малозатратный способ использования бумажных технических архивов в электронном документообороте, современных компьютерных технологиях проектирования и конструирования.
Вместо вступления
Давайте вспомним, когда и как появились системы автоматизированного проектирования, без которых, согласитесь, сегодня уже невозможно представить процесс проектирования. А ведь не так давно, чуть больше двадцати лет назад, мало кто мог предвидеть дальнейшую судьбу казавшегося незыблемым мира кульманов. Сейчас существовавшая веками технология проектирования на бумаге — родная и безальтернативная среда даже для нынешнего поколения активно работающих проектировщиков — быстро и бесповоротно вытесняется новыми технологиями компьютерного проектирования.
Здесь вполне уместно слово «революция» — «переворот, внезапная перемена состоянья, порядка, отношений» — по толковому словарю Даля. И, как любая революция, коренное изменение основного способа проектирования влечет за собой шлейф проблем. Обратной дороги нет, и потому необходимо подумать о том, как свести к минимуму проблемы переходного периода от старой технологии проектирования к новой, через который должны пройти все, кто хочет остаться на рынке проектных работ.
Основные проблемы переходного периода
- Архивы документов — бесценная интеллектуальная собственность, накопленная
в эпоху проектирования на бумаге, хранящаяся на бумажных носителях и пленках.
Возможно ли, и если возможно, то каким образом преобразовать архив бумажных документов в электронный архив? Каким образом использовать созданные на кульмане документы в электронном документообороте?
- Создание новых документов. Только небольшой процент новых документов создается
сегодня с нуля. Чаще новый документ или новый проект создается на основе уже
имеющихся путем внесения изменений и корректировки. Что делать, если исходный
документ создан на кульмане, а проектировщик уже работает на компьютере? Возможно
ли использование бумажных документов в САПР?
Сегодня, как только речь заходит об использовании бумажных документов в САПР, первое и чаще всего единственное, что приходит в голову пользователю, впервые столкнувшемуся с необходимостью решения перечисленных выше проблем, это — «векторизация» или «векторизатор».
Какова реальная ситуация, является ли векторизация панацеей от всех бед переходного периода и есть ли альтернативные решения? Цель нашей статьи — ответить на эти вопросы, помочь разобраться в существующих технологиях работы со сканированными документами и в соответствии с поставленными задачами выбрать из них оптимальную.
Как превратить бумагу в файл?
Здесь имеется несколько способов, а именно:
- Положить перед собой чертеж и… просто перечертить его в какой-либо программе САПР. К сожалению, это получается не так просто и не так быстро. Обычно после нескольких попыток перейти от старых технологий к новым при помощи указанного способа пользователи от него отказываются.
- Использовать дигитайзер. Этот способ несколько быстрее предыдущего, но вряд ли намного эффективнее.
- Использовать сканер. На сегодня это, бесспорно, оптимальный способ перевода бумажного чертежа в электронный вид. А потому на некоторых аспектах сканирования остановимся подробнее.
Первое, от чего хотелось бы предостеречь, — это от попыток сэкономить на оборудовании. Пожалуйста, запомните: чем лучше качество отсканированного изображения, тем меньше времени и сил вы затратите на его обработку. Сканированные документы высокого качества можно получить только на профессиональном оборудовании. Не экономьте на формате сканера — точная сшивка изображения из кусков займет очень много времени и приведет к невосполнимым потерям точности. Только профессиональное оборудование для сканирования дает возможность подбирать оптимальные режимы и получать наилучшие результаты.
Нелишним будет упомянуть об основных проблемах, которые могут возникнуть у начинающих пользователей. В большинстве случаев это «рыхлая» графика, потерянные и слипшиеся линии.
«Рыхлая» графика зачастую представляет собой результат неумелого использования или злоупотребления одной из функций, присутствующих в профессиональных широкоформатных сканерах, — АТТ (Adaptive Area Tresholding), функцией компенсации неоднородного фона. AAT служит для автоматического удаления растрового мусора на аппаратном уровне при сканировании с синек и других не очень качественных чертежей, однако при неправильном использовании эта полезная функция может стать источником серьезных сложностей.
Проблема потерянных линий чаще всего возникает при попытке получить как можно меньше этих «мушиных следов» посредством изменения яркости и/или контрастности изображения. Обычно такие методы применяются при сканировании синек на так называемых бытовых сканерах (в которых, естественно, функция AAT отсутствует). Ни к чему хорошему в большинстве случаев это не приводит и к тому же усложняет дальнейшую работу с отсканированным таким образом чертежом.
Дело в том, что при сканировании чертежей необходимо добиваться вовсе не полного отсутствия растрового «мусора», а прежде всего — неразрывности и цельности растровых линий. Разумеется, такое возможно далеко не всегда, однако нужно постараться следовать данному принципу, поскольку это является залогом успешной работы со сканированным документом.
Наличие «мусора» на сканированном изображении — не такая уж серьезная проблема, поскольку с этим можно успешно справиться при помощи специального программного обеспечения, предназначенного для работы со сканированной графикой.
Проблему слипшихся линий можно решить повышением оптического разрешения сканера — количества распознаваемых точек на единице площади, измеряемого в dpi. Но следует помнить, что увеличение dpi приводит к увеличению как размера файла, так и времени на его обработку. Поэтому нужно находить такой режим, который обеспечит оптимальное соотношение размера файла и его качества.
И еще: один из наиболее укоренившихся мифов о растровых файлах — это миф о том, что растровые изображения очень объемные и занимают непомерно много места на жестком диске. Современные технологии сжатия растровых данных обеспечивают уменьшение размера растрового файла приблизительно в 40 раз относительно того же файла в несжатом состоянии. Для примера приведем размер растрового файла, сохраненного в формате Tiff Group 4, — 56,9 Кбайт, и этого же файла, преобразованного в векторный формат, — 50,2 Кбайт.
Немного теории
Итак, после сканирования мы получаем так называемое растровое изображение, или набор точек.
Растровое изображение бывает монохромным (содержит точки только двух цветов), полутоновым (содержит 256 тонов серого) и цветным. Характеризуется разрешением — количеством точек на единицу площади изображения. Разрешение бывает оптическим (количество распознаваемых сканирующим оборудованием точек) и интерполяционным (увеличение количества точек на единицу площади изображения на аппаратном уровне или за счет программного обеспечения).
Программы САПР работают с векторной графикой — математически описанными графическими объектами.
Как работать со сканированной графикой
Допустим, необходимо повысить качество сканированного чертежа и внести в него изменения. Как это сделать? Рассмотрим различные варианты решения.
- После сканирования мы получили растровую графику — значит, для ее корректировки можно использовать растровый редактор. Однако проблема в том, что технология редактирования растровой графики в стандартном растровом редакторе коренным образом отличается от редактирования векторной графики в редакторе векторном. Можно легко выбрать и удалить «мусор», но как изменить радиус растровой окружности? Цепочка редактирования сканированного документа в растровом редакторе следующая:
- Пользователя, привыкшего работать, скажем, в AutoCAD, уже не заставишь
редактировать чертеж в растровом редакторе. Единственный путь, который ему
видится, — это полное преобразование растровой графики в векторную и дальнейшее
редактирование полученной векторной графики в векторном редакторе.
Векторизация — перевод растровой графики в графику векторную при помощи специального программного обеспечения. Это является самым старым и, следовательно, наиболее известным способом работы со сканированными чертежами. Внесение изменений в чертеж при помощи векторизации можно представить в виде такой схемы:
И хотя данную цепочку можно пройти значительно быстрее, чем если бы пришлось просто перечерчивать документ, очевидно, что это не самый оптимальный путь. Во-первых, нельзя векторизовать сканированные документы плохого качества — перед векторизацией необходимо затратить время на улучшение качества изображения. Во-вторых, полученный после векторизации векторный документ требует обязательной геометрической коррекции (объединения фрагментов, коррекции пересечений, размеров, корректировки текстов и т.д.). Кроме того, чертеж, полученный в результате векторизации, представляет собой абсолютно новый документ, который должен быть подвергнут той же процедуре проверки на соответствие бумажному собрату и, быть может, утверждению, на что будет затрачено дополнительное время. Из этого следует, что глобальная векторизация может и должна применяться лишь там, где без векторного представления детали не обойтись: например, при использовании выполненного на бумаге чертежа для создания 3D-модели изделия, управляющей программы для станка с ЧПУ или если требуется значительная (более 70-80%) переработка отсканированного материала.
- Можно объединить возможности растрового редактора, векторного редактора и векторизатора, то есть работать со сканированной графикой в таком гибридном редакторе, где есть инструменты для работы с растровой графикой, возможности векторизации, создания векторной графики и ее редактирования. Цепочка при этом сокращается до следующей:
Современные гибридные редакторы максимально приблизили технологию редактирования растровых данных к технологии редактирования векторов, а именно:
- гибридный редактор умеет распознавать растровые объекты — линии, дуги, окружности, полилинии, штриховки и даже целые растровые символы, такие как технологическое оборудование, элементы электрических принципиальных схем, окна, лестницы на поэтажных планах и т.п.;
- как векторные, так и растровые примитивы имеют свойства (толщина, тип линии и т.д.), геометрические характеристики, даже «ручки», при помощи которых можно изменять эти объекты;
- выбирать растровые и векторные данные можно методами, которые знакомы всем пользователям векторного редактора AutoCAD: указанием, рамкой, секущим полигоном, полилинией и т.п.;
- к выбранным данным (как векторным, так и растровым) можно применять одни и те же команды редактирования (перенести, копировать, масштабировать, зеркально отобразить, выровнять и т.д.).
При таком способе редактирования пользователь работает только с теми элементами чертежа, которые нужно изменить, оставляя в неприкосновенности все остальное. В отличие от векторизации здесь не создается абсолютно новый документ, а это значит, что проверять нужно только измененные и новые фрагменты чертежа, значительно экономя время.
Следовательно, гибридное редактирование во многих случаях является самым лучшим, самым эффективным решением при работе со сканированной технической документацией.
На диаграмме представлены примерные временные затраты на выполнение корректировки сканированного документа при перечерчивании, автоматической векторизации и гибридной технологии.
С чего начать
Практика свидетельствует, что значительная часть документов, хранящихся в отечественных архивах, имеет плохое качество, а все прочие документы — очень плохое. И потому, какой бы способ работы со сканированным документом вы ни выбрали, практически всегда первым этапом работы является повышение качества растрового изображения.
Инструменты для повышения качества позволяют производить следующие действия с исходным изображением:
- фильтровать изображения: устранять растровый «мусор», заливать «дырки», делать растровые линии более гладкими, утолщать или утоньшать их и т.д.;
- устранять возникший при сканировании перекос;
- устранять линейные и нелинейные искажения при помощи специальной операции, называемой калибровкой.
Большинство операций, предназначенных для повышения качества сканированного изображения, можно проводить в пакетном режиме или в режиме автокоррекции (выбранные операции отрабатываются нажатием одной кнопки).
При работе же с растровым изображением очень плохого качества (когда, допустим, линия состоит из множества мелких фрагментов, воспринимающихся программой как элементы растрового шума), есть возможность не удалять, а переносить все мелкоразмерные растровые частицы на отдельный слой, а затем возвратить ошибочно удаленные элементы в основной чертеж.
Возможна и самая настоящая реставрация сканированных изображений — надо лишь творчески подойти к делу и посвятить этому немного времени (поверьте, это намного быстрее, чем нудное перечерчивание заново).
Как правильно поставить и решить задачу?
В нашу компанию часто звонят и приходят клиенты, интересующиеся программами для работы со сканированными документами. И практически всегда цель обращения формулируется следующим образом: «Нам нужно векторизовать документы, полученные после сканирования». На это мы обычно отвечаем: «Векторизация — это лишь один из возможных этапов решения ваших задач. А какие у вас задачи?» Из дальнейшей беседы, как правило, выясняется, что реальной задачей является вовсе не векторизация...
Рассмотрим реальные задачи, которые необходимо решать при работе со сканированными документами, и примерные варианты их решения.
- Задача. Преобразование архива документов, хранящихся на твердых носителях
(бумага, пленка), в электронный архив. Использование хранящихся на бумаге
документов в электронном документообороте.
Решение. Для этого достаточно повысить качество растровых изображений. В электронном архиве документ хранится в виде растрового файла. Его можно искать, просматривать, распечатывать (распечатанный растровый файл практически не уступает по качеству векторному чертежу, выведенному на том же устройстве), использовать в качестве справочного материала и т.д.
- Задача. Внесение в программе САПР необходимых изменений в существующий на
бумаге чертеж (актуализация документа). Создание нового проекта (нового чертежа)
в САПР, если в качестве подосновы используется существующий на бумаге проект
(документ).
Решение. Оптимальным решением является применение гибридной технологии, позволяющей редактировать сканированный документ практически так же, как если бы вы редактировали векторный документ в программе САПР.
Примеры решения:
- В растровый чертеж детали внесены необходимые изменения без преобразования этой детали в векторный формат. Изменения вносятся так же, как при редактировании векторного чертежа в векторном редакторе.
- Проект перепланировки помещения выполнен при помощи средств гибридного редактирования: выбранный растровый объект (станок, рабочее место, текстовая надпись и т.п.) разворачивался, перемещался или удалялся согласно требованиям новой планировки помещения. В работе создавались и использовались гибридные библиотеки, где постепенно накапливалась база элементов чертежа.
- Задача. Использование существующих на бумаге чертежей для создания трехмерной
модели и управляющей программы для станка с ЧПУ.
Решение. Существуют два способа решения. Если сканированный документ выполнен точно и имеет хорошее качество, целесообразно векторизовать этот документ и, откорректировав результаты векторизации, использовать их как исходный материал для построения модели. Если сканированный документ имеет плохое качество и низкую точность, то лучше сначала воспользоваться возможностью устранения искажений растра, а затем, имея на экране уточненный растровый оригинал, перечертить его, для чего следует воспользоваться привязкой к характерным точкам растровых объектов.
Пример решения
По разработанному дизайнером логотипу компании требовалось создать управляющую программу для станка лазерной гравировки. После незначительного повышения качества растрового изображения растровый логотип был переведен в векторный формат, в соответствии с которым формировалась управляющая программа для станка с ЧПУ. Так, при помощи современных технологий за считанные минуты была решена задача, ранее занимавшая не менее часа.
- Задача. Подготовка данных для создания ГИС (геоинформационных систем): первичная
обработка сканированных картографических материалов (карт, планов и схем).
Оцифровка картографического материала.
Решение. Решение этой задачи обязательно начинается с калибровки (устранения линейных и нелинейных искажений) картографического материала. При работе с цветными и полутоновыми материалами возможно их цветовое расслоение на монохромные тематические слои по признаку принадлежности к определенному цветовому или «серому» диапазону (для осуществления последующих этапов создания векторной карты или редактирования растра). Для оцифровки (превращения объектов на растровой карте в набор векторных объектов) обычно используется трассировка. Возможны «сшивка», совмещение, взаимное выравнивание растровых изображений, работа с картами разных масштабов и т.д.
Заключение
Безусловно, можно привести еще множество различных примеров, однако в этом, на наш взгляд, нет особой необходимости. Гораздо важнее осознать тот факт, что существуют новые современные эффективные технологии работы со сканированными документами в САПР. Программы серии Raster Arts, разрабатываемые российской компанией Consistent Software на протяжении вот уже десяти лет, обеспечат решение любых ваших задач, связанных с обработкой сканированной документации, максимально облегчат переход от старой технологии проектирования на кульмане к новым технологиям САПР.
Специалисты компании Consistent Software готовы рассмотреть все ваши проблемы, найти наиболее эффективные способы их решения, показать варианты обработки документов, дать консультации по вопросу выбора необходимых программ и обучить всем тонкостям работы с ними.
«САПР и графика» 4'2001