Принципы построения семантических MDM-систем
Эволюция социумов связана
именно с развитием средств
информационного взаимодействия его членов,
и особенно средств построения
и использования их совокупной памяти.
Станислав Янковский
Правильно организованная Семантическая Сеть
может способствовать эволюции
всего человеческого знания в целом.
Сэр Тим Бернерс-Ли
Системы автоматизированного проектирования приблизились к порогу, за которым последует лавинообразное применение семантических технологий. Интерес к этим технологиям проявляется везде, где есть сложные структуры данных и работают трудноформализуемые процедуры принятия решений, основанные на эмпирических знаниях о поведении и взаимодействии объектов. Использование семантических моделей данных в САПР позволит создать новый класс интеллектуальных систем с высоким уровнем автоматизации принятия решений.
На производстве все объекты: материалы, комплектующие, оборудование, средства технологического оснащения — находятся в непрерывном взаимодействии. Характеристики этих объектов хранятся в отдельных базах данных, а правила их поведения и совместимости — в алгоритмах различных прикладных приложений. Объединив данные и знания в единую семантическую модель предметной области, можно построить интеллектуальное информационное пространство предприятия, которое будет служить основанием для принятия достоверных решений в проектировании, производстве и управлении.
Семантическая сеть — это «информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (ребра) задают отношения между ними» (рис. 1).
Рис. 1. Фрагмент семантической сети
Эволюционное развитие программного обеспечения (ПО) заключается в постепенной унификации общесистемных компонентов. В ближайшие пять лет неизбежно смещение акцента с разработки ПО в сторону создания прикладных семантических моделей данных. Стандартизация и унификация терминов, концепций и отношений, применяемых в этих моделях, станет ключевым фактором при разработке любой информационной системы. Смена объектной парадигмы на семантическую и унификация моделей данных — это мэйнстрим, который позволит повысить уровень автоматизации принятия решений и стандартизировать протоколы обмена информацией между различными приложениями (рис. 2).
Рис. 2. Унификация общесистемных компонентов в ходе эволюции программных средств
Исторически неизбежно появление нового класса систем, предназначенного для реализации семантических моделей предметных областей. Благоприятной средой для построения этих моделей могут служить приложения класса Master Data Management (MDM), объединяющие все справочные данные предприятия нетранзакционного характера.
В рамках данного направления устраняются проблемы дублирования и синхронизации нормативносправочной информации (НСИ). Вводится единая система классификации и кодирования. Реализуется централизованная система хранения, управления и доступа к справочным данным, появляется перспектива стандартизации представления и обмена данными. Открывается «место действия» для развертывания механизмов, оперирующих знаниями.
Методология MDM рассматривает справочные данные, циркулирующие на предприятии, как единый язык общения корпоративных информационных систем. Подразумевается, что информация об изделиях подлежит совместному использованию и обмену только в случае, если как отправитель, так и получатель применяют одни и те же справочные данные.
Таким образом, мы имеем дело с инновациями в области консолидации справочных данных, унификации сервисов их обработки, консолидации знаний в семантических моделях и стандартизации форматов обмена данными.
Перспектива развития MDMсистем заключается в том, чтобы воспринять перечисленные инновации и, наряду с приложениями класса СУБД, стать общесистемными компонентами ИТинфраструктуры любого предприятия.
Рассмотрим основные принципы построения семантических MDMсистем.
Консолидация данных
Репозиторий справочных данных должен являться единственным местом, в котором будет происходить добавление, изменение или удаление данных (рис 3). MDM — это самостоятельный класс систем, который не должен занимать подчиненное положение по отношению к какойлибо прикладной системе, например ERP или PDM.
Рис. 3. Консолидация справочных данных
Консолидация знаний
Перенос правил принятия решений на уровень моделей данных делает их доступными для всех корпоративных приложений. Ориентированность на построение семантических моделей предметных областей обеспечивает максимальный уровень автоматизации, поскольку частные решения, однажды внесенные в семантическую базу данных НСИ, будут надлежащим образом формализованы и многократно использованы в различных прикладных системах (рис. 4).
Рис. 4. Консолидация знаний
Единое информационное пространство
Семантическая MDMсистема представляет собой консолидированное пространство справочных данных. Информация собирается из первичных систем и интегрируется в единое постоянное место хранения. Вынесение части справочников за его пределы разрывает связи между объектами, что нарушает целостность системы знаний и существенно ограничивает возможности построения семантической сети (рис. 5).
Рис. 5. Единое информационное пространство справочных данных
Универсальность и расширяемость
Модель предметной области постоянно корректируется и совершенствуется. Создаются новые объекты, меняются правила их поведения и отношения. Семантическая MDMсистема должна уметь адаптироваться к этим изменениям, то есть, по сути, быть средой исполнения модели предметной области независимо от ее конкретного содержания.
Контекстнозависимое представление данных
Система MDM должна предоставлять возможность видеть объекты с различных точек зрения. Например, инженертехнолог должен увидеть в металлорежущем станке механизмы перемещения заготовки и режущего инструмента, а инженермеханик — узлы и детали, подлежащие профилактическому осмотру (рис. 6).
Контекстная точка зрения на объект не ограничивается только ролью пользователя, она меняется в зависимости от времени, точнее от этапов жизненного цикла объекта, а также от набора его функций (назначения).
Рис. 6. Контекстная точка зрения на информационный объект НСИ
Материальные объекты обладают двумя главными свойствами: структурой и активностью. Контекстное представление внутренней структуры объекта динамически меняется в зависимости от процессов, в которых он принимает участие. Можно сказать, что объекты определяются возможными с ними действиями.
Стандартизация форматов обмена данными
Тема синхронизации и унификации данных выходит далеко за рамки интересов отдельных предприятий. Согласно требованиям международных стандартов, поставщики продукции должны предоставлять покупателю необходимые для каталогизации технические сведения о товаре в электронном виде. Объединение товаров различных производителей в электронных каталогах подразумевает, что при описании товаров необходимо использовать одни и те же словарные термины и обозначения.
Сегодня существуют два альтернативных варианта стандартизации форматов обмена данными. Первый реализуется стандартом ISO 22745, который предполагает использование открытого словаря технических данных Международной ассоциации управления кодами электронной торговли (eOTD ECCMA).
Словари eOTD разработаны для связи терминов и определений с аналогичным семантическим содержанием. Они позволяют присваивать однозначный всемирный идентификатор любому термину, свойству или классу. На основе этих идентификаторов могут согласовываться описания материальнотехнических объектов в различных автоматизированных системах (рис. 7).
Рис. 7. Единый открытый словарь технических данных eOTD ECCMA
В соответствии с приказом Ростехрегулирования № 1921 от 19 июля 2006 года формируется российская версия открытого технического словаря eOTD ECCMA, призванного согласовать информацию об изделиях различных поставщиков с целью сокращения затрат на разработку электронных каталогов продукции.
Второй вариант реализуется стандартом ISO 15926, который, в отличие от ISO 22745, является онтологическим, так как стандартизует структуру объектов. В нем специфицируется модель данных, определяющая значение сведений о жизненном цикле в едином контексте, поддерживающем все группы описаний, которыми могут обладать по отношению к изделиям инженерытехнологи, инженеры по оборудованию, операторы, инженеры по техническому обслуживанию и другие специалисты (ISO 15926, часть 1).
Эталонная модель данных, на основе которой предлагается проводить синхронизацию с прикладными моделями данных, в ISO 15926 реализуется библиотекой справочных данных RDL (Reference Data Libraries).
Интеграция нового приложения в единое информационное пространство предприятия должна начинаться с приведения в соответствие классов и атрибутов прикладной модели этого приложения с соответствующими определениями эталонной модели, которая является корпоративным языком общения различных автоматизированных систем на предприятии (рис. 8).
Рис. 8. Эталонная модель формализует обмен данными
Работы по использованию ISO 15926 активно ведутся ГК Росатом и ФГУП Судоэкспорт. В Росатоме 26 декабря 2008 года был издан приказ № 710, предписывающий: «Госкорпорации “Росатом” и ее организациям при создании и использовании информационных моделей производства на всех этапах жизненного цикла АЭС и топливных производств при выполнении процесса управления информацией в целях интеграции данных руководствоваться положениями международного стандарта ISO 15926, для чего разработать соответствующие корпоративные стандарты».
Семантические технологии в САПР
Системы автоматизированного проектирования (САПР), работающие на машиностроительных предприятиях, являются основными потребителями справочной информации. Данные о материальнотехнических объектах: оборудовании, материалах, оснастке — нужны им в максимальной степени подробности. Интерес для САПР представляют не только технические параметры объектов, но и отношения между ними в контексте производственного процесса. Возможности семантической MDMсистемы позволяют приложениям САПР реализовать «осмысленный» поиск в базе данных НСИ, в котором принимают участие как параметры искомого объекта, так и правила его взаимодействия с другими объектами.
Например, при поиске режущего инструмента в качестве критериев можно будет указать не только его характеристики, но и любой другой взаимосвязанный с ним объект: материал обрабатываемой детали, схему обработки, приспособление, металлорежущий станок. Система подберет требуемый инструмент, совместимый с экземплярами смежных объектов (рис. 9).
Рис. 9. Сужение области поиска в семантической сети взаимосвязанных объектов
Семантический поиск — это ключевая потребительская ценность, способная обеспечить конкурентное преимущество САПР за счет повышения уровня автоматизации принятия решений в процессе проектирования.
Данный подход лежит в основе технологий Semantic Web. Семантические технологии уже прошли начальную стадию развития и всерьез рассматриваются ведущими аналитиками в качестве реальной силы: «В течение следующих десяти лет вебтехнологии усовершенствуют возможности наделения документов семантической структурой, создадут структурированные словари и онтологии для определения терминов, концепций и отношений…» (аналитический отчет «Finding and Exploiting Value in Semantic Technologies on the Web» (Gartner, 2007)).
По определению Томаса Груббера, онтология есть спецификация некоторой предметной области, которая описывает множество терминов, понятий и классов объектов, а также взаимосвязей между ними. Онтология призвана обеспечить согласованный унифицированный словарь терминов для взаимодействия различных корпоративных информационных систем.
Простейший пример построения онтологии — это выделение в структуре осевого режущего инструмента присоединительной и режущей частей как самостоятельных классифицируемых объектов, что позволяет использовать их при построении описаний схожих инструментов типа «сверло», «зенкер», «развертка», «концевая фреза» и т.д. (рис. 10).
Рис. 10. Выделение составных частей осевого режущего инструмента
Без построения онтологической модели объекта невозможно формализовать его взаимосвязи с другими сущностями, так как правила совместимости двух объектов определяются по совокупной совместимости их составных частей (рис. 11).
Рис. 11. Совместимость объектов определяется по совокупной совместимости их составных частей
Сведение унифицированных описаний объектов предметной области в общую библиотеку и предоставление к ней доступа из различных приложений решает задачу стандартизации форматов обмена данными. Размещение такой библиотеки в Глобальной сети решает проблему интеграции данных на отраслевом, государственном и межгосударственном уровнях.
В рамках европейского проекта JORD (Joint Operational Reference Data) начиная с 2008 года создается библиотека онтологических моделей данных на основе открытого международного стандарта ISO 15926. Каждый желающий имеет возможность разместить в этой библиотеке собственные онтологические модели данных. Годовая подписка на данную библиотеку в Интернете будет стоить 25 тыс. евро.
Корпоративная система управления НСИ Semantic
Компания SDI Solution информирует о выходе новой корпоративной системы управления НСИ Semantic (рис. 12). Данный программный комплекс обладает развитым функционалом информационнопоисковой системы и одновременно служит поставщиком справочных данных для САПР, PLM и ERP.
Рис. 12. Корпоративная система управления НСИ Semantic
Система Semantic поддерживает корпоративные бизнеспроцессы управления НСИ: ввод данных, актуализацию, доступ, контроль, включая ведение истории изменений и использования данных. Реализует многокритериальный параметрический и семантический поиск объектов. Позволяет хранить данные в различных средах: Oracle, MS SQL Server, FireBird. Более подробное описание функциональности системы Semantic будет опубликовано в следующем номере журнала «САПР и графика».
Андрей Андриченко, к.т.н., диплом МВА, автор и разработчик САПР ТП Автопроект и САПР ТП ВЕРТИКАЛЬ.
19841987 — аспирантура САПР.
19871997 — зав. отделом САПР ТП в НИИ авиационных технологий (НИАТ).
19972002 — генеральный директор ИКЦ «Оберон».
20022011 — руководитель технологического направления АСКОН.
2011 — председатель Совета директоров ЗАО «SDI Solution».