12 - 2015

Создание электронной библиотеки по ядерному топливу в НПФ «Сосны»

Борис Канашов
Заместитель начальника отдела НИР — руководитель группы информационного обеспечения НПФ «Сосны»
Юрий Жуков
Аналитик Регионального центра АСКОН-Волга

Научно­производственная фирма «Сосны» более 20 лет занимается технологиями и оборудованием для обращения с отработавшим ядерным топливом (ОЯТ). За это время собрана богатая техническая библиотека, документами которой пользуются научные сотрудники и инженеры предприятия. Оцифровать и систематизировать накопленную базу знаний взялась группа информационного обеспечения НПФ «Сосны» совместно с Региональным центром АСКОН­Волга, а в качестве программной платформы для электронного хранилища была выбрана связка систем ЛОЦМАН:ПГС и ЛОЦМАН:ОРД.

В процессе научного поиска сотрудники НПФ «Сосны» постоянно обращаются к опыту предшественников, проводят анализ российских и международных достижений в сфере технологий по обращению с ОЯТ. Хорошо развиты инструменты доступа к полнотекстовым документам у англоязычных научных журналов и международных издательств, выпускающих труды научных конференций. В этом случае нет необходимости создавать специальные инструменты обеспечения научных сотрудников и инженеров первоисточниками в виде статей, докладов, отчетов, монографий и т.д. Однако если попытаться найти нужные русскоязычные первоисточники, то обнаруживается, что не только не существует инструментов доступа к полнотекстовым документам, но и самих полнотекстовых документов в электронном виде для большинства российских журналов нет.

Отсутствие полноценного доступа к русско­язычной научно­технической литературе привело к тому, что каждому научному сотруднику пришлось создавать свою библиотеку полнотекстовых документов и придумывать собственный способ доступа к ним. Как правило, это были электронные версии первоисточников в форматах PDF, DOC или JPG, аккуратно разложенные по каталогам в соответствии с собственными представлениями сотрудника о предметной области. Очевидно, что ориентироваться в этой структуре документов мог только ее автор. Так появилось несколько индивидуальных баз данных, живущих по своим правилам, которые никак нельзя было считать полноценным информационным обеспечением научно­исследовательских работ. Корпоративный подход требовал создать единую библиотеку документов и единый инструмент доступа к ним.

В 2013 году руководство НПФ «Сосны» приняло решение в первую очередь создать информационный ресурс, касающийся свойств ядерного топлива и материалов, используемых в ядерной энергетике. Научные сотрудники, технологи, конструкторы должны иметь возможность искать нужные документы на основе заданных критериев поиска (простого или сложного) и самостоятельно пополнять библиографическую базу данных по ядерному топливу.

В технических требованиях к единой электронной библиотеке приоритет был отдан простоте работы, информационной безопасности и интеграции с ИТ­системами предприятия:

  • локальность размещения документов и многопользовательский доступ;
  • удаленный доступ к документам и их защита от несанкционированного использования;
  • дружелюбный интерфейс;
  • программные продукты отечественной разработки;
  • совместимость с САПР КОМПАС­3D как основным инструментом работы сотрудников фирмы.

Ранее в конструкторском отделе НПФ «Сосны» уже была внедрена система управления проектными данными ЛОЦМАН:ПГС и шла промышленная эксплуатация системы управления организационно­распорядительской документацией ЛОЦМАН:ОРД. Поэтому было предложено реализовать архив научно­технической документации на базе двух этих систем, которые были хорошо знакомы сотрудникам предприятия, с разработкой специализированного модуля по занесению и поиску документов и построению отчетов.

На этапе обследования были выяснены основные виды научно­технических документов и атрибуты для их занесения в базу данных. Полученная информация легла в основу технического задания на разработку модуля, где были описаны принципы его работы, приведены эскизы интерфейсов и структура хранения документов в ЛОЦМАН:ПГС (рис. 1).

Рис. 1. Запуск плагинов с боковой панели команд

Рис. 1. Запуск плагинов с боковой панели команд

Наиболее болезненным при создании электронной библиотеки был вопрос об индексировании документов, под которым понимается создание метаданных, описывающих формальные и содержательные атрибуты документа. Большая часть русскоязычных документов не имела электронных версий, и потому приходилось прибегать к самому примитивному сканированию бумажных версий журналов и книг, изданных в те годы, когда слово «компьютер» было знакомо лишь избранным. Это означало, что значительная часть документов будет в графическом формате PDF, тексты которых распознаются специальными средствами. Автоматизация процесса индексирования таких документов существенно усложняла задачу, делая ее сравнимой с задачами распознавания образов и анализа семантики текстов. Поэтому было принято решение о «ручном» индексировании документов. Таким образом, элементарной единицей базы данных по ядерному топливу является документ в формате PDF.

В основу механизма поиска лег принцип индексирования с использованием набора атрибутов, которые записываются в карточку документа. Каждому документу приписываются формальные и содержательные атрибуты. Формальные атрибуты описывают внешние характеристики документа (название, автор, источник и т.п.) и являются его объективной характеристикой. Содержательные атрибуты с помощью ключевых слов отражают суть документа:

  • объект испытания или исследования (топливная композиция, конструкционный материал, твэл, ТВС и т.п.);
  • методы испытания (облучение, нагрев, испытание давлением, испытание агрессивной средой и т.п.);
  • параметры испытания;
  • методы исследования;
  • исследуемые параметры (плотность, теплопроводность, распухание, микроструктура и т.п.);
  • область применения результатов (переработка ОЯТ, методы измерений и т.д.);
  • география применения результатов (типы реакторов).

От качества индексации, то есть подбора ключевых слов, в значительной мере зависит качество поиска документов.

На основе технического задания специалисты РЦ АСКОН­Волга доработали конфигурацию ЛОЦМАП:ПГС/ОРД, создали типы, атрибуты и виды документов, разработали электронные карточки объектов библиотеки. Для часто используемых значений атрибутов были настроены подключаемые справочники (рис. 2).

Рис. 2. Подключение справочников

Рис. 2. Подключение справочников

Рис. 3. Окно внесения условий поиска

Рис. 3. Окно внесения условий поиска

С целью максимального упрощения работы с базой данных документов был создан отдельный механизм поиска с возможностью указания нескольких параметров поиска и с дальнейшим сохранением его результата в «Умных папках» (рис. 3­6).

Рис. 4. Вывод результата простого поиска в отдельном окне

Рис. 4. Вывод результата простого поиска в отдельном окне

Рис. 5. Поиск с сохранением результата и получением отчета

Рис. 5. Поиск с сохранением результата и получением отчета

Отдельный механизм предусмот­рен и для занесения документов в библиотеку: в разработанном модуле пользователю предлагается список атрибутов и окно предварительного просмотра, откуда можно выполнить копирование атрибутов (рис. 7).

Электронная карточка документа просматривается, изменяется или дополняется путем вызова окна Свойства документа. Возможности разработанного модуля позволяют (в случае обнаружения неточностей индексирования) вносить изменения и дополнения в поля, отвечающие как за формальные, так и за содержательные атрибуты. Поля карточки документа следует заполнять, пользуясь справочниками значений атрибутов, а уже во вторую очередь — добавляя новые (не справочные) записи. Любой пользователь, обладающий необходимыми правами, имеет право создавать и редактировать карточки атрибутов документа, а также пользоваться результатами поиска документов. Права на использование ресурсов «Библиографической базы данных по ядерному топливу» выдает администратор с согласия научного руководителя фирмы.

Рис. 6. Отчет по результатам поиска

Рис. 6. Отчет по результатам поиска

Рис. 7. Окно занесения документа

Рис. 7. Окно занесения документа

Поиск нужного документа осуществляется по ключевым словам, задаваемым в соответствующих полях карточки поиска. Например, нужно найти все документы, одновременно содержащие ключевые слова: «нитридное топливо» + «теплопроводность» + «реакторы на быстрых нейтронах». Или найти все документы, автором которых является «Канашов Б.А.». Последняя опция имеет значение для соискателей, которые заинтересованы в поддержании списка своих трудов. Результаты поиска представляются в виде списка документов, доступ к текстам которых осуществляется одним «кликом».

На текущий момент единая электронная библиотека по ядерному топливу ООО НПФ «Сосны» содержит более 1000 полнотекстовых документов о свойствах материалов, положенных в основу компонентов как существующих ядерных реакторов, так и реакторов нового поколения. База данных в ЛОЦМАН:ПГС и разработанный к ней программный модуль прошли опытно­промышленную эксплуатацию, в ходе которой были уточнены требования пользователей и определены дальнейшие шаги по усовершенствованию механизмов поиска и интерфейса. Реализация этих предложений позволит приступить к разработке новых модулей, поддерживающих библиографические разделы по ядерным технологиям, методам испытаний и измерений, контейнерам для перевозки ядерных материалов и радио­активных веществ, поставщикам материалов и оборудования. 

САПР и графика 12`2015