9 - 2004

Высокопроизводительные кластеры нового поколения в задачах обработки сейсморазведочных данных

Елена Aнуфрикова, Алексей Билан (ARBYTE) Валерий Кутов, Николай Кушнеров, Александр Яковлев (LARGE Ltd), Александр Юдовин (Paradigm Geophysical), Ларри Айрон (Tricon Geophysics), Билл Кемпс (ESS Solutions)

Компании ARBYTE и LARGE завершили пилотный проект, направленный на оценку возможностей кластера ARBYTE Zeeger Geo 64 для решения геофизических задач. Новый вычислительный комплекс, сочетающий преимущества кластерных технологий и мощность 64-разрядного процессора Intel Itanium 2, состоит из пяти серверов Alkazar TI-4 и TI-2, объединенных гигабитным коммутатором. Суммарный объем оперативной памяти составляет 48 Гбайт, а общее число процессоров Intel Itanium 2 достигает 12.

LARGE — ведущая сервисная геофизическая компания, специализирующаяся на проведении 2D- и 3D-сейсморазведки на море и выполняющая обработку больших объемов сейсмической информации. В настоящее время в распоряжении компании имеются три корабля, оборудованных современными системами для сбора и обработки сейсмической информации, и вычислительный центр в операционном офисе в Москве.

Компания реализует крупные проекты для международных нефтяных компаний, в связи с чем значительно возросли объемы обработки, и поэтому в прошлом году компания приобрела высокопроизводительный сервер SunFire 6800 фирмы Sun Microsystems, который включает 24 процессора. «Сегодня перед нами встали новые задачи, для решения которых мощности этого сервера уже не хватает, — рассказал Александр Яковлев, начальник отдела обработки сейсмических данных. — Поэтому мы решили испытать новый кластер ARBYTE с процессорами Itanium 2».

Для проверки возможностей кластера были выбраны наиболее сложные вычислительные задачи сейсморазведки — глубинная и временн а я миграции до суммирования и временн а я миграция после суммирования. Глубинные миграционные преобразования до суммирования позволяют получить значительно более точное сейсмическое изображение в глубинном масштабе. Однако именно эти алгоритмы являются наиболее ресурсоемкими, поскольку для высокоточной интерпретационной обработки результатов требуется огромный объем вычислений. Уже на начальном этапе временной обработки приходится выполнять целый ряд весьма трудоемких процедур, таких, например, как расчет статических поправок по алгоритму Монте-Карло или фильтрация кратных волн, требующая преобразования в TAU-P-область, причем при проведении расчетов их необходимо ускорять средствами вычислительной техники.

Сейчас на рынке представлено несколько платформ для обработки массивов сейсмических данных. Самой дешевой из них является кластер, состоящий из нескольких машин на базе 32-разрядных процессоров корпорации Intel, который стоит несколько десятков тысяч долларов. Однако эти системы имеют ряд ограничений. В частности, адресация не более 2 Гбайт оперативной памяти не позволяет выполнять миграцию до суммирования на больших объемах данных. Кроме того, цена лицензий на ПО, которая обычно зависит от числа процессоров, в конечном счете может свести на нет всю выгоду от экономичного аппаратного решения.

До настоящего времени основой аппаратной базы геофизических сервисных компаний были дорогие многопроцессорные серверы компаний Sun Microsystems и SGI, которые обладают высокой производительностью, но и стоят несколько сотен тысяч долларов.

В 2002 году компания Intel выпустила процессоры Intel Itanium 2, и 64-разрядная технология вместе с вновь разработанными системами команд оказалась оптимальной для обработки сейсмической информации. На данный момент большинство поставщиков программных продуктов для геофизики имеют версии под Intel Itanium 2. Как показали испытания ARBYTE и LARGE, кластер на базе 64-разрядных процессоров Intel Itanium 2 отличается высокой производительностью, характерной для более дорогих систем, при этом стоит гораздо меньше последних. В ходе тестирования использовались программные пакеты GeoDepth и Focus 5.2 (EPOS 3.0) от компании Paradigm Geophysical и Tsunami от Tricon Geophysics. Это стало возможно лишь теперь, когда производители перенесли их на 64-разрядную архитектуру Intel. Благодаря специально разработанному компилятору под Itanium 2 удается достигать оптимальной трансляции кода и, как следствие, эффективно использовать ресурсы процессора — кэш-памяти и оперативной памяти.

«Результаты тестирования продуктов компании Paradigm, которое было проведено на платформе Intel Itanium в мае этого года, говорят, например, не только о показателях производительности, но и о том, что все больше компаний — разработчиков программного обеспечения рассматривают переход на передовые платформы Intel в качестве конкурентного преимущества для своих продуктов», — отметил Сергей Громов, директор российского представительства Intel по развитию корпоративных проектов в топливно-энергетическом комплексе.

Для тестирования был выбран кластер, состоящий из пяти узлов. В качестве управляющего узла использовался сервер Alkazar TI-4 с четырьмя процессорами Itanium 2 с частотой 1,5 ГГц и 16 Гбайт оперативной памяти, а для вычислительных узлов — четыре сервера Alkazar TI-2, каждый с двумя процессорами Itanium 2 с частотой 1,4 ГГц и 8 Гбайт оперативной памяти. Дисковое пространство состояло из трех дисков общей емкостью 438 Гбайт на управляющем узле и из одного диска емкостью 73 Гбайт на каждом вычислительном узле. Для соединения узлов применялась технология Gigabit Ethernet, которая использовалась для выполнения функции передачи данных и управления кластером.

Хочется отметить, что работы подобного рода были проведены впервые в России и не являлись чисто академическим исследованием, а входили в цикл промышленной обработки больших объемов сейсмических данных.

Результаты проверки показали, что по сравнению с многопроцессорными SMP-машинами компании Sun кластер в несколько раз сокращает время миграции. А проведение компанией LARGE временной миграции после суммирования (PostStack Time 3D Migration) для 3D-сейсмической съемки на программном продукте Focus 5.2 Paradigm Geophysical показало на четырехпроцессорном узле Arbyte Geo 64 в 4,13 раза лучший по времени результат, чем на SUNFire 6800.

Временной разрез по инлайну 3D-куба до и после миграции (шельфовая зона Индии)

Временной разрез по инлайну 3D-куба до и после миграции (шельфовая зона Индии)

Для осуществления глубинной и временной миграции до суммирования (PreStack Depth/Time Migration (PSDM/TM)) использовались программные пакеты GeoDepth (Epos3.0) компании Paradigm Geophysical и Tsunami фирмы Tricon Geophysics. Это пакеты изначально ориентированы на использование кластерной технологии и 64-разрядной архитектуры Intel Itanium 2.

«Широкомасштабное внедрение 64-разрядной архитектуры в российских геофизических центрах позволяет решить несколько задач, — сообщил Александр Юдовин, директор по маркетингу и технологиям московского представительства компании Paradigm Geophysical. — Во-первых, сокращается время и повышается точность решения задач. Во-вторых, за счет снижения стоимости единицы вычислений новейшие информационные технологии становятся гораздо доступнее для широкого круга пользователей. Применение этих технологий повысит эффективность и конкурентоспособность не только наших пользователей, но и всей нефтяной и газовой промышленности России».

Последовательность улучшения разреза по инлайну (слева направо): начальная сумма; сумма после применения процедур временной обработки; результат применения процедур миграции

Последовательность улучшения разреза по инлайну (слева направо): начальная сумма; сумма после применения процедур временной обработки; результат применения процедур миграции

Наряду с хорошо известными на российском рынке продуктами компании Paradigm Geophysical было проведено тестирование нового продукта Tsunami PSDM/TM по алгоритму Киргоффа от компании Tricon Geophysics, который оптимизирует параллельные вычисления, позволяя значительно увеличивать скорость миграций. После ряда мероприятий по настройке программного обеспечения для работы на кластере удалось получить хорошее качество данных и высокую скорость вычислений. Как объяснил Николай Кушнеров, главный специалист по сейсмической обработке компании LARGE, более высокая скорость расчетов с использованием пакета Tsunami связана с тем, что его алгоритмы максимально эффективно адаптированы под архитектуру процессора Intel Itanium 2. «Поэтому наибольшее преимущество по времени счета в процессах миграции достигается при сочетании программного продукта Tsunami с архитектурой Intel Itanium 2, — подчеркнул г-н Кушнеров. — Это очень эффективное сочетание».

Как показывает опыт эксплуатации подобных систем, заказчики стараются обеспечить их максимальную загрузку, а это возможно при работе нескольких программных продуктов на кластере. Таким образом, от подобных систем требуется известная универсальность.

Кластер ARBYTE Zeeger Geo 64 на базе Intel Itanium 2 является оптимальным решением и по цене.

Cерьезный выигрыш достигается по сравнению с 32-разрядной архитектурой Intel. Для обеспечения сравнимой производительности вместо 20-30 узлов на базе Intel Xeon требуется 6-8 узлов на Intel Itanuim 2, что позволяет сократить как расходы на программные пакеты, так и общие затраты на поддержание системы.

Кластер ARBYTE Zeeger Geo 64 обходится значительно дешевле, чем многопроцессорные серверы Sun, превосходя их по производительности. Так, по словам Елены Ануфриковой, менеджера нефтегазового направления компании ARBYTE, «стоимость 12-процессорного кластера ARBYTE Zeeger Geo 64 — порядка 100 тыс. долл., включая доставку, инсталляцию у заказчика, пусконаладочные работы и годовое сервисное обслуживание».

«Это соотношение говорит о том, что в нашей отрасли будущее за серверами на Itanium 2, — отметил Николай Кушнеров. — Сейчас, когда производители оптимизировали свое программное обеспечение под 64-разрядный Linux для этого процессора, я думаю, что не пройдет и года, как произойдет полное перевооружение сервисных компаний».

Дело в том, что повышение мощности вычислительной техники позволяет значительно увеличить точность результатов, получаемых при обработке данных сейсморазведки. «Раньше миграция одного куба на сервере SunFire занимала месяц, на новом кластере — два-три дня. Теперь мы можем выполнять миграцию столько раз, сколько необходимо для подбора параметров, модели. А чем точнее модель, тем правильнее будет наш прогноз», — пояснил Николай Кушнеров.

LARGE собирается переоснастить такими кластерами свои суда, предназначенные для 3D-сейсморазведки. Это обеспечит компании дополнительные преимущества, ведь данные являются коммерческой тайной и заказчики заинтересованы в их сохранности. Как правило, на борту корабля присутствует представитель заказчика, который следит за сохранностью информации. Установив на борту кластер Arbyte Zeeger Geo64, компания LARGE сможет выйти на новый рынок — рынок услуг по проведению PreStack Time Migration непосредственно на борту судна. Это позволит обойтись без передачи данных для обработки на стационарные центры и тем самым повысить степень их сохранности, а также сэкономить время.

В мире такие услуги только начинают появляться, и выход на передовые технологические рубежи даст LARGE возможность повысить свою конкурентоспособность. «Как правило, наши заказчики — это международные фирмы, — заявил Александр Яковлев. — Конкуренция среди сервисных компаний, занятых морской сейсморазведкой, сейчас очень сильна. Чтобы победить в этой борьбе, необходимы самые современные технологии».

Важным достоинством кластера также является его модульная архитектура, позволяющая легко заменять и наращивать узлы. Расширенная техническая поддержка ARBYTE предусматривает проведение регламентных работ для превентивного устранения потенциальных проблем и оперативное реагирование (в течение нескольких часов) на нештатные ситуации.

«САПР и графика» 9'2004