Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

24 ноября 2009 года состоялся 4-й ежегодный симпозиум «Высокопроизводительные вычисления», организованный корпорацией Intel. В четвёртый раз на эту встречу собрались представители индустрии, науки и образования, использующие параллельные кластерные технологии для решения практических задач, чтобы обсудить текущие и стратегические потребности в области НРС (High-performance computing – высокопроизводительные вычисления).

В первой части встречи были заслушаны шесть докладов.

Виктор Самофалов, директор академических и исследовательских проектов Intel в России и СНГ. 4-й ежегодный симпозиум «Высокопроизводительные вычисления», Москва. 24 ноября 2009 г. Фото: Александр Семёнов.

Корпорация Intel уже два года проводит конкурс на лучшие приложения для параллельных вычислений, в этом году его поддержала корпорация «Роснано», суперкомпьютерный консорциум университетов России и программа СКИФ. Есть идея каким-то образом объединить этот симпозиум и конкурс.Открыл её Виктор Самофалов, директор академических и исследовательских проектов Intel в России и СНГ. Он подчеркнул, что всё большее значение в сфере высокопроизводительных вычислений (HPC) приобретает ПО. Сообщество НРС в России уже сформировано и есть все основания расширять формат его встреч, пытаясь сделать нечто подобное Форуму для разработчиков Intel.

Что же Intel делает для НРС?

В основе всего (первый уровень) лежат аппаратные решения, о них был специальный доклад.

Второй уровень – это ПО. Intel разрабатывает все необходимые инструменты для разработчиков приложений для НРС.

Очень важно подчеркнуть платформенный подход Intel к оборудованию для НРС. Когда заказчик получает кластер, это не просто набор железа и ПО. Они связаны воедино и сертифицированы, т.е. Intel гарантирует бесперебойную работу всего комплекса. Даже приложения оптимизируются для работы на конкретном кластере.

Третий верхний уровень – это приложения. Intel не разрабатывает приложения сам, а создает инструменты для их разработки.

Сегодня существует несколько уровней параллелизма. Первый – параллелизм на уровне общей памяти. Следующий уровень параллелизма – на уровне кластера, т.е. нескольких машин, связанных между собой. На сегодняшний день стандартом здесь является MPI (Message Passing Interface, интерфейс передачи сообщений).

Если говорить о ПО, разрабатываемом в Intel для НРС, то здесь есть четыре направления. Первое и второе – это компиляторы и библиотеки. В последние годы компиляторы существенно изменились и стали ориентироваться на многоядерность. То же самое касается и библиотек. Использование библиотек существенно ускоряет работу программ и приложений. Третье – это работа на уровне общей памяти и нитей, четвёртое – на уровне кластера. Стоит специально отметить Intel Parallel Studio, как инструмент упрощённой работы для кластеров под Windows.

Очень интересные инструменты Intel предназначены для оптимизации программного кода. Стоит обратить внимание на Intel Trace Collector and Analisator. Именно он помогает анализировать программу и искать в ней ошибки. С его помощью можно увидеть проблемные места программы, занимающие много времени. При этом не надо думать, что эти инструменты заменяют голову программиста: устранять ошибки придётся самостоятельно. Инструментов много, и было решено их объединить в один – Cluster Tool Kit Compiler Edition. Он состоит из компиляторов – как правило, у Intel их два – С и Fortran. К ним есть библиотеки, которые тоже оптимизированы под последние архитектуры процессоров. Intel делает и свой собственный MPI, чтобы он был оптимизирован под платформы Intel и не зависел от аппаратуры.

У корпорации Intel есть специальный сайт под названием whatif. Любой желающий попробовать новые разработки Intel (правда, не промышленные) может это сделать здесь.

Важнейшее значение в своей работе Intel придаёт развитию экосистемы – университетам, научным учреждениям, промышленным предприятиям, интеграторам и разработчикам ПО, а также правительственным организациям. Одна из форм работы с экосистемой – это центры компетенции. Наиболее известный из них – по НРС в МГУ. Есть еще один при академии наук в Новосибирске. В Южно-Уральском государственном университете центр сосредоточен на взаимодействии с промышленностью. Кроме этого у Intel есть 7 лабораторий в университетах, и, по крайней мере, 5 из них ориентированы на развитие НРС. Intel поддерживает и проводит семинары и конференции по НРС, проводятся мастер-классы по параллельным вычислениям. Intel стал первым ассоциированным членом суперкомпьютерного консорциума университетов России. Сегодня 48 университетов активно сотрудничают с Intel, 160 преподавателей бесплатно получили лицензии на продукты Intel и используют их в своих образовательных целях. Корпорация так интенсивно сотрудничаем с российскими университетами, потому что основные суперкомпьютеры в стране сегодня сосредоточены в ВУЗах.

Владимир Воеводин, заместитель директора НИВЦ МГУ, член-корреспондент РАН. 4-й ежегодный симпозиум «Высокопроизводительные вычисления», Москва. 24 ноября 2009 г. Фото: Александр Семёнов.

Консорциум был образован в декабре 2008 года, но сделано уже немало. Сейчас очень активно ведутся разговоры о необходимости суперкомпьютерного образования и нужно ли оно вообще. Если взять ТОР50 самых мощных суперкомпьютеров СНГ, то каждый должны обслуживать как минимум 10 человек. На каждом суперкомпьютере работает какое-то количество пользователей. В МГУ на суперкомпьютере «Чебышёв» зарегистрировано 240 групп пользователей. В результате простых арифметических операций получаем, что сегодня на суперкомпьютерах работают несколько тысяч человек. Где взять столько грамотных специалистов, которых сейчас целенаправленно никто не готовит. А ведь это только ТОР50. Параллельные вычисления сегодня нужны всюду и всюду используются, но нигде не преподают основы этих вычислений. Для координации усилий в этом направлении и был создан университетский консорциум.Второй доклад о делах и планах суперкомпьютерного консорциума университетов России сделал Владимир Воеводин, заместитель директора НИВЦ МГУ, член-корреспондент РАН.

Москва, 19 марта 2008 г. – В Московском государственном университете имени М.В.Ломоносова создан самый мощный в России и СНГ суперкомпьютер. Ректор МГУ В.А.Садовничий предложил дать новому суперкомпьютеру имя собственное «Чебышёв» в честь русского математика и механика, Пафнутия Львовича Чебышёва (1821 – 1824).

Пиковая производительность самого мощного в России, СНГ и Восточной Европе суперкомпьютера СКИФ МГУ, построенного на базе 625 blade-лезвий производства «Т-Платформы» с 1250 четырехъядерными процессорами Intel® Xeon® E5472, составила 60 триллионов операций в секунду (TFlops).

Инициаторами его создания выступили 4 университета (Московский государственный университет имени М.В.Ломоносова, Нижегородский государственный университет имени Н.И.Лобачевского, Томский государственный университет, Южно-Уральский государственный университет), сейчас в составе консорциума уже более 20 университетов (в том числе, Самарский государственный аэрокосмический университет имени С.П. Королёва - СГАУ, прим. ред.), и есть много желающих в него вступить. Среди ассоциированных членов есть коммерческие компании (Intel стал первым таким членом) и академические институты.

На отчётном собрании консорциума 7 октября было много представителей промышленности – из АФК «Система», из нефтяной отрасли, из двигателестроительной корпорации и т.п. Интересно отметить, что развиваются нетрадиционные формы учебного процесса, такие как Интернет-университет суперкомпьютерных технологий. Он создан на базе Нижегородского университета, развивает его Виктор Павлович Гергель. Идея состоит в том, что опытные преподаватели со всей России с помощью Интернет-трансляций читают лекции всем желающим. В любой момент лекции каждый слушатель может задать вопрос преподавателю. Ещё одна новинка – коллективный банк тестов по параллельным вычислениям «Сигма».

Консорциум активно поддерживает три всероссийские конференции по параллельным вычислениям, на которых, кстати, объявляются весенняя и осенняя версии списка ТОР50. В конце октября прошла молодёжная школа на базе Нижегородского университета, где участники смогли услышать лекции самого разного уровня по суперкомпьютерным параллельным вычислениям. Школа получилась очень сильной, слушателям были продемонстрированы возможности суперкомпьютерных вычислений в самых разных отраслях.

Наконец, в издательстве МГУ выходит книга (при спонсорской поддержке Intel) с описанием реальных приложений суперкомпьютерных вычислений (под названием «Суперкомпьютерные технологии в науке, образовании и промышленности» – прим. ред.). В ней 26 больших статей, красочные фотографии, комментарии и большое количество коротких материалов. Хочется отметить статью об использовании суперкомпьютеров в НПО «Сатурн», традиционно широко они используются в нефтяной отрасли. Есть работы о прогнозе погоды и климатических изменениях. Очень интересная статья посвящена расчёту горнолыжного комплекса в Красногорске: оказывается только на суперкомпьютере можно просчитать климат внутри этой «трубы» при различных внешних температурах. Не менее интересен и расчёт оптимального профиля колёсной пары для железнодорожного вагона, который, к сожалению, до сих пор не востребован реальным производством. Суперкомпьютеры позволяют сделать подробный анализ генетической последовательности в процессе образования новых видов растений и животных на нашей планете, проектировать материалы для солнечных батарей и оптимизировать раскрой трикотажных изделий. Все тексты этой книги в самое ближайшее время будут доступны в Интернете.

Суперкомпьютерный консорциум планирует активно развивать свою издательскую деятельность, и в будущем появятся другие книги, а также образовательные курсы для студентов. Будет развиваться и международное сотрудничество с поездками наших преподавателей на стажировку за рубеж и приглашением ведущих западных специалистов для чтения лекций в России.

5 октября в МГУ началось обучение специальной группы по суперкомпьютерам, в которой обучается 37 человек с разных факультетов. Это дополнительная форма обучения – три раза в неделю по две пары с 18 часов. В декабре обучение будет завершено. Очень большое внимание этим начинаниям уделяет ректор МГУ В.А.Садовничий.

Далее Дмитрий Дождев, специалист по высокопроизводительным системам Московского исследовательского центра компании «Шлюмберже» («Schlumberger») рассказал о практическом применении НРС-технологий при моделировании процессов в Московском исследовательском центре компании «Шлюмберже».

Компания «Шлюмберже» – один из крупнейших в мире потребителей суперкомпьютерных вычислений и НРС-систем. Суперкомпьютеры компании не входят в ТОР500 по разным соображениям, но вполне могли бы быть там – это типичная ситуация для коммерческих структур. В компании «Шлюмберже» сейчас трудится около 80 тысяч человек, в России она присутствует с начала 90-х годов. Шлюмберже инвестирует значительные средства в научно-исследовательскую деятельность, у компании 57 научных и 5 исследовательских центров, её сотрудники присутствуют в 80 странах. Было время, когда «Шлюмберже» занималась производством процессоров, но потом этот бизнес был продан компании Intel. Сейчас «Шлюмберже» занимается всем, что связано с разведкой и добычей полезных ископаемых. Например, может взять на себя управление полным циклом существования любого месторождения. Сейсмическая разведка подземных недр – один из основных потребителей НРС-вычислений.

В вычислительном центре «Шлюмберже» ведутся самые разные исследования – моделирование пластов, обработка результатов сейсмической и акустической разведки, геомеханические расчёты. Очень много проектов делается совместно с академическими институтами. В среднем расчёты идут на 1-10 миллионах ячеек, но уже есть и задачи для 100 миллионов ячеек, готовится переход и на миллиард ячеек. Для этих расчётов используются как собственные разработки, так и стандартные наборы программ, в частности, для моделирования.

Настоящим прорывом для вычислительного центра «Шлюмберже» стал переход на архитектуру Nehalem процессоров Intel. Скорость расчётов ощутимо выросла, в 2-3 раза, гораздо эффективнее стало работать моделирование. Г-н Дождев подчеркнул, что между памятью и процессором стоит процессорная шина типа точка-точка Intel QuickPath Interconnect (QPI), а между серверами – высокоскоростная коммутируемая последовательная шина Intel Infiniband.

Одна из больших проблем при работе с высокопроизводительными вычислениями и суперкомпьютерами – это отсутствие квалифицированных специалистов, нет сомнения в том, что давно пора приступать к их целенаправленной подготовке. Компания «Шлюмберже» начала работать с кластерными вычислениями в 2002-2003 гг. и пять лет нарабатывала собственную экспертизу для эффективной работы с ними. Процесс очень сложный, потому что многие из тех, кто разбирается в высокопроизводительных вычислениях не разбираются в физике процесса и наоборот. Зато набрав этот опыт, уже в начале 2010 года ВЦ «Шлюмберже» переходит к многомесячным расчётам с использованием 1000 ядер процессоров.

Владимир Цымбал, инженер, технический консультант Intel подразделения SSG. 4-й ежегодный симпозиум «Высокопроизводительные вычисления», Москва. 24 ноября 2009 г. Фото: Александр Семёнов.

Первая компания – Cimatron. Её центр разработки находится в Израиле, почти все разработчики, а их 40 человек, приехали из Санкт-Петербурга. К 2008 году было реализовано более 20 тысяч инсталяций продукта Cimatron (система автоматического проектирования CAD) по всему миру. Проект разрабатывался в среде Microsoft Visual studio 2008. Продукт содержит 5 миллионов строк кода на С++, три сотни библиотек, очень много кода сторонних производителей. При разработке использовался компилятор Intel, и разработчики жаловались на большое количество проблем. Авторы попытались самостоятельно распараллелить программу, она на двухядерных процессорах стала исполняться быстрее, а на четырехядерных почему-то медленнее. Для отлаживания продукта авторы сами попробовали использовать Intel Thread Checker, который помогает находить ошибки многопоточности. К сожалению, этот продукт просто не заработал с их программой. Задачу удалось решить только с помощью экспертов Intel: программа была настолько сложна, что Intel trade checker работал по несколько суток для проверки отдельных частей. В результате, после нахождения и устранения двух ошибок всё заработало.Инженер, технический консультант Intel подразделения SSG Владимир Цымбал рассказал об истории успешного использования программных инструментов Intel компаниями-разработчиками ПО.

Второй инструмент, который использовали авторы – это профилировщик программ Intel Thread Profiler. С его помощью также удалось найти несколько ошибок. После устранения всех ошибок этим инструментом, оказалось, что программа смогла работать на компьютерах с двухядерными процессорами. Скорость работы программы увеличилась на 27%, а на четырехядерных процессорах – на 43%. И это прекрасный результат для такого большого продукта.

Второй пример – это проект трёхмерного моделирования и симулирования компании Open Cascade, применимый в самых разных областях – машиностроении, судостроении, авиастроении. С помощью продуктов Intel специалистам удалось отыскать некоторые ошибки, после чего работа отдельных элементов программы увеличилась в 10 раз, а всего комплекса в два раза.

Используя Intel Parallel Inspector – инструмент для поиска ошибок памяти и многопоточности, который помогает улучшать корректность работы приложений – удалось найти ошибки, которые приводили к нестабильности в работе.

Здесь очень важно отметить, что и Сimatron, и Open Cascade получили для своей работы Intel Parallel Studio ещё на стадии альфа-тестирования, и они не только использовали его для работы над собственными продуктами, но и давали Intel рекомендации по его улучшению. В результате в продукт Intel было внесено около 30 изменений. Это значит, что в продукты Intel при их совершенствовании вносится не только труд тысяч экспертов Intel, но и гораздо более широкого сообщества разработчиков.

НРС: жизнь в параллельном мире. Часть 2

----

«я-ИТ-ы» в Самаре – слагаемые карьеры

«я-ИТ-ы» в Самаре – слагаемые карьеры. Статья Владислава Боярова. 29.03.2024 г.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть четвёртая

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть четвёртая. Статья Владислава Боярова. 12.03.2024 г.

«Домашний компьютер». Конкурс в Самаре.

«Домашний компьютер». Конкурс в Самаре.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть третья, объединительная

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность.

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность. Статья Ильи Вайцмана. 11.12.2023 г.