OpenMP.ru - Эффективное программирование

Особенности языка Фортран, взгляд со стороны С

5 апреля 2017dmitry Leave a Comment

Обратный порядок записи массивов. a[i,j] в С будет эквивалентен a(j,i) в Фортране, в обоих случаях j будет бежать по строке, i по столбцу при обычной вложенности циклов сначала по i потом по j. Аллоцирование массивов в памяти Неважно какой, статический… Continue Reading →

Эффективная параллелизация с учетом NUMA

23 августа 2015dmitry Leave a Comment

Корректная параллелизация только вычислительных участков программы недостаточна при масштабировании ПО на более чем один процессор (сокет). Это связано с NUMA policy, точнее ее значением по умолчанию. Для многопроцесорных систем следует учитывать наличие на узле ближней (на этом же сокете) и… Continue Reading →

Shared или private, три простых правила

16 ноября 2014dmitry Leave a Comment

В Openmp параллелизация подкупает своей простотой. Добавил прагму к циклу и хоп — я знаю кунг-фу. Тем не менее такое отношение частенько приводит к разнообразным ошибкам обращения к одной и той же переменной. В OpenMP есть два основных класса переменных… Continue Reading →

Когда shared переменная внезапно становится private

25 декабря 2013dmitry Leave a Comment

Был замечен сайд-эффект от типов хранилища переменных. По умолчанию считается что все переменные в OpenMP секции являются shared. Допустим мы явно объявляем какой то int как shared:

Вопросы миграции процессов

27 сентября 2012dmitry Leave a Comment

С точки зрения производительности параллельной программы пиннинг (привязка процесса к ядру процесса) очень важен. Во первых не прикрепленный (pinned) процесс постоянно вынужден мигрировать по ядрам и даже сокетам, что приводит к частой инвалидации содержимого кэша и как следствие — увеличение… Continue Reading →

Тренинг по оптимизации ПО

25 мая 2011admin Leave a Comment

В МГУ прошла первая часть тренинга по оптимизации ПО. Пользователи кластеров МГУ (Чебышев и Ломоносов) приносили свои исходные коды, а инструкторы компании Intel рассказывали об инструментах для оптимизации и на живом примере показывали как они работают. http://msu-intel.parallel.ru/?q=node/81 Работа была построена… Continue Reading →

Развитие стандарта MPI

9 сентября 2009dmitry Leave a Comment

Не так давно (4 сентября 2009г) была принята новая версия стандарта MPI-2.2. В основном содержащий косметические изменения по сравнению с предыдущим вариантом (уточнения различных моментов, введение новых типов данных). Полный вариант стандарта (и всех предыдущих) в формате pdf можно скачать… Continue Reading →

Проверка кластерной сети

14 апреля 2009dmitry Leave a Comment

Одна из основных проблем крупных кластеров — это поддержка работоспособного состояния сетевой системы. Кроме терминального состояния «коннект отпал» возможны так же промежуточные варианты — падения скорости или возникновение задержек. Ситуация усугубляется тем что сложная фабрика может реагировать на битый кабель… Continue Reading →

Вышел обновленный FFTW-3.2alpha

18 января 2009dmitry Leave a Comment

Наконец-то дождались. Судя по сайту fftw.org казалось автор совершенно забросил свое творение, и тут новая версия. В нем анонсирована поддержка MPI FFT преобразования. Теперь можно потихоньку начинать переезжать с 2.1.5. Поскольку это еще альфа, документации пока нет. Но вообщем то… Continue Reading →

Архитектура современных суперкомпьютеров

12 сентября 2008dmitry 4 комментария

Эта обзорная статья, в которой я постараюсь избегать подробностей и ненужных деталей, предназначена она в основном для новичков. Есть два подхода при построении современных суперкомпьютеров — системы с общей памятью и так называемые кластеры. Каждый подход не исключает другого, у… Continue Reading →