Организация вычислительных систем



              

Классы параллельных систем - часть 2


Этот подход позволяет создавать компьютеры, включающие в себя тысячи процессоров.

Но эта архитектура имеет 2 существенных недостатка:

  • требуется быстродействующее коммуникационное оборудование, обеспечивающее среду передачи сообщений;
  • при создании программ необходимо учитывать топологию системы и специальным образом распределять данные между процессорами, чтобы минимизировать число пересылок и объем пересылаемых данных.

Последнее обстоятельство и мешает широкому внедрению подобных архитектур.

К данному классу можно отнести компьютеры Intel Paragon, IBM SP1, Parsytec, IBM SP2 и CRAY T3D.

Компьютеры Cray T3D и T3E используют единое адресное пространство (общая виртуальная память) (см. рис. 11.1). По аппаратному прерыванию особого случая адресации ОС выполняет пересылку страницы с одного узла на другой. У каждого МП своя локальная память, но единое виртуальное адресное пространство.

Структура супер-ЭВМ Cray T3D

Рис. 11.1.  Структура супер-ЭВМ Cray T3D

Факторы, снижающие производительность параллельных компьютеров:

  1. Закон Амдала.

    В табл. 11.1 показано, на какое максимальное ускорение работы программы можно рассчитывать в зависимости от доли последовательных вычислений и числа доступных процессоров.

    Таблица 11.1.

    Число ПЭДоля последовательных вычислений50%25%10%5%2%
    21,331,601,821,901,96
    81,782,914,715,937,02
    321,943,667,8012,5519,75
    5121,993,979,8319,2845,63
    20482,003,999,9619,8248,83
  2. Время инициализации посылки сообщения (латентность) и время передачи сообщения по сети.

    Максимальная скорость передачи достигается на больших сообщениях, когда латентность, возникающая лишь вначале, не столь заметна на фоне непосредственно передачи данных.

  3. Возможность асинхронной посылки сообщений и вычислений.

    Если или аппаратура, или программное обеспечение не поддерживают возможности проводить вычисления на фоне пересылок, то возникнут неизбежные накладные расходы, связанные с ожиданием полного завершения взаимодействия параллельных процессов.

  4. Неравномерная загрузка всех процессорных элементов.




    Содержание  Назад  Вперед