Смекни!
smekni.com

Прогноз развития супер ЭВМ (стр. 3 из 4)

В развитии вычислительных средств можно выделить три основные проблемы:

- повышение производительности;

- повышение надежности;

- покрытие семантического разрыва.

Этапы развития вычислительных средств принято различать по поколениям машин. Характеристика поколения определяется конкретными показателями, отражающими достигнутый уровень в решении трех перечисленных проблем. Поскольку подавляющий вклад в развитие вычислительных средств всегда принадлежал технологическим решениям, основополагающей характеристикой поколения машин считалась элементная база. И действительно, переход на новую элементную базу хорошо коррелируется с новым уровнем показателей производительности, надежности и сокращения семантического разрыва.

В настоящее время актуальным является переход к новым поколениям вычислительных средств. По сложившейся традиции решающая роль отводится технологии производства элементной базы. В то же время становится очевидным, что технологические решения утратили монопольное положение. Так, например, в ближайшей перспективе заметно возрастает значение проблемы покрытия семантического разрыва, что отражается в необходимости создания высокосложных программных продуктов и требует кардинального снижения трудоемкотси программирования. Эта проблема решается преимущественно архитектурными средствами. Роль технологии здесь может быть только косвенной: высокая степень интеграции создает условия для реализации архитектурных решений.

В настоящее время одним из доминируюших направлений развития суперЭВМ являются вычислительные системы c MIMD-параллелизмом на основе матрицы микропроцессоров. Для создания подобных вычислительных систем, состоящих из сотен и тысяч связанных процессоров, потребовалось преодолеть ряд сложных проблем как в программном обеспечении (языки Parallel Pascal, Modula-2, Ada), так и в аппаратных средствах (эффективная коммутационная среда, высокоскоростные средства обмена, мощные микропроцессоры). Элементная база современных выcокопроизводительных систем характеризуется выcокой степенью интеграции (до 3,5 млн. транзисторов на кристалле) и высокими тактовыми частотами (до 600 МГц).

В настоящее время все фирмы и все университеты США, Западной Европы и Японии, разрабатывающие суперЭВМ, ведут интенсивные исследования в области многопроцессорных суперЭВМ с массовым параллелизмом, создают множество их типов, организуют их производство и ускоренными темпами осваивают мировой рынок в этой области. Многопроцессорные ЭВМ с массовым параллелизмом уже сейчас существенно опережают по производительности традиционные суперЭВМ с векторно-конвейерной архитектурой. Системы с массовым параллелизмом предъявляют меньшие требования к микропроцессорам и элементной базе и имеют значительно меньшую стоимость при любом уровне производительности, чем векторно-конвейерные суперЭВМ. Уже в текущем десятилетии производительность суперЭВМ с массовым параллелизмом достигнет колоссальной величины - десятков тысяч миллиардов операций в секунду с плавающей запятой над 64-разрядными числами (десятков Тфлопс).

На ежегодной конференции в Чепел-Хилл(Сев.Каролина) представлен проект фирмы IBM, целью которого является создание гиперкубического параллельного процесора в одном корпусе. Конструкция, названная Execube, имеет 8 16-разрядных микропроцесоров, встроенных в кристалл 4Мбит динамического ЗУ(ДЗУ). При этом степень интеграци составляет 5 млн. транзисторов. Микросхема изготовлена по КМОП-технологии с тремя уровнями металлизации на заводе IBM Microelectronic (Ясу,Япония). Execube представляет собой попытку повышения степени интеграции процессора с памятью путем более эффективного доступа к информации ДЗУ. По существу, память превращается в расширенные регистры процессоров. Производительность микросхемы составляет 50 млн оп/с.

Фирма CRAY Research обёявила о начале выпуска суперкопьютеров CRAY T3/E. Основная характеристика, на которой акцентировали внимание разработчики - масштабируемость. Минимальная конфигурация составляет 8 микропроцессоров, максимальная- 2048. По сравнению с предыдущей моделью T3/D соотношение цена/производительность снижена в 4 раза и составляет 60 долл/Мфлопс, чему способствовало применение недорогих процессоров DEC Alpha EVC, изготовленных по КМОП-технологии. Предполагаемая стоимость модели Т3/Е на основе 16 процессоров с 1-Гбайт ЗУ составит 900 тыс. долларов, а цена наиболее мощной конфигурации (1024 процессора, ЗУ 64 Гбайт) -39,7 млн. долларов при пиковой производительности 600 Гфлопс.

Одним из способов дальнейшего повышения производительности вычислительной системы является объединение суперкомпьютеров в кластеры при помощи оптоволоконных соединений. С этой целью компьютеры CRAY T3/E снабжены каналами ввода/вывода с пропускной способностью 128 Гбайт/с. Потенциальные заказчики проявляют повышенный интерес к новой разработке фирмы. Желание приобрести компьютер изъявили такие организации как Pittsburgh Supercomputer Center, Mobile Oil, Департамент по океанографии и атмосферным исследованиям США. При этом подписано несколько контрактов на изготовление нескольких компьютеров 512-процессорной конфигурации.

Среди японских компаний следует выделить фирму Hitachi, которая выпустила суперкомпьютер SR2201 с массовым параллелизмом, содержащий до 2048 процесоров. В основе системы переработанная компанией процессорная архитектура RA-RISC от фирмы Hewlett-Paccard. Псевдовекторный процессор функционирует под управлением ОС HP-UX/MPP Mash 3.0. В компьютере, кроме того, использована система поддержки параллельного режима работы Express, созданная корпорацией Parasoft и получившая название ParallelWare. Производительность нового компьютера составляет 600 Гфлопс. К марту 1999 г. фирма планирует продать 30 суперкомпьютеров.

Одним из наиболее масштабных проектов в области создания вычислительных средств с массовым параллелизмом является проект фирмы Intel по разработке самого быстродействующего компьютера на основе микропроцессоров шестого поколения P6. Новая система , которую планируется установить в Sandia National Laboratories будет состоять из 9000 процессоров Pentium P6 и иметь пиковую производительность 1000 ГФлопс. Заказчиком системы является министерство энергетики США. При этом основной областью применения будет являться моделирование подземных ядерных взрывов , что позволит тратить 25 млн. долларов в год вместо 300 млн.

За последнее десятилетие имеет место следующая днинамика роста производительности параллельных вычислительных систем в США:

1987 г. - 50 Мфлопс

1989 г. - 1 Гфлопс(суперкомпьютеры СМ)

1991 г. - 10 Гфлопс(векторные процессоры и процессоры серии 528)

1994г. - 100 Гфлопс (CRAY,PARAGON)

1996-1997гг. – 200-500 Гфлопс (комбинация векторного процессора и куба поточной обработки).

1998-1999 гг. –1000-3000 Гфлопс (ASCI, T3E)

Особо выдающимися характеристиками отличаются суперкомпьютеры в середине 90-х годов:

- Фирма IBM ALPS (1024 процессора RS6000, производительность 50 Гфлопс);

-Intel Paragon XPS (1872 процессора, производительность 72,9 Гфлопс);

- Thinking Mashines CM5 (512 процессоров Super Spark, производительность 83 Гфлопс);

- NCube 2SM80 (8192 процессора, производительность 84Гфлопс);

- Numerical Wind Tunnel (140 процессоров, производительность 124 Гфлопс на тестах LINPACK);

- Intel Paragon XPS Supercomputer (4000 процессоров 1860XP, производительность 300 Гфлопс)

- Сray Research MPP System (2048 процессоров Alpha, производительность - 300 Гфлопс)

- Thinking Mashines CM5 (16384 процессора Super Spark, производительность 1000 Гфлопс)

Краткие харатеристики наиболее распространенных современных суперкомпьютеров приведены ниже

IBM RS/6000 SP2

Производитель -International Business Machines (IBM), отделение RS/6000.

Класс архитектуры: Масштабируемая массивно-параллельная вычислительная система (MPP).

Узлы имеют архитектуру рабочих станций RS/6000. Существуют несколько типов "SP-узлов", которые комплектуются различными процессорами: PowerPC 604e/332MHz, P2SC/160MHz, POWER3/MHz (более ранние системы комплектовались процессорами POWER2/66 и 77MHz). Возможна установка узлов с SMP-архитекутурой - до 4 процесоров PowerPC. Объем памяти для POWER3-узлов - до 4GB, для PowerPC-узлов - до 3GB.

Доступны конфигурации SP от 2 до 128 узлов (и до 512 по специальному заказу). Узлы устанавливаются в "стойки" (до 16 узлов в каждой). Одна SP-система может содержать узлы различных типов.

Узлы связаны между собой высокопроизводительных коммутатором (IBM high-performance switch), который имеет многостадийную структуру и работает с коммутацией пакетов.

Cистемное ПО: OC AIX (устанавливается на каждом узле). LoadLeveler – система поддержки пакетной обработки. Параллельные приложения исполняются под управлением Parallel Operating Environment (POE).

Средства программирования: поставляется оптимизированная реализация интерфейса MPI (ранее - MPL).

HP 9000 (Exemplar)

Производитель: Hewlett-Packard, High-performance systems division.

Класс:многопроцессорные сервера с общей памятью (SMP).

В настоящее время доступны несколько "классов" систем семейства HP 9000: сервера начального уровня (D,K-class), среднего уровня ( N-class) и наиболее мощные системы (V-class).

Процессоры: 64-битные процессоры c архитектурой PA-RISC 2.0 (PA-8200, PA-8500).

Число процессоров: N-class - до 8 процессоров. V-class - до 32 процессоров. В дальнейшем ожидается увеличение числа процессоров до 64, а затем до 128.

Возможно объединение до 16 SMP-гиперузлов V-class или K-class в кластер "HP Enterprise Parallel Server". Для связи узлов используется коммутатор HP HyperFabric.

Системное ПО: устанавливается операционная система HP-UX (совместима на уровне двоичного кода с ОС SPP-UX компьютеров Convex SPP).

Средства программирования: HP MPI - реализация MPI 1.2, оптимизированная к архитектуре Exemplar. Распараллеливающие компиляторы Fortran/C, математическая библиотека HP MLIB. CXperf - средство анализа производительности программ.