Смекни!
smekni.com

Прогноз развития супер ЭВМ (стр. 4 из 4)

Cray T3E

Производитель: Silicon Graphics

Класс архитектуры: масштабируемая массивно-параллельная система, состоит из процессорных элементов (PE).

В настоящее время существуют две модификации: T3E-900 и T3E-1200.

Процессорный элемент PE состоит из процессора, блока памяти и устройства сопряжения с сетью. Используются процессоры Alpha 21164 (EV5) с тактовой частотой 450 MHz (T3E-900) и 600 MHz (T3E-1000), пиковая производительность которых составляет 900 и 1200 MFLOP/sec соответственно. Процессорный элемент располагает своей локальной памятью (DRAM) объемом от 256MB до 2GB.

Системы T3E масштабируются до 2048 PE.

Процессорные элементы связаны высокопроизводительной сетью с топологией трехмерного тора и двунаправленными каналами. Скорость обменов по сети достигает 480MB/sec в каждом направлении.

Используется операционная система UNICOS/mk.

Поддерживается явное параллельное программирование c помощью пакета Message Passing Toolkit (MPT) - реализации интерфейсов передачи сообщений MPI, MPI-2 и PVM, библиотека Shmem. Для Фортран-программ возможно также неявное распараллеливание в моделях CRAFT и HPF. Среда разработки включает также набор визуальных средств для анализа и отладки параллельных программ.

Cray T90

Производители: Silicon Graphics, Cray Research.

Класс архитектуры: многопроцессорная векторная система (несколько векторных процессоров работают на общей памяти).

Модели Серия T90 включает модели T94, T916 и T932.

Процессор Системы серии T90 базируются на векторно-конвейерном процессоре Cray Research с пиковой производительностью 2GFlop/s.

Число процессоров Система T932 может включать до 32 векторных процессоров (до 4-х в модели T94, до 16 модели T916), обеспечивая пиковую производительность более 60GFlop/s.

Возможно объединение нескольких T90 в MPP-системы.

Система T932 содержит от 1GB до 8GB (до 1 GB в модели T94 и до 4GB в модели T916) оперативной памяти и обеспечивает скорость обменов с памятью до 800MB/sec.

Используется операционная система UNICOS.

Cray SV1

Производитель: Silicon Graphics

Класс архитектуры: масштабируемый векторный суперкомпьютер.

Используются 8-конвейерные векторные процессоры MSP (Multi-Streaming Processor) с пиковой производительностью 4.8 GFLOP/sec; каждый MSP может быть подразделен на 4 стандартных 2-конвейерных процессора с пиковой производительностью 1.2 GFLOP/sec. Тактовая частота процессоров - 250MHz.

Процессоры объединяются в SMP-узлы, каждый из которых может содержать 6 MSP и 8 стандартных процессоров. Система (кластер) может содержать до 32 таких узлов.

SMP-узел может содержать от 2 до 16GB памяти. Система может содержать до 1TB памяти. Вся память глобально адресуема (архитектура DSM).

Используется операционная система UNICOS.

Поставляется векторизующий и распараллеливающий компилятор CF90. Поддерживается также явное параллельное программирование с использованием интерфейсов MPI, OpenMP или Shmem.

Cray Origin2000

Производитель Silicon Graphics

Класс архитектуры: модульная система с общей памятью (cc-NUMA).

Использованы 64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz

Основной компонент системы - модуль Origin, включающий от 2 до 8 процессоров MIPS R10000 и до 16GB оперативной памяти. Поставляются системы Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей. Модули системы соединены с помощью сети CrayLink, построенной на маршрутизаторах MetaRouter.

Используется операционная система SGI IRIX. Поставляется распараллеливающий компилятор Cray Fortran 90. Поддерживается стандарт OpenMP.

Onyx2 InfiniteReality2

Производитель Silicon Graphics

Класс архитектуры: многопроцессорная система визуализации; по аппаратной архитектуре очень похожа на Origin2000.

Система может включать до 128 процессоров MIPS R10000.

Графические возможности системы обеспечивают специальные устройства трех типов: геометрические (векторные) процессоры, растровые процессоры, генераторы аналоговых сигналов. Система может быть оборудована 16 независимыми каналами графического вывода (visualization pipelines). На аппаратном уровне поддерживается графический интерфейс OpenGL.

Используется операционная система SGI IRIX.

Sun HPC 10000 (StarFire)

Производитель Sun Microsystems, серия Sun HPC.

Класс архитектур: многопроцессорный SMP-сервер.

Процессор UltraSPARC II/336MHz

Система StarFire объединяет от 16 до 64 процессоров.

Система включает от 2GB до 64GB памяти.

Системное ПО: ОС Solaris, ПО распределения ресурсов Load Sharing Facility (LSF). Поставляется пакет поддержки параллельных приложений Sun HPC 2.0, включающий такие средства как HPF, MPI, PVM, PFS (параллельная файловая система), Prism (визуальная среда разработки), S3L (библиотека математических подпрограмм), и др.

NEC SX-5

Производитель NEC, серия SX.

Класс архитектуры: параллельный векторный суперкомпьютер (PVP).

Каждый узел системы является векторно-конвейерным SMP-суперкомпьютером, объединяющим до 16 индивидуальных векторных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s).

Объем памяти каждого узла - до 128GB, производительность обменов с памятью достигает 1TB/sec. Система может включать до 32 узлов, обеспечивая совокупную пиковую производительность до 4 TFlop/s.

Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch).

Используется операционная система SUPER-UX.

Поставляются компилятор языка HPF, реализация интерфейса MPI, компиляторы Fortran77/SX и Fortran90/SX с автоматическим распараллеливанием и векторизацией, а также интегрированная среда разработки и оптимизации PSUITE.

Fujitsu VPP

Производитель Fujitsu

Класс архитектуры параллельный векторный суперкомпьютер (PVP).

Модификации VPP300, VPP700, VPP5000

Каждый процессорный элемент (PE) системы VPP700E состоит скалярного устройства (SU), векторного устройства (VU), блока памяти и устройства сопряжения. Для VPP700: VU состоит из 7 конвейеров и обеспечивает пиковую производительность до 2.4 GFLOP/sec. Объем памяти - до 2GB. Для VPP5000: VU состоит из 4 конвейеров, пиковая производительность - 9.6 GFLOP/sec. Объем памяти - до 16GB.

Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительность до 14.4 GFLOP/sec Для VPP5000: до 512 PE, суммарная пиковая производительность до 4.9 TFLOP/sec.

Процессорные элементы связаны коммутатором (crossbar network), который производить двухсторонние обмены, не прерывая вычислений. Пропускная способность каналов коммутатора: для VPP700 - 615MB/sec, для VPP5000 - 1.6GB/sec. Используется операционная система UXP/V, основанная на UNIX System VR4.

Среди средств разработки поставляются: распараллеливающий и векторизующий компилятор Fortran90/VPP, оптимизированная для VPP библиотека математических подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и PVM 3.3.

AlphaServer

Производитель Compaq, Digital.

Высокопроизводительный SMP-сервер, AlphaServer Array - кластерная система.

Процессоры GS140 и GS60 - Alpha 21264, 8400 и 8200 - Alpha 21164

Число процессоров GS140 и 8400 - до 14, GS60 и 8200 - до 6

Объем памяти GS140 - до 28GB.

Кластеры AlphaServer Array могут объединять до 8 узлов AlphaServer, т.е. в общей сложности до 112 процессоров. Могут комбинироваться узлы различных типов. Узлы связываются между собой коммутатором MEMORY CHANNEL, который обеспечивает скорость обменов до 66MB/sec и латентность порядка 3 мкс.

На платформе AlphaServer поддерживаются операционные системы Tru64 UNIX (это новое имя Digital UNIX), OpenVMS и Windows NT. Поставляется ПО кластеризации TruCluster Software.

Используются коммуникационные библиотеки TruCluster MEMORY CHANNEL Software и MPI. Поддерживается распараллеливание в стандарте OpenMP.

Особо выдающимися характеристиками отличаются суперкомпьютеры в конце 90-х годов предстиавлены в таблице 3.

Таблица 3 – наиболее быстродействующие суперекомпьютеры

Изготовитель Суперкомпьютер Страна Год создания Число процессоров Пиковая производи-тельность, Гфлопс Реальная производи-тельность на пакете LINPAK, Гфлопс
1 Intel ASCI Red USA 1999 9472 3154 2121.3
2 SGI ASCI Blue Mountain USA 1998 6144 3072 1608
3 SGI T3E1200 USA 1998 1084 1300.8 891.5
4 Hitachi SR8000/128 Japan 1999 128 1024 873.6
5 SGI T3E900 USA 1997 1324 1191.6 815.1
6 SGI ORIGIN2000 USA 1999 2048 1024 690.9
7 SGI T3E900 UK 1997 876 788.4 552.92
8 IBM SP Silver USA 1998 1952 1296 547
9 SGI T3E900 USA 1999 812 730.8 515.1
10 SGI T3E1200 UK 1998 612 734 509.9
11 IBM ASCI Blue Pacific CTR SP Silver USA 1998 1344 892 468.2
12 Hitachi SR8000/64 Japan 1999 64 512 449.7