Cray T3E
Производитель: Silicon Graphics
Класс архитектуры: масштабируемая массивно-параллельная система, состоит из процессорных элементов (PE).
В настоящее время существуют две модификации: T3E-900 и T3E-1200.
Процессорный элемент PE состоит из процессора, блока памяти и устройства сопряжения с сетью. Используются процессоры Alpha 21164 (EV5) с тактовой частотой 450 MHz (T3E-900) и 600 MHz (T3E-1000), пиковая производительность которых составляет 900 и 1200 MFLOP/sec соответственно. Процессорный элемент располагает своей локальной памятью (DRAM) объемом от 256MB до 2GB.
Системы T3E масштабируются до 2048 PE.
Процессорные элементы связаны высокопроизводительной сетью с топологией трехмерного тора и двунаправленными каналами. Скорость обменов по сети достигает 480MB/sec в каждом направлении.
Используется операционная система UNICOS/mk.
Поддерживается явное параллельное программирование c помощью пакета Message Passing Toolkit (MPT) - реализации интерфейсов передачи сообщений MPI, MPI-2 и PVM, библиотека Shmem. Для Фортран-программ возможно также неявное распараллеливание в моделях CRAFT и HPF. Среда разработки включает также набор визуальных средств для анализа и отладки параллельных программ.
Cray T90
Производители: Silicon Graphics, Cray Research.
Класс архитектуры: многопроцессорная векторная система (несколько векторных процессоров работают на общей памяти).
Модели Серия T90 включает модели T94, T916 и T932.
Процессор Системы серии T90 базируются на векторно-конвейерном процессоре Cray Research с пиковой производительностью 2GFlop/s.
Число процессоров Система T932 может включать до 32 векторных процессоров (до 4-х в модели T94, до 16 модели T916), обеспечивая пиковую производительность более 60GFlop/s.
Возможно объединение нескольких T90 в MPP-системы.
Система T932 содержит от 1GB до 8GB (до 1 GB в модели T94 и до 4GB в модели T916) оперативной памяти и обеспечивает скорость обменов с памятью до 800MB/sec.
Используется операционная система UNICOS.
Cray SV1
Производитель: Silicon Graphics
Класс архитектуры: масштабируемый векторный суперкомпьютер.
Используются 8-конвейерные векторные процессоры MSP (Multi-Streaming Processor) с пиковой производительностью 4.8 GFLOP/sec; каждый MSP может быть подразделен на 4 стандартных 2-конвейерных процессора с пиковой производительностью 1.2 GFLOP/sec. Тактовая частота процессоров - 250MHz.
Процессоры объединяются в SMP-узлы, каждый из которых может содержать 6 MSP и 8 стандартных процессоров. Система (кластер) может содержать до 32 таких узлов.
SMP-узел может содержать от 2 до 16GB памяти. Система может содержать до 1TB памяти. Вся память глобально адресуема (архитектура DSM).
Используется операционная система UNICOS.
Поставляется векторизующий и распараллеливающий компилятор CF90. Поддерживается также явное параллельное программирование с использованием интерфейсов MPI, OpenMP или Shmem.
Cray Origin2000
Производитель Silicon Graphics
Класс архитектуры: модульная система с общей памятью (cc-NUMA).
Использованы 64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz
Основной компонент системы - модуль Origin, включающий от 2 до 8 процессоров MIPS R10000 и до 16GB оперативной памяти. Поставляются системы Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей. Модули системы соединены с помощью сети CrayLink, построенной на маршрутизаторах MetaRouter.
Используется операционная система SGI IRIX. Поставляется распараллеливающий компилятор Cray Fortran 90. Поддерживается стандарт OpenMP.
Onyx2 InfiniteReality2
Производитель Silicon Graphics
Класс архитектуры: многопроцессорная система визуализации; по аппаратной архитектуре очень похожа на Origin2000.
Система может включать до 128 процессоров MIPS R10000.
Графические возможности системы обеспечивают специальные устройства трех типов: геометрические (векторные) процессоры, растровые процессоры, генераторы аналоговых сигналов. Система может быть оборудована 16 независимыми каналами графического вывода (visualization pipelines). На аппаратном уровне поддерживается графический интерфейс OpenGL.
Используется операционная система SGI IRIX.
Sun HPC 10000 (StarFire)
Производитель Sun Microsystems, серия Sun HPC.
Класс архитектур: многопроцессорный SMP-сервер.
Процессор UltraSPARC II/336MHz
Система StarFire объединяет от 16 до 64 процессоров.
Система включает от 2GB до 64GB памяти.
Системное ПО: ОС Solaris, ПО распределения ресурсов Load Sharing Facility (LSF). Поставляется пакет поддержки параллельных приложений Sun HPC 2.0, включающий такие средства как HPF, MPI, PVM, PFS (параллельная файловая система), Prism (визуальная среда разработки), S3L (библиотека математических подпрограмм), и др.
NEC SX-5
Производитель NEC, серия SX.
Класс архитектуры: параллельный векторный суперкомпьютер (PVP).
Каждый узел системы является векторно-конвейерным SMP-суперкомпьютером, объединяющим до 16 индивидуальных векторных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s).
Объем памяти каждого узла - до 128GB, производительность обменов с памятью достигает 1TB/sec. Система может включать до 32 узлов, обеспечивая совокупную пиковую производительность до 4 TFlop/s.
Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch).
Используется операционная система SUPER-UX.
Поставляются компилятор языка HPF, реализация интерфейса MPI, компиляторы Fortran77/SX и Fortran90/SX с автоматическим распараллеливанием и векторизацией, а также интегрированная среда разработки и оптимизации PSUITE.
Fujitsu VPP
Производитель Fujitsu
Класс архитектуры параллельный векторный суперкомпьютер (PVP).
Модификации VPP300, VPP700, VPP5000
Каждый процессорный элемент (PE) системы VPP700E состоит скалярного устройства (SU), векторного устройства (VU), блока памяти и устройства сопряжения. Для VPP700: VU состоит из 7 конвейеров и обеспечивает пиковую производительность до 2.4 GFLOP/sec. Объем памяти - до 2GB. Для VPP5000: VU состоит из 4 конвейеров, пиковая производительность - 9.6 GFLOP/sec. Объем памяти - до 16GB.
Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительность до 14.4 GFLOP/sec Для VPP5000: до 512 PE, суммарная пиковая производительность до 4.9 TFLOP/sec.
Процессорные элементы связаны коммутатором (crossbar network), который производить двухсторонние обмены, не прерывая вычислений. Пропускная способность каналов коммутатора: для VPP700 - 615MB/sec, для VPP5000 - 1.6GB/sec. Используется операционная система UXP/V, основанная на UNIX System VR4.
Среди средств разработки поставляются: распараллеливающий и векторизующий компилятор Fortran90/VPP, оптимизированная для VPP библиотека математических подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и PVM 3.3.
AlphaServer
Производитель Compaq, Digital.
Высокопроизводительный SMP-сервер, AlphaServer Array - кластерная система.
Процессоры GS140 и GS60 - Alpha 21264, 8400 и 8200 - Alpha 21164
Число процессоров GS140 и 8400 - до 14, GS60 и 8200 - до 6
Объем памяти GS140 - до 28GB.
Кластеры AlphaServer Array могут объединять до 8 узлов AlphaServer, т.е. в общей сложности до 112 процессоров. Могут комбинироваться узлы различных типов. Узлы связываются между собой коммутатором MEMORY CHANNEL, который обеспечивает скорость обменов до 66MB/sec и латентность порядка 3 мкс.
На платформе AlphaServer поддерживаются операционные системы Tru64 UNIX (это новое имя Digital UNIX), OpenVMS и Windows NT. Поставляется ПО кластеризации TruCluster Software.
Используются коммуникационные библиотеки TruCluster MEMORY CHANNEL Software и MPI. Поддерживается распараллеливание в стандарте OpenMP.
Особо выдающимися характеристиками отличаются суперкомпьютеры в конце 90-х годов предстиавлены в таблице 3.
Таблица 3 – наиболее быстродействующие суперекомпьютеры
№ | Изготовитель | Суперкомпьютер | Страна | Год создания | Число процессоров | Пиковая производи-тельность, Гфлопс | Реальная производи-тельность на пакете LINPAK, Гфлопс |
1 | Intel | ASCI Red | USA | 1999 | 9472 | 3154 | 2121.3 |
2 | SGI | ASCI Blue Mountain | USA | 1998 | 6144 | 3072 | 1608 |
3 | SGI | T3E1200 | USA | 1998 | 1084 | 1300.8 | 891.5 |
4 | Hitachi | SR8000/128 | Japan | 1999 | 128 | 1024 | 873.6 |
5 | SGI | T3E900 | USA | 1997 | 1324 | 1191.6 | 815.1 |
6 | SGI | ORIGIN2000 | USA | 1999 | 2048 | 1024 | 690.9 |
7 | SGI | T3E900 | UK | 1997 | 876 | 788.4 | 552.92 |
8 | IBM | SP Silver | USA | 1998 | 1952 | 1296 | 547 |
9 | SGI | T3E900 | USA | 1999 | 812 | 730.8 | 515.1 |
10 | SGI | T3E1200 | UK | 1998 | 612 | 734 | 509.9 |
11 | IBM | ASCI Blue Pacific CTR SP Silver | USA | 1998 | 1344 | 892 | 468.2 |
12 | Hitachi | SR8000/64 | Japan | 1999 | 64 | 512 | 449.7 |