4.2 миллионами транзисторов до 167 кв. мм и поднять процент выхода годных, а также тактовую частоту.
По мнению руководства AMD в 1996 году объем выпуска К5 будет наращиваться достаточно быстро, что позволит отгрузить до конца года более пяти миллионов процессоров. Ответом на вызов Intel с ее процессором Pentium Pro может стать только процессор К6, но уже никто не верит, что его удастся увидеть раньше 1997 года. Hесмотря на всемирный переход на процессор Pentium, в следующем году еще могут сохраниться некоторые рынки для 486-х. Эксперты считают, что потребность таких региональных рынков, как Китай, Индия, Россия, Восточная Европа и Африка, в 486-х чипах составит до 20 миллионов процессоров в 1996 году. AMD рассчитывает, что именно ей удастся поставить большую часть от этого количества. Поэтому компания повышает тактовую частоту 486-х до 133 Мгц, чтобы конкурировать с низшими версиями процессора Pentium в настольных ПК начального уровня. Однако, AMD будет усиленно наращивать выпуск К5, поскольку 486-е быстро выходят из моды.
4.3. Процессоры NexGen.
В то время: как компания Intel готовила отрасль к шокирующему выходу в жизнь серийных моделей серверов и настольных машин на Pentium Pro, фирма NexGen представляла форуму свои планы по разработке процессора Nx686. Этот суперскалярный х86-совместимый процессор, к разработке которого подключается еще и команда архитекторов из AMD, снятых с собственного неудачного проекта К6, будет содержать около 6 млн. транзисторов, включая вычислитель с плавающей точкой на одном кристалле с процессором (отказ от предыдущего двухкристалльного подхода, ослабившего Nx586). Технология КМОП с проектными нормами 0,35 мкм и пятислойной металлизацией позволила "упаковать" на одном кристалле семь исполнительных узлов: два для целочисленных, один для операций с плавающей точкой, по одному для обработки мультимедиа, команд переходов, команд загрузки и команд записи. Показатели производительности представители NexGen назвать не смогли, но выразили предположение, что он превзойдет Pentium Pro на 16-разрядных программах вдвое, а на 32-битовых - на 33 %.
До сих пор мало что известно про Nx686, так как чип еще не анонсировался и NexGen не хочет раскрывать козыри перед конкурентами в лице AMD, Cyrix и Intel. Однако, NexGen не хочет раскрывать козыри перед конкурентами в лице AMD, Cyrix и Intel. Однако, NexGen настаивает о том, что Nx686 по производительности сопоставим с интеловским Pentium Pro и AMD K5, и наследует микроархитектуру Nx586, появившуюся в 1994 году. NexGen называет ее RISC86. Базовая ее идея, как и в случае с Pentium Pro и K5, состоит в преобразовании сложных CISC-команд программного обеспечения x86 в RISC-подобные операции, исполняемые параллельно в процессорном ядре RISC-типа. Этот подход, известный под названием несвязанной микроархитектуры, позволяет обогатить CISC-процессор новейшими достижениями RISC-архитектур и сохранить совместимость с имеющимся ПО для х86.
В Nx686 эта философия продвинута на новый логический уровень. Сегодня в Nx586 имеется три исполнительных блока, трехконвейерное суперскалярное ядро. Он способен выполнять в каждом такте по одной команде х86. Возможности для совершенствования очевидны: Nx586 будет содержать пять исполнительных блоков, четыре конвейера и несколько декодеров, способных справиться с выполнением двух или даже более команд х86 за один машинный такт. Для этого потребуется встроить дополнительные регистры переименования и очереди команд.
Подход к использованию интегрированного кэш-контроллера и интерфейса для скоростной кэш-памяти остается неизменным. Представители NexGen говорят, что они изучают возможность использования кристалла вторичной кэш-памяти по образцу и подобию Intel, тем более что их производственный партнер IBM Microelectronics способен делать статическую память и многокристальные сборки (MCM - multichip modules).
Пример практической реализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586, запланированная к выпуску на конец этого года и включающая кристалл CPU и FPU в одном корпусе. Одновременное перепроектирование топологии с масштабированием до размера линии 0.35 микрон позволит компании NexGen основательно уменьшить размеры кристалла ЦПУ - до 118 кв. мм - меньше в этом классе ничего нет.
NexGen, новичок в группе производителей процессоров х86. Nx596 может параллельно обрабатывать на нескольких исполнительных блоках до четырех простейших операций, которые названы командами RISC86. Процессор К5 имеет похожий четырехпоточный дешифратор, но результаты его работы компания называет R – ops.
4.4. Процессоры Cyrix.
Первая вещь из грандиозного проекта М1 компании Cyrix, наконец обнародована. Это процессор Сх 6х86-100, монстроподобный кристалл которого сложен и очень дорог для того, чтобы претендовать на массовый выпуск в течении длительного срока. Его проблемы сможет решить процессор, который пока имеет кодовое название M1rx и опирающийся на техно процесс с пятислойной металлизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии. Если проект увенчается успехом, то размер кристалла с 394 кв. мм уменьшится до 225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 МГц. В этом случае эксперты предсказывают ему производительность в пределах 176-203 по тесту SPECint92, т.е. на уровне процессора Pentium 133 (SPECint92=190.9) или 150 МГц. Если все обещания сбудутся, то Cyrix сможет продать столько процессоров, сколько произведет. Также компания cyrix предложила компромиссный вариант процессора - 5х86, основанного на ядре 486-го, усиленного элементами архитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевке с гнездом 486-го.
4.5. Процессоры Sun Microsystems.
Sun Microsystems процессор UltraSparc-II. Впервые вводя RISC-технологию, SUN в 1988 году объявила SPARC в качестве масштабируемой архитектуры, с запасом на будущее. Однако, с 1993 года реализация SuperSparc стала на шаг отставать от своих конкурентов.
С появлением UltraSparc, четвертого поколения архитектуры SPARC, компания связывает надежды на восстановление утраченных позиций. Он содержит ни много, ни мало, но девять исполнительных блоков: два целочисленных АЛУ, пять блоков вычислений с плавающей точкой (два для сложения, два для умножения и одно для деления и извлечения квадратного корня), блок предсказания адреса перехода и блок загрузки/записи. UltraSparc содержит блок обработки переходов, встроенный в первичную кэш команд, и условно выполняет предсказанные переходы, но не может выдавать команды с нарушением их очередности. Эта функция перекладывается на оптимизирующие компиляторы.
Архитектура SPARC всегда имела регистровые окна, т.е. восемь перекрывающихся банков по 24 двойных регистра, которые могут предотвратить остановки процессора в моменты комплексного переключения, связанные с интенсивными записями в память. Разработчики компиляторов склонны считать эти окна недостаточным решением, поэтому в UltraSparc используется иерархическая система несвязанных шин. Шина данных разрядностью 128 бит работает на одной скорости с ядром процессора. Она соединяется через буферные микросхемы с 128-разрядной системной шиной, работающей на частоте, составляющей половину, треть или четверть скорости процессорного ядра. Для согласования с более "медленной" периферией служит шина ввода-вывода Sbus.
Фирма Sun реализует эту схему на аппаратном уровне с помощью коммутационной микросхемы, являющейся составной частью схемного комплекта окружения. Эта микросхема может изолировать шину памяти от шины ввода-вывода, так что ЦПУ продолжает, например, запись в графическую подсистему или в иное устройство ввода-вывода, а не останавливается во время чтения ОЗУ. Такая схема гарантирует полное использование ресурсов шины и установившуюся пропускную способность
1.3 Гигабайт/с.
В процессоре UltraSparc – II используется система команд Visual Instruction Set (VIS), включающая 30 новых команд для обработки данных мультимедиа, графики, обработки изображений и других целочисленных алгоритмов. Команды VIS включают операции сложения, вычитания и умножения, которые позволяют выполнять до восьми операций над целыми длинной байт параллельно с операцией загрузки или записи в память и с операцией перехода за один такт. Такой подход может повысить видеопроизводительность систем.
4.6. Процессоры Digital Equipment.
Digital Equipment процессор Alpha наиболее тесно следует в русле RISC-философии по сравнению со своими конкурентами, "посрезав излишки сала" с аппаратуры и системы команд с целью максимального спрямления маршрута прохождения данных. Разработчики Alpha уверены, что очень высокая частота чипа даст вам большие преимущества, чем причудливые аппаратные излишества. Их принцип сработал: кристалл 21164 был самым быстрым в мире процессором со дня своего появления в 1995 году. Процессор 21164 в три раза быстрее на целочисленных вычислениях, чем Pentium-100, и превосходит на обработке числе с плавающей точкой, чем суперкомпьютерный набор микросхем R8000 фирмы Mips. Топология процессора следующего поколения 21164А не изменилась, но она смаштабирована, кроме того, модернизирован компилятор, что повысило производительность на тестах SPECmarks. Предполагается, что готовые образцы нового процессора, изготовленные по КМОП - технологии с нормами 0.35 микрон, при тактовой частоте свыше 300 МГц будут иметь производительность 500 по SPECint92 и 700 по SPECfp92.
Процессоры семейства 21164 на прибегают к преимуществам исполнения не в порядке очередности (out – of – order), больше полагаясь на интеллектуальные компиляторы, которые могут генерировать коды, сводящие к минимуму простои конвейера. Это самый гигантский процессор в мире - на одном кристалле размещено 9.3 миллиона транзисторов, большая часть которых пошла на ячейки кэш-памяти. Alpha 21164 имеет на кристалле относительно небольшую первичную кэш прямого отображения на 8 Кбайт и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования.