Смекни!
smekni.com

Микропроцессоры для пользователей (стр. 5 из 11)

Первые модели процессора Pentium работали на частоте 60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовой шине данных, работающей на полной скорости процессорного ядра. Hо если скорость процессора Pentium растет, то системному разработчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Pentium используют делитель частоты для синхронизации внешней шины с помощью меньшей частоты. Hапример, у 100 МГц процессора Pentium внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Pentium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы PCI.

3.10. Процессор Pentium Pro.

3.10.1. Общее описание процессора.

Pentium Pro это высокотехнологичный процессор шестого поколения для высокоуровневых десктопов, рабочих станций и мультипроцессорных серверов. Массовое производство процессора Pentium Pro, содержащего на кристалле столько транзисторов, сколько никогда не было на серийных процессорах, сразу в нескольких вариантах стартует с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории компании, да и электронной промышленности.

Hапомним некоторые его особенности. Агрессивная суперконвейерная схема, поддерживающая исполнение команд в произвольном порядке, условное исполнение далеко наперед (на 30 команд) и трехпоточная суперскалярная микроархитектура. Все эти методы могут поразить воображение, но ни один из них не является чем-то оригинальным: новые чипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладает ключевым превосходством. В процессоры Pentium Pro встроена вторичная кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде отдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированного на втором посадочном месте необычного двухместного корпуса процессора Pentium Pro, значительно упростила разработчикам проектирование и конструирование вычислительных систем на его основе.

Реальная производительность процессора оказалась намного выше 200 единиц, которые назывались в качестве запланированного стартового ориентира при февральском технологическом анонсировании P6.

Pentium Pro это значительный шаг вперед. И хотя в процессоре Pentium впервые была реализована суперскалярная форма архитектуры х86, но это была ограниченная реализация: в нем интегрирована пара целочисленных конвейеров, которые могут обрабатывать две простые команды параллельно, но в порядке следования команд в программе и без т.н. условного исполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярная машина, которая способна одновременно отслеживать прохождение пяти команд. Для согласования с такой высокой пропускной способностью потребовалось резко улучшить схему кэширования, расширить файл регистров, повысить глубину упреждающей выборки и условного исполнения команд, усовершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных, обрабатывающую команды не по порядку, а сразу по мере готовности данных для них. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, по мнению Intel, суффикс Pro в имени процессора.

3.10.2. Два кристалла в одном корпусе.

Самая поразительная черта Pentium Pro - тесно связанная с процессором кэш-память второго уровня (L2), кристалл которой смонтирован на той же подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно ядро процессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканальная порядково-ассоциативная кэш второго уровня.

Два этих кристалла объединены в общем 387-контактном корпусе, но связаны линиями, не выходящими на внешние контакты. Hекоторые компании называют такой чип корпуса МСМ (multichip module), однако Intel использует для него термин dual-cavity PGA (pin-grid array). Разница слишком неосязаема и лежит, вполне вероятно, в области маркетинга, а не технологии, так как использование МСМ заработало себе репутацию дорогостоящей технологии. Hо сравнивая цены на процессоры Pentium и Pentium Pro, можно утверждать, что новая терминология исправит положение дел, так как P6 претендует на статус массового процессора. Впервые в истории промышленности многокристалльный модуль станет крупносерийным изделием.

Степень интеграции нового процессора также поражает: он содержит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав кристалла кэш-памяти. Для сравнения, последняя версия процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число не включена кэш L2, поскольку Pentium требует установки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.

Элементарный расчет поможет понять 6почему на 256К памяти требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенирируемого, использует для хранения бита ячейку из шести транзисторов:

256 х 1024 х 8 бит х 6 тр-ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.

Площадь процессорного кристалла равна 306 кв.мм. (для сравнения, у первого процессора Pentium кристалл имел площадь 295 кв.мм). Кристалл статической памяти, как всякая всякая регулярная структура, упакован намного плотнее - 202 кв.мм. Только Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.

Почему компания Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным кэшем? Во-первых комбинированный корпус значительно упростил изготовителям ПК разработку высокопроизводительных систем на процессоре Pentium Pro.

Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором вторичного кэша по его размеру и конфигурации. Встроенная в Р6 вторичная кэш уже тонко настроена под ЦПУ и позволяет разработчикам систем быстро интегрировать готовый процессор на материнскую плату.

Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 МГц, то кэш должна работать на частоте 150 МГц.

Поскольку в процессоре Pentium Pro есть выделенная шина для вторичного кэша, это решает сразу две проблемы: обеспечивается синхронная работа двух устройств на полной скорости и отсутствие конкуренции за шину с прочими операциями ввода-вывода. ОТдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает своими циклами операциям с ОЗУ и периферией. Передняя 64-битовая шина может работать с частотой, равной половине, трети или четверти скорости ядра Pentium Pro. "Задняя" шина продолжает работать независимо, на полной скорости.

Такая реализация представляет серьезный шаг вперед по сравнению с организацией шины процессора pentium и других процессоров х86. Только NexGen приближенно напоминает такую схему. Хотя в процессоре Nx586 нет кэша L2, зато встроен ее контроллер и полноскоростная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами поверх отдельной шины ввода-вывода, работающей на деленной частоте.

В экзотическом процессором Alpha 21164 компания Digital пошла еще дальше, интегрировав прямо на кристалле в дополнение к первичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисторов, большая часть которого образована массивом памяти.

Есть одна незадача: необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производительности. Интегрированная в процессор кэш вроде как скрыта с глаз. Penyium Pro сможет показаться более дорогим, чем его конкуренты, но для создания компьютера на других процессорах потребуется внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн кэш-структуры означает, что другим процессорам, претендующим на сопоставимую производительность, потребуется кэш-памяти больше, чем 256 Кбайт.

Уникальный корпус предоставляет свободу созданию новых вариантов процессора. В будущем возможно как повышение объема кэш-памяти, так и ее отделение ее от процессора в соответствии с традиционным подходом. Если последний вариант появится, он окажется несовместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intel, подключение внешних микросхем памяти к "передней" шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой для такой убежденности служат результаты натурного моделирования прототипа системы, которая вследствии высокой эффективности интерфейса кэш L2-процессор, практически до теоретического предела загружает вычислительные ресурсы ядра. Процессор Alpha 21164, напротив, спроектирован с учетом необходимости кэш L3.

3.10.3. Значения тестов для некоторых чипов фирмы Intel.

ProcessorBenchmarks IntelPentiumProprocessor(200MHz) IntelPentiumProprocessor(180MHz) IntelPentiumProprocessor(166MHz)w/512K L2 IntelPentiumProprocessor(150MHz) IntelPentiumprocessor(133MHz)
UNIX
SPEC95SPECint95SPECint_base95SPECfp95SPECfp_base95 8.098.096.755.99 7.297.296.085.40 7.117.116.215.47 6.086.085.424.76 4.144.143.122.48
SPEC92SPECint92SPECint_base92SPECfp92SPECfp_base92 366.0336.7283.2234.3 327.43.5.8254.6210.4 327.1306.6261.3209.6 276.3258.3220.0182.0 190.9175.9120.6107.3
Windows
Norton System IndexSI32 86.7 77.6 Nottested 67.0 34.2
Ziff-DavisCPUmark32 541 466 Nottested 412 278

4. Процессоры конкурентов Intel.