У всех МП Pentium имеется встроенная кэш-память, отдельно для команд, отдельно для данных по 8-16 Кбайт, и встроенный контроллер кэш-памяти 2-го уровня (что обеспечивает работу последней на внутренней частоте МП); имеются специализированные конвейерные аппаратные блоки сложения, умножения и деления, существенно ускоряющие выполнение операций с плавающей запятой. Удачные архитектурные решения МП Pentium обусловили то, что производительности микропроцессоров 486DX4-120 и Pentium-60 приблизительно одинаковы (то есть за счет архитектуры производительность увеличилась в два раза).
Микропроцессоры PentiumPro
В сентябре 1995 года были выпущены МП шестого поколения 80686 (Р6), торговая марка PentiumPro. Микропроцессор состоит из двух кристаллов: собственно МП и кэш-памяти. Но он не полностью совместим с просто Pentium и, в частности, требует специальную системную плату. PentiumPro прекрасно работает с 32-битовыми приложениями, а в 16-битовых иногда даже несколько проигрывает просто Pentium. Новые схемотехнические решения обеспечивают для ПК более высокую производительность. Часть этих новшеств может быть объединена понятием «динамическое исполнение» (dynamicexecution), что, в первую очередь, означает наличие многоступенчатой суперконвейерной структуры (superpipelining), предсказания ветвлений программы при условных передачах управления (multiplebranchprediction) и исполнение команд по предполагаемому пути ветвления (speculativeexecution).
В программах решения многих задач, особенно экономических, содержится большое число условных передач управления. Если процессор может заранее предсказывать направление перехода (ветвления), то производительность его работы значительно повысится за счет оптимизации загрузки вычислительных конвейеров. Тем не менее следует сказать, что если путь ветвления предсказан неверно, процессор должен сбросить полученные результаты, очистить конвейеры и загрузить нужные команды заново, что требует довольно большого числа тактов. В процессоре PentiumPro вероятность правильного предсказания 90 % против 80 % у МП Pentium.
Кэш-память емкостью 256-512 Кбайт — обязательный атрибут высокопроизводительных систем на базе процессоров Pentium. Однако у них встроенная кэшпамять имеет небольшую емкость (16 Кбайт), а основная ее часть находится вне процессора на материнской плате. Поэтому обмен данными с ней происходит не на внутренней частоте МП, а на частоте тактового генератора, которая обычно в 2-5 раз ниже, что снижает общее быстродействие компьютера. В МП PentiumPro есть и кэш-память 1-го уровня (по 8 Кбайт для команд и данных), и кристалл кэш-памяти 2-го уровня емкостью 256 или 512 Кбайт, расположенный тоже на плате самого микропроцессора и работающий на внутренней частоте МП.
Микропроцессоры Pentium ММХ и PentiumII
В 1997 году появились модернизированные для работы в мультимедийной технологии микропроцессоры Pentium и PentiumPro, получившие торговые марки, соответственно, Pentium ММХ (ММХ — MultiMediaeXtention) и Pentium П. МП Pentium ММХ содержит дополнительные 57 команд, ориентированные на обработку аудио- и видеоинформации, увеличенную вдвое (до 32 Кбайт) кэшпамять, дополнительные восемь 64-битовых регистров, новый блок предсказания ветвлений, заимствованный у МП PentiumPro, и т. д. Вследствие этого у него на 1 миллион транзисторных элементов больше, чем у МП Pentium.
Для эффективного использования этих микропроцессоров во все старые программы (в том числе и в операционные системы Windows 95, WindowsNT) необходимо включить согласующие программные фрагменты; правда и без них МП Pentium ММХ несколько производительнее просто МП Pentium. При выполнении обычных приложений Pentium ММХ на 10-15 % быстрее Pentium, а при работе мультимедийных приложений с использованием новых 57 команд он уже эффективнее на 30 % (для сравнения: МП PentiumPro опережает МП Pentium при выполнении обычных приложений примерно на 20 %). Программы, написанные с учетом специфики Pentium ММХ, не будут работать на ПК с обычным МП Pentium. Для МП Pentium ММХ требуется системная плата с разъемом Socket 7, с новым BIOS, поддерживающим ММХ, и с двумя напряжениями питания (3,5 и 2,8 В).
МП PentiumII имеет иную конструкцию, нежели чем все остальные МП, в частности, он выполнен в виде небольшой платы-картриджа (корпус SECC), на которой размещены сам процессор (содержащий 7,5 млн транзисторов против 5,5 млн в МП PentiumPro) и четыре микросхемы кэш-памяти 2-го уровня, общим объемом 512 Кбайт. Кэш-память 1-го уровня, находящаяся в микросхеме самого процессора, имеет емкость 32 Кбайта, против 16 Кбайт, имевшихся в МП PentiumPro, но кэш-память 2-го уровня работает не на внутренней частоте МП, а на вдвое меньшей частоте.
Важным отличием PentiumII является архитектура двойной независимой шины (первые варианты введения такой шины были уже у МП PentiumPro). Процессор обменивается данными с кэшем L2 по специализированной высокоскоростной шине (иногда называемой backside — задней), отделенной от системной шины (frontside — передней). Системная шина работает на частоте материнской платы, и это существенно снижает эффективное быстродействие компьютера. Наличие же backside-шины ускоряет обмен с кэш-памятью.
МП PentiumII поддерживает двухпроцессорную конфигурацию ПК. В МП PentiumPro и PentiumII появилась качественно новая перспектива: начали внедряться так называемые SIMD-инструкции (SingleInstructionMultiplyData — сравните со структурами многопроцессорных систем), в которых одно и то же действие совершается над многими данными (эта технология получит развитие в следующих моделях МП). МП производится на основе технологии 0,35 мкм и использует напряжение питания 2,8 В. Для него, естественно, требуется иная системная плата, чем для всех других Pentium. Микропроцессоры PentiumII имеют много модификаций: Klamath, Deschutes, Katmai, Tanga; МП средней группы Celeron — Covington, Mendocino, Dixon.
Для более дешевых компьютеров был предложен облегченный вариант процессора, названный Celeron. Первые процессоры Celeron имели частоты 266 и 300 МГц. Вторичный кэш исключили, что заметно отразилось на производительности ПК (системные платы с разъемом Slot 1 вторичного кэша не имеют), и ПК на их основе оказались малоэффективными. Тогда были выпущены процессоры Celeron А, которые имеют небольшой (128 Кбайт) вторичный кэш, установленный на плате МП и работающий уже на полной частоте МП. Эти процессоры, известные также под названием Mendocino, стали очень популярными.
Кроме широко известных особенностей вторичного кэша (либо его нет, либо 128 Кбайт), процессор Celeron имеет следующие отличия от PentiumII:
□ разрядность шины адреса сокращена с 36 до 32 бит (адресуемая память —4 Гбайт);
□ несколько ослаблены процедуры контроля достоверности преобразования информации;
□ Celeron предназначен только для однопроцессорных конфигураций.
Процессоры Celeron А являются самыми популярными из недорогих компьютеров и в настоящее время. Большинство МП PentiumII, в том числе и CeleronA, поддерживают частоту шины системной платы 100, 133 МГц и более (предыдущие модели — только 66 МГц).
Микропроцессоры PentiumIII
Появившиеся в 1999 году процессоры PentiumHI (Coppermine) являются дальнейшим развитием PentiumII. Их главным отличием является основанное на новом блоке 128-разрядных регистров расширение набора SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (StreamingSIMDExtensions). По возможностям мультипроцессорных конфигураций эти процессоры аналогичны своим предшественникам PentiumII.
Кэш 2-го уровня у МП PentiumIII имеет размер 256 Кбайт, работает на полной частоте МП и обслуживается быстродействующей backside-шиной, что во много раз ускоряет как работу с кэшем, так и производительность ПК в целом. МП PentiumIII предназначены для работы с материнскими платами, имеющими чипсеты (набор микросхем, связывающих процессор с остальной системой) Intel: 440BX, 440ZX, 440GX, 810, 815, 820, 840 и более новые; поддерживают частоту шины материнской платы 100, 133, 150 МГц и выше. «Простые» PentiumIII устанавливаются в SlotI, PentiumIIIXeon — в Slot 2. Процессоры PentiumHIXeon (и последующие модели Tanner, Cascades) являются продолжением линии МП PentiumPro и отличаются увеличенным кэшем 2-го уровня (512, 1024 и 2048 Кбайт), работающим на полной частоте МП.
Микропроцессоры Pentium 4
Модификация МП Pentium — Pentium 4 — предназначена для высокопроизводительных компьютеров, в первую очередь серверов, рабочих станций класса high-end и мультимедийных игровых ПК. Рассмотрим основные особенности Pentium 4.
Добавлены 144 новые потоковые инструкции, расширяющие набор SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (StreamingSIMDExtensions). Модуль вычислений с плавающей запятой и потоковый модуль оптимизированы для работы с аудио- и видеопотоками, в том числе ЗО-технологиями.
Имеется кэш 2-го уровня размером 256 Кбайт; он работает на полной частоте МП, использует встроенную программу коррекции ошибок и обслуживается быстродействующей с разрядностью 256 бит (32 байт) шиной, работающей на частоте МП. Это для Pentium 4 с частотой 1500 МГц, например, обеспечивает скорость обмена с кэшем 48 Гбайт/с.
Есть возможность работы с системной шиной с эквивалентной частотой 400 МГц (Quard-PumpedBusno 100 МГц), что обеспечивает скорость обмена 3,2 Гбайт/с.
Вновь улучшена система «динамического исполнения» (dynamicexecution), что, в первую очередь, связано с наличием 20-ступенной (у МП PentiumIII конвейер имел 10 ступеней) суперконвейерной структуры (superpipelining), лучшего предсказания ветвлений программы при условных передачах управления (branchprediction) и параллельного «по предположению» (опережающего, спекулятивного) исполнения команд по нескольким предполагаемым путям ветвления (speculativeexecution). Поясним это. Динамическое исполнение позволяет процессору предсказывать порядок выполнения инструкций при помощи технологии множественного предсказания ветвлений, которая прогнозирует прохождение программы по нескольким ветвям. Это оказывается возможным, поскольку в процессе исполнения инструкции процессор просматривает программу на несколько шагов вперед. Технология анализа потока данных позволяет проанализировать программу и составить ожидаемую последовательность исполнения инструкций, независимо от порядка их следования в тексте программы. И наконец, опережающее выполнение повышает скорость работы программы за счет выполнения нескольких инструкций одновременно, по мере их поступления в ожидаемой последовательности — то есть по предположению (интеллектуально). Поскольку выполнение инструкций происходит на основе предсказания ветвлений, результаты сохраняются как «интеллектуальные» с последующим удалением тех, которые вызваны промахами в предсказании. На конечном этапе порядок инструкций и результатов их выполнения восстанавливается до первоначального.