Контрольная работа
Классификация средств вычислительной техники
История развития средств вычислительной техники
Все IBM-совместимые персональные компьютеры укомплектованыIntel-совместимыми процессорами. История развития микропроцессоров семейства Intel вкратце такова. Первый универсальный микропроцессор фирмы Intel появился в 1970 г. Он назывался Intel 4004,был четырехразрядным и имел возможность ввода/вывода и обработкичетырехбитных слов. Быстродействие его составляло 8000 операций всекунду. Микропроцессор Intel 4004 был рассчитан на применение впрограммируемых калькуляторах с памятью размером в 4 Кбайт.
Через три года фирма Intel выпустила процессор 8080, которыймог выполнять уже 16-битные арифметические операции, имел 1б-разрядную адресную шину и, следовательно, мог адресовать до 64 Кбайтпамяти (2 516 0=65536). 1978 год ознаменовался выпуском процессора8086 с размером слова в 16 бит (два байта), 20-разрядной шиной имог оперировать уже с 1 Мбайт памяти (2 520 0=1048576, или 1024Кбайт), разделенной на блоки (сегменты) по 64 Кбайт каждый. Процессором 8086 комплектовались компьютеры, совместимые с IBM PC иIBM PC/XT. Следующим крупным шагом в разработке новых микропроцессоров стал появившийся в 1982 году процессор 8028б. Он обладал24-разрядной адресной шиной, мог распоряжаться 16 мегабайтами адресного пространства и ставился на компьютеры, совместимые с IBMPC/AT. В октябре 1985 года был выпущен 80386DX с 32- разряднойшиной адреса (максимальное адресное пространство - 4 Гбайт), а виюне 1988 года - 80386SX, более дешевый по сравнению с 80386DX иобладавший 24-разрядной адресной шиной. Затем в апреле 1989 годапоявляется микропроцессор 80486DX, а в мае 1993 - первый вариантпроцессора Pentium (оба с 32-разрядной шиной адреса).
В мае 1995 года в Москве на международной выставке Комтек-95фирма Intel представила новый процессор - P6.
Одной из важнейших целей, поставленных при разработке P6,было удвоение производительности по сравнению с процессором Pentium. При этом производство первых версий P6 будет осуществлятьсяпо уже отлаженной "Intel" и используемой при производстве последних версий Pentium полупроводниковой технологии (О,6 мкм, З,З В).
Использование того же самого процесса производства дает гарантиютого, что массовое производство P6 будет налажено без серьезныхпроблем. Вместе с тем это означает, что удвоение производительности достигается только за счет всестороннего улучшения микроархитектуры процессора. При разработке микроархитектуры P6 использовалась тщательно продуманная и настроенная комбинация различныхархитектурных методов. Часть из них была ранее опробована в процессорах "больших" компьютеров, часть предложена академическимиинститутами, оставшиеся разработаны инженерами фирмы "Intel". Этауникальная комбинация архитектурных особенностей, которую в "Intel" определяют словами "динамическое выполнение", позволила первым кристаллам P6 превзойти первоначально планировавшийся уровеньпроизводительности.
При сравнении с альтернативными "Intel" процессорами семейства х86 выясняется, что микроархитектура Р6 имеет много общего смикроархитектурой процессоров Nx586 фирмы NexGen и K5 фирмы AMD,и, хотя и в меньшей степени, с M1 фирмы "Cyrix". Эта общностьобъясняется тем, что инженеры четырех компаний решали одну и туже задачу: внедрение элементов RISC-технологии при сохранениисовместимости с CISC-архитектурой Intel х86.
Два кристалла в одном корпусе
Главное преимущество и уникальная особенность Р6 - размещенная в одном корпусе с процессором вторичная статическая кэш-память размером 256 кб, соединенная с процессором специально выделенной шиной. Такая конструкция должна существенно упростить проектирование систем на базе Р6. Р6 - первый предназначенный длямассового производства микропроцессор, содержащий два чипа в одном корпусе.
Кристалл ЦПУ в Р6 содержит 5,5 миллионов транзисторов; кристалл кэш-памяти второго уровня - 15,5 миллионов. Для сравнения,последняя модель Pentium включала около 3,3 миллиона транзисторов, а кэш-память второго уровня реализовывалась с помощью внешнего набора кристаллов памяти.
Столь большое число транзисторов в кэше объясняется его статической природой. Статическая память в P6 использует шесть транзисторов для запоминания одного бита, в то время как динамическойпамяти было бы достаточно одного транзистора на бит. Статическаяпамять быстрее, но дороже.Хотя число транзисторов на кристалле с вторичным кэшем втроебольше, чем на кристалле процессора, физические размеры кэшаменьше: 202 квадратных миллиметра против 306 у процессора. Обакристалла вместе заключены в керамический корпус с 387 контактами("dual cavity pin-drid array"). Оба кристалла производятся с применением одной и той же технологии (0,6 мкм, 4- слойная металл-БиКМОП, 2,9 В). Предполагаемое максимальное потреблениеэнергии: 20 Вт при частоте 133 МГц.
Первая причина объединения процессора и вторичного кэша водном корпусе - облегчение проектирования и производства высокопроизводительных систем на базе Р6. Производительность вычислительной системы, построенной на быстром процессоре, очень сильнозависит от точной настройки микросхем окружения процессора, вчастности вторичного кэша. Далеко не все фирмы-производителикомпьютеров могут позволить себе соответствующие исследования. ВР6 вторичный кэш уже настроен на процессор оптимальным образом,что облегчает проектирование материнской платы.
Вторая причина объединения - повышение производительности.Кзш второго уровня связан с процессором специально выделенной шиной шириной 64 бита и работает на той же тактовой частоте, что ипроцессор.
Первые процессоры Рentium с тактовой частотой 60 и 66 МГцобращались к вторичному кэшу по 64-разрядной шине с той же тактовой частотой. Однако с ростом тактовой частоты Pentium для проектировщиков стало слишком сложно и дорого поддерживать такую частоту на материнской плате. Поэтому стали применяться делителичастоты. Например, у 100 МГц Pentium внешняя шина работает начастоте 66 МГц (у 90 МГц Pentium - соответственно 60 МГц). Pentium использует эту шину как для обращений к вторичному кэшу, так идля обращения к основной памяти и другим устройствам, например кнабору чипов PCI.
Использование специально выделенной шины для доступа к вторичному кэшу улучшает производительность вычислительной системы.Во-первых, при этом достигается полная синхронизация скоростейпроцессора и шины; во-вторых, исключается конкуренция с другимиоперациями ввода-вывода и связанные с этим задержки. Шина кэшавторого уровня полностью отделена от внешней шины, через которуюпроисходит доступ к памяти и внешним устройствам. 64-битоваявнешняя шина может работать со скоростью, равной половине, однойтретьей или одной четвертой от скорости процессора, при этом шинавторичного кэша работает независимо на полной скорости.
Объединение процессора и вторичного кэша в одном корпусе иих связь через выделенную шину является шагом по направлению кметодам повышения производительности, используемым в наиболеемощных RISC-процессорах. Так, в процессоре Alpha 21164 фирмы "Digital" кэш второго уровня размером 96 кб размещен в ядре процессора, как и первичный кэш. Это обеспечивает очень высокую производительность кэша за счет увеличения числа транзисторов на кристалле до 9,3 миллиона. Производительность Alpha 21164 составляет330 SPECint92 при тактовой частоте 300 МГц. Производительность Р6ниже (по оценкам "Intel" - 200 SPECint92 при тактовой частоте 133МГц), однако Р6 обеспечивает лучшее соотношение стоимость/производительность для своего потенциального рынка.
При оценке соотношения стоимость/производительность следуетучитывать, что, хотя Р6 может оказаться дороже своих конкурентов,большая часть других процессоров должна быть окружена дополнительным набором чипов памяти и контроллером кэша. Кроме того, длядостижения сравнимой производительности работы с кэшом, другиепроцессоры должны будут использовать кэш большего, чем 256 кбразмера.
"Intel", как правило, предлагает многочисленные вариациисвоих процессоров. Это делается с целью удовлетворить разнообразным требованиям проектировщиков систем и оставить меньше пространства для моделей конкурентов. Поэтому можно предположить, чтовскоре после начала выпуска Р6 появятся как модификации с увеличенным объемом вторичной кэш-памяти, так и более дешевые модификации с внешним расположением вторичного кэша, но при сохраненнойвыделенной шине между вторичным кэшом и процессором.
Pentium как точка отсчета
Процессор Pentium со своей конвейерной и суперскалярной архитектурой достиг впечатляющего уровня производительности.Pentium содержит два 5-стадийных конвейера, которые могутработать параллельно и выполнять две целочисленные команды за машинный такт. При этом параллельно может выполняться только паракоманд, следующих в программе друг за другом и удовлетворяющихопределенным правилам, например, отсутствие регистровых зависимостей типа "запись после чтения".
В P6 для увеличения пропускной способности осуществлен переход к одному 12-стадийному конвейеру. Увеличение числа стадийприводит к уменьшению выполняемой на каждой стадии работы и, какследствие, к уменьшению времени нахождения команды на каждой стадии на 33 процента по сравнению с Pentium. Это означает, что использование при производстве P6 той же технологии, что и при производстве 100 МГц Pentium, приведет к получению P6 с тактовойчастотой 133 МГц.
Возможности суперскалярной архитектуры Pentium, с ее способностью к выполнению двух команд за такт, было бы трудно превзойтибез совершенно нового подхода. Примененный в P6 новый подход устраняет жесткую зависимость между традиционными фазами "выборки" и"выполнения", когда последовательность прохождения команд черезэти две фазы соответствует последовательности команд в программе.
Новый подход связан с использованием так называемого пула команди с новыми эффективными методами предвидения будущего поведенияпрограммы. При этом традиционная фаза "выполнение" заменяется надве: "диспетчирование/выполнение" и "откат". В результате командымогут начинать выполняться в произвольном порядке, но завершаютсвое выполнение всегда в соответствии с их исходным порядком впрограмме. Ядро P6 реализовано как три независимых устройства,взаимодействующих через пул команд (рис. 1).