Смекни!
smekni.com

Процессоры AMD Архитектура и эволюция (стр. 2 из 3)

AMDK6-III

Вслед за выходом очередного процессора от Intel, Pentium III, появилась новинка и от AMD - процессор K6-III. Этот процессор должен был позволить AMD подняться из ниши дешевых систем и начать конкуренцию с Intel на рынке более дорогих машин.

Технические данные процессора AMD K6-III:

· Чип, производимый по технологии 0.25 мкм;

· Ядро CXT, представляющее собой обычное ядро K6-2 с возможностью пакетной записи;

· Работает в Socket-7-системных платах, но требует обновления BIOS;

· Кэш первого уровня - 64 Кбайта, по 32 Кбайта на код и данные;

· Имеет встроенный кэш второго уровня объемом 256 Кбайт;

· Кэш материнской платы работает как кэш третьего уровня;

· Напряжение питания 2.3-2.5В (есть разные партии);

· Набор из 21 SIMD-команды 3DNow! Имеется 2 конвейера, оперирующие с двумя парами вещественных чисел одинарной точности;

· Частоты - 350, 400, 450 и 475 МГц. Системная шина 100 МГц (для модели 475 МГц - 95 МГц). Возможна работа и на 66МГц системной шине;

· 3DNow! поддерживается в DirectX 6.0 и выше.

Как видно из спецификации, AMD K6-III - это AMD K6-2 плюс 256 Кбайт кэша второго уровня, интегрированного в ядро и работающего на его частоте. От AMD K6-III ожидается немалый прирост в быстродействии, тем более, что шина памяти - главное узкое место в системе, хоть она и работает на частоте 100 МГц. К тому же L2 кэш e К6-III имеет размер в два раза больший, чем у Celeron и в два раза более быстрый (хотя и вдвое меньший), чем у Pentium II. Не следует к тому же забывать и про кэш, установленный на материнской плате - он становится кэшем третьего уровня и добавляет еще несколько процентов производительности.

Что касается 3DNow!, то тут по сравнению K6-2 все осталось совсем без изменений. Однако, надо констатировать, что приложений использующих эту технологию на рынке не много, а поддержка 3DNow! в драйверах видеокарт и DirectX не дает практически ничего. Также как и в случае с SSE, для получения значимого прироста в быстродействии, необходимо использование SIMD-инструкций при расчете геометрии 3D-сцены, так как функции, оптимизированные в DirectX работают недостаточно быстро и не используются разработчиками.

AMDK7

К7 - первый из семейства микропроцессоров х86 7-го поколения, в котором присутствуют конструктивные решения, до сих пор не применявшиеся в процессорах архитектуры х86 и сулящие выигрыш в быстродействии даже при одинаковых тактовых частотах. Наиболее впечатляющим из них является, конечно, 200-мегагерцовая системная шина, однако есть и другие, менее заметные на первый взгляд новшества, ставящие К7 выше процессоров 6-го поколения.

Новая архитектура узла вычислений с плавающей точкой (fpu). К7 содержит 3 узла вычислений с плавающей точкой (fpu), любой из которых способен принимать на вход инструкции каждый такт работы процессора. При этом один узел предназначен исключительно для выполнения команды FSTORE! Назначение этого узла - обеспечивать обмен между регистрами и памятью в то время, как процессор выполняет другие инструкции. Такой подход, хотя и не повышает пиковую производительность, позволяет достичь более высокой средней производительности, что во многих случаях важнее. Остальные два fpu состоят из блока сложения (adder) и блока умножения (multiplier). Оба блока используют конвейеры (fully pipelined). Архитектура каждого fpu такова, что он может принимать на вход каждый такт одну инструкцию сложения и одну умножения, что дает пиковую производительность 1000MFLOPS при 500МГц. Ближайшим аналогом с точки зрения архитектуры является Pentium II, у которого также присутствуют adder и multiplier. Однако существуют два основных отличия. Во-первых, у PII только adder является полностью конвейеризованным (fully pipelined), multiplier же может принимать инструкцию на вход только каждый второй такт. Во-вторых, каждый узел fpu PII может принимать только одну инструкцию за такт, таким образом, пиковая производительность составляет 500MFLOPS при 500МГц. Вышесказанное ни в коем случае не является нападками на достойную архитектуру семейства Р6, которое до сих пор остается единственным семейством процессоров с конвейерным fpu. Да, чуть не забыл... Rise mP6, возможно, будет иметь архитектуру fpu, похожую на ту, что используется в К7 (как во всем, что связано с компанией Rise, здесь полно тумана, но компания уверенно заявляет, что fpu их процессора способен выполнять 2 инструкции х87 за такт), однако максимальная тактовая частота в 200МГц не позволяет этому процессору претендовать на место не только в "высшем обществе", но даже и в "среднем классе", поэтому сравнивать mP6 с К7 некорректно.

Огромный кэш L1. В К7 кэш L1 увеличился еще в 2 раза - до 128К. Это еще не гарантирует эффективного роста производительности процессора с увеличением тактовой частоты, но, по крайней мере, устраняет опасность простоя, из-за обмена с памятью.

Модернизируемый кэш L2. У К7 кэш L2 будет размещен, по примеру PII, в картридже, а не интегрирован в кристалл, как у К6-3. Результатом этого является возможность "модернизации" кэша. Первоначально его частота будет составлять 1/3 частоты процессора. В дальнейшем планируется выпуск версий с кэшем L2, работающим на частоте процессора, и, возможно, на половинной частоте.

AMDAthlon

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:
  • Чип, производимый по технологии 0.25 мкм
  • Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов
  • Работает в специальных материнских платах с процессорным разъемом SlotA
  • Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC
  • Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
  • Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже. Работает на половинной частоте ядра
  • Напряжение питания - 1.6В
  • Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд
  • Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, размером в 128 Кбайт, у Intel Pentium III всего 32 Кбайта.

AMDAthlonXP

В ядро введены улучшения, такие как:

-Полная поддержка инструкций Intel SSE;

-Улучшенный механизм аппаратного предсказания ветвлений;

- Улучшенный буфер преобразования адреса TLB;

-Пониженное энергопотребление и встроенный термодиод.

Nine-issue, superscalar, fully pipelined micro-architecture. Основной упор в описании своего ядра AMD делает на то, что количество ступеней конвейера у него меньше, чем у Pentium 4 (что и обуславливает меньшую частоту работы ядра при одинаковом техпроцессе), но зато количество одновременно исполняемых (за один такт) инструкций - больше.

Superscalar, fully pipelined Floating Point Unit (FPU). Еще один плюс своих процессоров, который AMD решила показать в описании QuantiSpeed Architecture - это их знаменитый FPU. Он действительно мощный - три независимых конвейера для исполнения стандартных FPU-инструкций всего семейства x86, плюс инструкции из фирменного набора AMD 3DNow!, плюс (начиная с ядра Palomino) полная поддержка всего набора Intel SSE.

Hardware data prefetc. В Athlon XP используется механизм предварительной (опережающей) загрузки инструкций в L1 cache. Примечательно следующее: во-первых - именно инструкций т.е. только исполняемого кода, а не данных. Во-вторых - именно в кэш первого уровня т.е. - минуя L2. Впринципе, учитываяразмерL1 уAthlon XP (128 KB).

Exclusive and speculative Translation Look-aside Buffers (TLBs). TLB имеют практически все "сложные" современные процессоры. Фактически, это еще один подвид кэша, только кэшируются в нем не сами команды и данные, а их адреса. В Thunderbird двухуровневый TLB имел емкость 24/32 (24 адреса инструкций и 32 данных) и 256/256. Основное нововведение Palomino - расширенный L1 TLB, который теперь может хранить 40 адресов данных. Кстати, заметим - если Hardware Prefetch оптимизирует загрузку команд, то при усовершенствовании TLB AMD большее внимание уделила именно данным. Кроме того, "эксклюзивность" кэша (фирменная "фича" AMD, когда кэш второго уровня не дублирует в себе содержимое кэша первого уровня) теперь распространяется и на TLB. В общем, нам трудно будет судить насколько велик вклад нового Translation Look-aside Buffer в общую производительность Athlon XP т.к. нет возможности вычленить именно его вклад, но плюс мы все же поставим - это нечто действительно новое.

Линейка Athlon XP:

AMD Athlon XP 1500+ 1.33 GHz
AMD Athlon XP 1600+ 1.40 GHz
AMD Athlon XP 1700+ 1.47 GHz
AMD Athlon XP 1800+ 1.53 GHz

Если раньше многие спорили, что быстрее - Pentium 4 2,0 ГГц или Athlon-C 1,4 ГГц, то Athlon XP все расставил по своим местам и вновь принял эстафетную палочку лидера. На частоте 1,53 ГГц Athlon XP смог явно обогнать Pentium 4 2,0 ГГц, что связано также и с возросшей производительностью KT266A. В таких современных играх, как "Wolfenstein: Return to Castle" или "Serious Sam" сразу видно, что Pentium 4 - не игровой процессор.