Смекни!
smekni.com

Процессор AMD. История развития (стр. 2 из 5)

Вот технические данные процессора AMD K6-III:

  • Чип, производимый по технологии 0.25 мкм;
  • Ядро CXT, представляющее собой обычное ядро K6-2 с возможностью пакетной записи;
  • Работает в Socket-7-системных платах, но требует обновления BIOS;
  • Кэш первого уровня - 64 Кбайта, по 32 Кбайта на код и данные;
  • Имеет встроенный кэш второго уровня объемом 256 Кбайт;
  • Кэш материнской платы работает как кэш третьего уровня;
  • Напряжение питания 2.3-2.5В (есть разные партии);
  • Набор из 21 SIMD-команды 3DNow! Имеется 2 конвейера, оперирующие с двумя парами вещественных чисел одинарной точности;
  • Частоты - 350, 400, 450 и 475 МГц. Системная шина 100 МГц (для модели 475 МГц - 95 МГц). Возможна работа и на 66МГц системной шине;
  • 3DNow! поддерживается в DirectX 6.0 и выше.

Как видно из спецификации, AMD K6-III - это AMD K6-2 плюс 256 Кбайт кэша второго уровня, интегрированного в ядро и работающего на его частоте. Помня, какие чудеса производительности показывает Intel Celeron, от AMD K6-III ожидается также немалый прирост в быстродействии, тем более, что шина памяти - главное узкое место в системе, хоть она и работает на частоте 100 МГц. К тому же L2 кэш e К6-III имеет размер в два раза больший, чем у Celeron и в два раза более быстрый (хотя и вдвое меньший), чем у Pentium II. Не следует к тому же забывать и про кэш, установленный на материнской плате - он становится кэшем третьего уровня и добавляет еще несколько процентов производительности.

Надо уделить внимание и еще одному факту, а именно буквам CXT в названии ядра. Это ядро появилось в процессорах K6-2 совсем недавно и отличается от предшествующего наличием функции пакетной записи в память Write Allocate. То есть, новое ядро позволяет передавать данные по шине не как придется, а по мере накопления 8-ми байтовыми пакетами, что дает небольшой выигрыш в производительности при передаче данных по 64-битной шине. Правда, новой эту функцию назвать нельзя, так как Write Allocate имеется и в интеловских процессорах еще со времен Pentium Pro.

Что касается 3DNow!, то тут по сравнению K6-2 все осталось совсем без изменений. Однако, надо констатировать, что приложений использующих эту технологию на рынке не много, а поддержка 3DNow! в драйверах видеокарт и DirectX не дает практически ничего. Также как и в случае с SSE, для получения значимого прироста в быстродействии, необходимо использование SIMD-инструкций при расчете геометрии 3D-сцены, так как функции, оптимизированные в DirectX работают недостаточно быстро и не используются разработчиками.

Отметим тот факт, что для поддержки новых K6-III подойдут и старые Socket7 системные платы, для которых есть BIOS с поддержкой ядра CXT и имеющие возможность выставления напряжения питания ядра 2.3-2.5В. Однако, если в руководстве к системной плате не указан способ выставления этих напряжений, отчаиваться рано. В большинстве случаев существуют недокументированные установки для такого напряжения питания.

AMD K7

К7 - первый из семейства микропроцессоров х86 7-го поколения, в котором присутствуют конструктивные решения, до сих пор не применявшиеся в процессорах архитектуры х86 и сулящие выигрыш в быстродействии даже при одинаковых тактовых частотах. Наиболее впечатляющим из них является, конечно, 200-мегагерцовая системная шина, однако есть и другие, менее заметные на первый взгляд новшества, ставящие К7 выше процессоров 6-го поколения.

· Новая архитектура узла вычислений с плавающей точкой (fpu). К7 содержит 3 узла вычислений с плавающей точкой (fpu), любой из которых способен принимать на вход инструкции каждый такт работы процессора. При этом один узел предназначен исключительно для выполнения команды FSTORE! Назначение этого узла - обеспечивать обмен между регистрами и памятью в то время, как процессор выполняет другие инструкции. Такой подход, хотя и не повышает пиковую производительность, позволяет достичь более высокой средней производительности, что во многих случаях важнее. Остальные два fpu состоят из блока сложения (adder) и блока умножения (multiplier). Оба блока используют конвейеры (fully pipelined). Архитектура каждого fpu такова, что он может принимать на вход каждый такт одну инструкцию сложения и одну умножения, что дает пиковую производительность 1000MFLOPS при 500МГц. Ближайшим аналогом с точки зрения архитектуры является Pentium II, у которого также присутствуют adder и multiplier. Однако существуют два основных отличия. Во-первых, у PII только adder является полностью конвейеризованным (fully pipelined), multiplier же может принимать инструкцию на вход только каждый второй такт. Во-вторых, каждый узел fpu PII может принимать только одну инструкцию за такт, таким образом, пиковая производительность составляет 500MFLOPS при 500МГц. Вышесказанное ни в коем случае не является нападками на достойную архитектуру семейства Р6, которое до сих пор остается единственным семейством процессоров с конвейерным fpu. Да, чуть не забыл... Rise mP6, возможно, будет иметь архитектуру fpu, похожую на ту, что используется в К7 (как во всем, что связано с компанией Rise, здесь полно тумана, но компания уверенно заявляет, что fpu их процессора способен выполнять 2 инструкции х87 за такт), однако максимальная тактовая частота в 200МГц не позволяет этому процессору претендовать на место не только в "высшем обществе", но даже и в "среднем классе", поэтому сравнивать mP6 с К7 некорректно.

· Огромный кэш L1. Если помните, Pentium MMX-166 показывал такую же производительность на приложениях, не использующих инструкции ММХ, как и классический Pentium-200. В чем причина? А причина в том, что чип ММХ имел в 2 раза больше кэша L1 (32К против 16К). Это также объясняет, почему К6-200 приблизительно равен по производительности Pentium MMX-233 - он имеет 64К кэша. К чему это я? К тому, что в К7 кэш L1 увеличился еще в 2 раза - до 128К. Это еще не гарантирует эффективного роста производительности процессора с увеличением тактовой частоты, но, по крайней мере, устраняет опасность простоя, из-за обмена с памятью.

· Модернизируемый кэш L2. У К7 кэш L2 будет размещен, по примеру PII, в картридже, а не интегрирован в кристалл, как у К6-3. Результатом этого является возможность "модернизации" кэша. Первоначально его частота будет составлять 1/3 частоты процессора. В дальнейшем планируется выпуск версий с кэшем L2, работающим на частоте процессора, и, возможно, на половинной частоте. То же и с размером. К7 может нести кэш L2 размером от 512К в "нижних" моделях до 8МВ в серверных моделях "high-end" (впечатляюще, Xeon на сегодня имеет до 2МВ, но цена...).

AMD Duron 650

В то время, когда популярность Socket 7 платформ находилась на самом пике, и оба крупнейших микропроцессорных производителя и Intel, и AMD делали процессоры под этот разъем, мы привыкли к тому что AMD предлагала менее производительные, но и более дешевые решения. Однако, год назад это положение коренным образом изменилось. Анонсировав Athlon, который архитектурно превосходит Intel Pentium III, AMD удалось на какое-то время захватить лидерство в производительности процессоров. И хотя Intel впоследствии удалось усовершенствовать ядро своих процессоров, в которое был добавлен встроенный кеш второго уровня, AMD прочно обосновалась на рынке скоростных CPU, где и по сей день продолжает укреплять свои позиции.

В настоящий момент AMD применяет против Intel два средства. Первое - агрессивная ценовая политика, в результате которой процессоры Athlon оказались намного дешевле своих соперников, Intel Pentium III, работающих на аналогичной частоте. И второе - благодаря своей архитектуре AMD удается повышать частоту своих процессоров несколько легче, чем Intel. В результате, на настоящий момент, например, AMD уже серийно продает свои гигагерцовые CPU.

Однако, есть у AMD и проблемы. Самая большая головная боль с Athlon - это кеш второго уровня, выполненный в виде микросхем SRAM, которые до недавнего времени располагались на процессорной плате и производились сторонними производителями. Младшие модели Athlon имели L2-кеш, работающий на половинной частоте ядра процессора, однако по мере роста частот производители SRAM не поспевали за AMD и не могли обеспечить поставки микросхем кеша, работающих на 1/2 частоты процессора. В результате, начиная с частоты 750 МГц Athlon стал снабжаться кеш-памятью, работающей на 2/5 частоты процессора, а начиная с частоты 900 МГц - и вовсе работающей на 1/3 частоты. Таким образом, получилась парадоксальная ситуация, когда самый быстрый L2-кеш оказался у 700-мегагерцового Athlon. AMD же, естественно, такая ситуация устроить не могла, так как медленная кеш-память второго уровня начала сдерживать рост производительности процессоров.

Поэтому, решение наконец-то переместить L2-кеш AMD Athlon с внешней процессорной платы внутрь ядра выглядит вполне логично. Тем более, что оба завода AMD и в Остине и в Дрездене успешно освоили технологию 0.18 мкм, что позволило при переходе со старой 0.25 мкм технологии уменьшить площадь ядра Athlon на 82 кв.мм.

В результате, линейка AMD Athlon получила продолжение в лице процессоров на ядре Thunderbird, имеющих кеш первого уровня размером 128Кбайт и 256-килобайтный интегрированный в ядро кеш второго уровня, работающий на полной частоте CPU. Это семейство новых AMD Athlon с частотой 750 МГц и выше было анонсировано более двух недель назад.

Однако, этим AMD не ограничилась. Еще год назад при представлении Athlon компания заявила о намерении производства различных модификаций своего CPU, рассчитанных на различные сектора рынка. И вот, наконец, теперь она начала осуществлять свои планы, представив и семейство процессоров AMD Duron ориентированное на low-end сектор и являющееся прямым конкурентом Intel Celeron.

Итак, посмотрим, что же представляют из себя процессоры Duron с точки зрения их основных характеристик:

  • Чип, производимый по технологии 0.18 мкм с использованием медных соединений
  • Ядро Spitfire, основанное на архитектуре Athlon. Содержит 25 млн. транзисторов и имеет площадь 100 кв.мм
  • Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A
  • Использует высокопроизводительную 100 МГц DDR системную шину EV6
  • Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
  • Интегрированный кеш второго уровня 64 Кбайта. Работает на полной частоте ядра
  • Напряжение питания - 1.5В
  • Набор SIMD-инструкций 3DNow!
  • Выпускаются версии с частотами 600, 650, 700 МГц

Итак, с точки зрения архитектуры, Duron ничем не отличается от обычного Athlon, кроме встроенного в ядро 64-Кбайтного кеша второго уровня. Если же сравнить Duron с новыми Athlon на ядре Thunderbird, то различия между ними будут заключаться в размере интегрированного L2 кеша (у Thunderbird он 256 Кбайт против 64 Кбайт у Duron) и в частотах (Thunderbird выпускаются с частотами начиная с 750МГц, а Duron - с частотами до 700 МГц). В остальном же, архитектурно и старые и новые Athlon и Duron ничем не отличаются. При этом, все же необходимо иметь в виду, что все же новые процессоры Duron и Thunderbird имеют обновленное и технологически усовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате, например, даже получается, что ядро Duron с встроенным L2-кешем по площади даже меньше, чем ядро K75 (0.18 мкм Athlon).