RapidCAD, грубо говоря, представляет собой процессор 486DX без внутренней кэш-памяти и с цоколевкой процессора 386. Для программ он соответствует 386 с сопроцессором, так как все специфичные команды i486 удалены из набора команд. Рекламируется этот процессор, как "абсолютный сопроцессор" и, к чему и обязывает такое имя, он предназначен для замены процессора 386DX в существующих системах и резкого повышения производительности операций с плавающей точкой, таких, как CAD, электронные таблицы, математические программные пакеты (SPSS, Mathematica и т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132 вывода), устанавливающийся в гнездо для i386, включает в себя ЦПУ и модуль операций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов), устанавливающийся в гнездо для сопроцессора i387, включает в себя ПЛМ, подающий сигнал на схемы системной платы для правильной обработки особых ситуаций при операциях с плавающей точкой. Большинство операций исполняется в течение одного цикла, как и в i486. Однако узким местом является интерфейс шины 386, так как каждый цикл шины равен двум циклам процессора. Это значит, что команды выполняются быстрее, чем считываются из памяти. Поскольку операции с плавающей точкой выполняются медленнее обычных команд, то замедление на них не сказывается, и они выполняются с такой же скоростью, как и на i486DX. Именно поэтому RapidCAD позволяет получить более высокие характеристики с плавающей точкой, чем любая комбинация 386/387. Результаты теста SPEC, стандартного теста для машин под UNIX, показывают, что RapidCAD ускоряет операции с плавающей точкой на 85%, а с целыми числами - на 15% по сравнению с любой комбинацией 386/387 при одинаковой тактовой частоте. Потребляемая мощность при 33 МГц составляет 3500 мВт. Текущая цена RapidCAD 33 МГц составляет 300$.
Предполагается, что процессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие от процессора Am386 фирмы AMD, который использует микрокод, идентичный микрокоду Intel 386, в процессоре 38600DX использован патентно чистый микрокод, для обеспечения полной совместимости в набор команд даже включена недокументированная команда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&T также выпустила процессор 38605DX, включающий кэш-память команд на 512 байт, что еще более повысит его производительность. К сожалению, 38605DX выпускается в корпусе PGA (144 вывода) и не может быть установлен непосредственно в разъем i386DX. При проведении испытаний я заметил, что у 38600DX есть серьезные проблемы коммуникации ЦПУ- сопроцессор, и из-за этого скорость выполнения в большинстве программ операций с плавающей точкой у него падает ниже уровня i386/i387. Эта проблема существует для всех производимых на настоящий момент 387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87, Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводил такие тесты с 38700DX и пришел к аналогичным выводам. Он связался с C&T, и ему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц - 1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц - 80$.
Процессор Cyrix 486DLC - последняя новинка на рынке заменителей i386DX. Набор его команд совместим с i486SX, установлена 1 КВ кэш-память и аппаратно реализованный 16х16 бит умножитель. Исполнительное устройство 486DLC, созданное с использованием некоторых принципов RISC, выполняет большинство команд за один цикл. Аппаратный умножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это особенно удобно при вычислении адресов (код, генерируемый некоторыми неоптимизирующими компиляторами, может содержать много команд MUL для доступа к массивам) и для программных вычислений с плавающей точкой (напр., при эмуляции сопроцессора). Внутренняя кэш-память представляет собой объединенную память команд и данных сквозной записи, и может быть конфигурирована, как память с прямым отображением, или как 2-канальная ассоциативная. Из-за необходимости обеспечения полной совместимости после перезагрузки процессора кэш-память отключается, и должна быть включена с помощью небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена при загрузке, (напр., при "горячей" перезагрузке, Ctrl – Alt – Del) , BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либо выполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это одна из причин того, что после запуска процессора кэш-память отключается. Я уверен, что в следующих версиях BIOS фирмы AMI это будет учтено и встроенная кэш-память будет поддерживаться. Кэш-память помогает процессору 486DLC преодолеть ограничения интерфейса шины 386, хотя процент попаданий составляет не более 50%. Фирма Cyrix предусмотрела некоторые возможности управления кэш-памятью процессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти. Современные системы 386 не воспринимают эти управляющие сигналы, не имеющие значения для i386DX, но в дальнейшем системы, разработанные с учетом этих возможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до 4-х некэшируемых областей памяти, что может быть очень полезно в том случае, если ваша система использует периферийные устройства, отображаемые в память (напр., сопроцессор Weitek). В существующих системах 386 пересылки DMA (напр., SCSI контроллера, платы звука) могут отключить внутренний кэш, так как не существует других способов обеспечить соответствие кэш-памяти и основной памяти, что, конечно, снижает характеристики 486DLC. Потребляемая мощность 486DLC 40 МГц - 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц по текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не во всех обстоятельствах, особенно критичен в этом отношении многозадачный защищенный режим (улучшенный режим MS- Windows). При использовании 486DLC совместно с Cyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависает из-за проблем синхронизации между ЦПУ и сопроцессором при исполнении команд FSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора при переключении задач. Лучше всего использовать 486DLC с Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992, являющийся наиболее мощным сопроцессором среди совместимых сопроцессоров 486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать, совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST, распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi или другие ftp-серверы. Если программа сообщит о сопроцессоре 387+, то у вас установлен либо 387+, либо аналогичная новая версия 83D87 и проблем с совместимостью не будет.
При испытаниях использовалась система:
Аппаратная конфигурация: 33,3/40 МГц системная плата, комплект микросхем Forex, кэш 128 КВ с нулевым состоянием ожидания, прямое отображение, сквозная запись, один буфер записи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основной памяти, среднее состояние ожидания 1,6 цикла. BIOS фирмы AMI. Процессор Cyrix EMC87 в режиме совместимости 387, как матсопроцессор. Этот процессор вместе с Cyrix 83D87/387+ являются самыми быстрыми сопроцессорами для работы с 386DX/486DLC/38600DX. Жесткий диск Conner 3204F, емкость 203 МВ, интерфейс IDE (пропускная способность по тесту CORETEST 1100 КВ/с, время поиска 16 мс). Плата SVGA (ISA, Diamond SpeedSTAR HiColor), используется ET4000, 1 МВ DRAM, как экранный буфер, графический ускоритель отключен. Переключатели на видеоплате установлены для наиболее надежной с быстрой работы, с пропускной способностью 6500 байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.
Программная конфигурация: MS-DOS 5.0, MS Windows 3.1, HyperDisk
4.32 в режиме обратной записи, используется 2 МВ расширенной памяти, в качестве менеджера памяти используется 386MAX 6.01. Эта программа также обеспечивает DPMI в некоторых тестах.
Результаты тестов
Для тестов Whetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL и Savage больший показатель означает большую производительность.
Для тестов MAKE RTL, MAKE TRANK и теста String- Test меньший показатель означает большую производительность.
33,3 МГц Intel C&T Intel Cyrix Cyrix
386DX 38600DX RapidCAD 486DLC 486DLC
кэш выкл. кэш вкл. Тесты с целыми числами
Whetstone (kWhet/s) 447 585 563 695 803
Drhystone(C) (Dhry./s) 11688 11819 12357 14150 15488
Drhystone(Pas) (Dhry./s) 10455 10877 10751 12154 13858
String-Test (ms) 459 453 441 347 327
MAKE RTL (s) 51,32 47,10 46,34 43,45 39,13
MAKE TRANCK (s) 62,42 55,47 55,37 53,64 46,12
WINTACH 4,85 4.90 5.49 5.53 6.14
Тесты с плавающей запятой
DODUC (Индекс скорости) 79.0 76.4 150.3 89.4 90.7
LINPACK (Mflops) 0.2808 0.2707 0.4578 0.3158 0.3438
LLL (Mflops) 0.3352 0.3537 0.6083 0.3816 0.4139
Whetstone (kWhet/s) 2540 2340 3990 2908 3061
Savage (решений/с) 71685 53191 72464 88757 93897
40 МГц Intel C&T Intel Cyrix Cyrix
386DX 38600DX RapidCAD 486DLC 486DLC
Тесты с целыми числами кэш выкл. кэш вкл.
Whetstone (kWhet/s) 536 702 676 835 963
Drhystone(C) (Dhry./s) 14128 14116 14836 16987 18750
Drhystone(Pas) (Dhry./s) 12490 13067 12890 14573 16624
String-Test (ms) 384 377 368 289 273
MAKE RTL (s) 43.46 40.11 39.84 37.25 33.54
MAKE TRANCK (s) 53.00 47.59 47.07 45.36 39.00
WINTACH 5.65 5.73 6.41 6.46 7.23
Тесты с плавающей запятой
DODUC (Индекс скорости) 94.9 77.5 180.3 105.1 106.6
LINPACK (Mflops) 0.3324 0.3260 0.5418 0.3789 0.4131
LLL (Mflops) 0.4025 0.4204 0.7260 0.4562 0.4956
Whetstone (kWhet/s) 3061 2632 4798 3505 3677
Savage (решений/с) 86083 49587 86957 106762 112360
Среди испытанных процессоров Cyrix 486DLC обладает самой большой производительностью по целым числам. С включенной внутренней кэш-памятью производительность по целым числам на одинаковой тактовой частоте 486DLC на 80% превышает 386DX, среднее увеличение скорости работы прикладных программ составляет 35%. При работе с прикладными программами, использующими операции как с целыми числами, так и с плавающей точкой, включенный кэш обеспечивает на 5% - 15% более высокие показатели по сравнению с работой без КЭШа. Скорость операций с плавающей точкой по сравнению с i386DX увеличивается на 15% - 30%
Intel RapidCAD при работе вместо i386DX обеспечивает самые высокие характеристики при выполнении операций с плавающей точкой. Прикладные программы, выполняющие интенсивные операции с плавающей точкой, работают быстрее на 60% - 90% по сравнению с i386DX/387DX, отставая от i486DX при той же тактовой частоте по скорости операций с плавающей точкой всего на 25%. Скорость операций с целыми числами увеличивается на 15% - 35% по сравнению с i386DX/i387DX.
Процессор Chips & Technologies 38600DX обладает несколько более высокими характеристиками при работе с целыми числами, чем i386DX, давая среднее увеличение скорости порядка 10%.