Заниматься производством видеоплат на базе нового графического процессора будут все крупные компании: Albatron, AOpen, ASUS, BFG, Biostar, Chaintech, Gainward, Galaxy, Gigabyte, InnoVISION, Leadtek, MSI, Palit, PNY, Point of View, Prolink, Sparkle и XFX. Подводя промежуточный итог, все же стоит отметить, что каких-либо кардинальных изменений, сравнимых с переходом от GeForce 2 к GeForce 3, в чипе нет. Поэтому новое поколение графических процессоров от NVIDIA стоит рассматривать как весьма существенную доработку архитектуры предыдущего поколения — CineFX 3.0. Ведь, как и старая архитектура, новая ориентирована на Shader Model 3.0, то есть на вершинные и пиксельные шейдеры версии 3.0. Рассмотрим их более детально. CA..EII.A IOI‚AEA. По сравнению с GeForce 6800 в качественном плане никаких изменений в архитектуре вершинных конвейеров не произошло. Внутреннее устройство идентично конвейерам GeForce 6800, поддерживаются вершинные шейдеры версии 3.0. Помимо роста числа вершинных конвейеров (с шести до восьми) заявлена низкоуровневая оптимизация скалярных ALU и блоков выборки текстур. У каждого конвейера есть блок выборки текстур, в общей сложности их восемь. Количество пиксельных конвейеров возросло с 16 до 24, что само по себе повлечет существенный рост производительности. Однако число блоков растеризации по-прежнему равно 16. И хотя чип может обработать до 24 пикселей за такт, процесс растеризации возможен лишь для 16 пикселей. Таким образом, теоретическая пиксельная скорость заливки идентична GeForce 6800 Ultra. Как объясняет NVIDIA, в случае активного использования пиксельных шейдеров и мультитекстурирования 16 блоков. Новая видеоплата опережает Radeon X850XT почти по всем показателям. Стоит отметить существенно возросшую скорость выполнения пиксельных шейдеров в синтетических тестовых пакетах 3DMark 2003 и 3DMark 2005. В этих тестах GeForce 7800 GTX превосходит платы предыдущего поколения в лице Radeon X850XT и GeForce 6800 Ultra в два и более раз. Во всех остальных сценах тестовых пакетов наблюдается закономерный рост благодаря увеличению числа пиксельных и вершинных конвейеров. Отметим, что по мере роста нагрузки на видеоплату (увеличения разрешения, включения полноэкранного сглаживания и анизотропной фильтрации) Radeon X850XT все ближе подбирается к новому лидеру, что несколько настораживает. Причиной такого поведения, скорее всего, является «сырая» версия драйверов, ведь GeForce 7800 GTX появилась совсем недавно. И, наконец, подведем итог. Графический чип GeForce 7800 GTX — новый лидер рынка. Конечно, такие выдающиеся результаты в первую очередь возможны благодаря наличию восьми пиксельных и двух вершинных дополнительных конвейеров. Ну и, конечно, различного рода оптимизации конвейеров. Новая реализация режима сглаживания также придется по вкусу боль- шинству пользователей. Остается лишь один вопрос: как долго NVIDIA сможет удерживать пальму первенства. Чтобы на него ответить, достаточно дождаться выхода в свет чипа R520 от ATI. На момент подготовки этого материала процессор еще не появился, однако его анонс был уже очень близок. Очевидно, что ATI обязательно ответит NVIDIA. И, конечно же, не стоит забывать про Ultra-модификацию процессора G70. Помимо разгона в чипе могут появиться дополнительные конвейеры. По некоторым данным, общее число пиксельных конвейеров может возрасти до 32 с соответствующим ростом производительности. Основной этап битвы за рынок high-end еще впереди.
1.8 Последние технологические разработки
NVIDIA продолжает медленно, но верно осваивать поле под названием Direct X 10. На этот раз компания намерена завоевать средний и нижний ценовые сегменты, представив видеокарты на базе чипов GeForce 8500 и GeForce 8600. Они пришли на смену платам 7-й серии и предлагают большую производительность, архитектуру с унифицированными шейдерами, аппаратную поддержку DX10 и декодирование HD-фильмов. Звучит неплохо, осталось проверить все эти новшества на практике. Ядро GeForce 8600 GT/GTS содержит 289 млн транзисторов и несет в себе 32 унифицированных потоковых процессора (Streaming Processors, SP), объединенных в два блока по 16 SP. Они работают на более чем вдвое большей частоте по сравнению с остальными компонентами чипа. Для GeForce 8600 GTS частоты, соответственно, равны 675 МГц и 1450 МГц, для GeForce 8600 GT — 540 МГц и 1180 МГц. Каждый из SP может производить расчеты c 32-битной точностью, что делает их пригодными для научных, экономических и других вычислений. Серьезные изменения постигли текстурные блоки TMU. Как и прежде, на каждые 16 пиксельных процессоров приходится 4 TMU. Однако в ядре G80 четыре текстурных блока могут за такт вычислить 4 текстурных адреса и выполнить 8 операций текстурной фильтрации, в случае с G84 показатель адресации текстур увеличен до восьми. Таким образом, TMU нового ядра способны за такт совершать в два раза больше текстурных выборок. Теоретическая скорость текстурирования G86 равна 16 текселям за такт (10,8 гигатекселя в секунду для GeForce 8600 GTS). Отметим, что на практике платы показывают в два раза меньшие результаты. С чем это связано, пока неизвестно.Число блоков растеризации (Raster Operation, ROP) сократилось до двух. Поддерживается как новый тип сглаживания (Coverage Sampled Antialiasing, CSAA), так и рендеринг с использованием сглаживания и высокого динамического диапазона HDR одновременно. Каждый из блоков за раз может обработать до четырех пикселей (16 субпикселей) и обеспечивает 64-битный доступ к видеопамяти. Ширина шины данных равна 128 битам, что может серьезно ограничить быстродействие видеокарт.
Подсистема памяти на GeForce 8600 GT/GTS представлена четырьмя микросхемами GDDR3 (с 32-битной шиной) объемом 512 Мбит каждая. Для версии GT номинальная частота равна 1400 МГц, для GTS — 2000 МГц.Графический чип GeForce 8500 GT может похвастаться лишь одним функциональным блоком, который состоит из 16 потоковых процессоров и 4 TMU. Ядро содержит 210 млн. транзисторов. Номинальная частота чипа равна 450 МГц, потоковых процессоров — 900 МГц. Блоки ROP и шину данных оставили без изменений. На видеокартах используются 8 микросхем DDR2-памяти (с 16-битной шиной) объемом 256 Мбит каждая. Частота памяти составляет 800 МГц. Основным преимуществом чипов G84 и G86 стал встроенный видеопроцессор PureVideo HD. Он использует BSP-движок, который берет на себя основную нагрузку по декодированию таких видеоформатов, как H.264, VC-1, MPEG-2 с разрешением до 1920x1080 и битрейтом до 40 Мбит/с. На практике получается следующее: воспроизведение дисков Blu-ray и HD-DVD с применением программного декодирования загружает процессор на 90-100%, видеокарты предыдущего поколения снижают этот показатель до 60-70%, в случае с GeForce 8500/8600 обработка видео отъедает лишь 20% процессорного времени. Поддержка внешних интерфейсов у GeForce 8500/8600 теперь встроена в графическое ядро платы. В случае с GeForce 8800 этим занимался чип NVIO. GeForce 8600 GTS оснащена двумя выходами Dual-Link DVI-I c поддержкой HDCP. Кроме того, возможно появление моделей с разъемом HDMI. GeForce 8500 GT и 8600 GT обладают лишь опциональной поддержкой HDCP и HDMI, так что реализация этих интерфейсов остается уделом производителей видеокарт.
1.9 Графический процессор NVIDIA
NVIDIA— это одно из лучших вложений в ПК. Процессоры помогут улучшить выполнение повседневных задач — от редактирования фотографий до просмотра фильмов высокой четкости и 3D карт.
1.10 Обзор. ВидеокартаASUS GeForce 8800 GT 512Mb на NVIDIA G92
Уже почти 2 месяца прошло с даты официального анонса графического процессора GeForce 8800 GT, а в свободной продаже видеокарты на нем все еще очень редки, вследствие чего и цены на них не спускаются до уровня рекомендованных. Одна из таких видеокарт попала в тестовую лабораторию, но прежде чем знакомиться с ней, предлагаем познакомиться с ее основой, т.е. сам Графический процессор, который имеет кодовое имя G92, выполнен теперь по «более тонкому» техпроцессу 65 нм и состоит из 754 миллиона транзисторов. В основе его лежит унифицированная шейдерная архитектура на базе GigaThread technology, которая подразумевает наличие массива общих процессоров для потоковой обработки вершинных, пиксельных и геометрических подпрограмм (хотя могут выполняться и любые другие подпрограммы, например физические расчеты, если их перевести в понятный GPU вид). Этот графический процессор имеет полную аппаратную поддержку OpenGL 2.0 и DirectX 10.0, что подразумевает работу с Shader Model 4.0, выполнение геометрических шейдеров, поддержку изменения геометрии и записи промежуточных данных из шейдеров. При этом поддерживает работу с 128-разрядными числами с плавающей запятой для представления цветовой информации на всех этапах конвейера рендеринга.
Рисунок 1.1 - Диаграмма графического процессора G 92
За работу с текстурами и формирование изображения (рендеринг) отвечает NVIDIA Lumenex Engine, который поддерживает 16x анизотропную фильтрацию (anisotropic filtering), 16x полноэкранное сглаживание (full screen anti-aliasing) в режимах multisampling и supersampling для обычных и полупрозрачных поверхностей. Также поддерживается работа с HDR-освещением (high dynamic-range) и сглаживанием при 128-разрядной точности (32-битное описание каждого компонента точки текстуры при фильтрации и закрашивании). Для компрессии цветовой информации, текстур, данных z-буфера и карт нормалей применяются передовые алгоритмы сжатия без потерь. А для отсечения невидимых в конечной сцене точек используется метод Z-cull, причем благодаря технологии Early-Z этот метод способен отбрасывать «лишнее» еще до растеризации, чтобы не приходилось обрабатывать лишнюю информацию.