Рынок графических ускорителей развивается очень динамично. Ведущие производители компьютерной графики как по команде анонсируют новые поколения своих решений в начале или в конце года, делая это с интервалом в пару месяцев. Ни один из конкурентов не хочет терять своей доли рынка, поэтому очередной громкий анонс NVIDIA догоняет не менее масштабный релиз ATI (иная последовательность тоже допускается). Однако в июне 2005 года сложился несколько иной расклад на рынке: компания NVIDIA, выпустив графический процессор NVIDIA G70, заняла лидирующую позицию на рынке Hi-End ускорителей. В сентябре ответа от ATI так и не последовало, хотя налицо было явное преимущество продукта калифорнийской компании. В среднем ценовом диапазоне наблюдалась аналогичная картина, производительность ATI Radeon X700 Pro зачастую была ниже таковой NVIDIA GeForce 6600GT.
Многочисленные задержки анонса нового поколения графических ускорителей ATI были связаны с проблемами технического характера. Дело в том, что большинство чипов из первых экспериментальных образцов R520 не могли работать на запланированных частотах. Поэтому для увеличения выхода годных кристаллов ATI пришлось проделать ряд операций по доводке и отладке новой продуктовой линейки. Канадской компании удалось решить проблемы, и в октябре 2005 свет увидела новая линейка графических процессоров ATI RADEON X1000.
Большинство компаний-производителей бросились анонсировать различные видеокарты на базе ATI RADEON X1000. Компания Sapphire не стала исключением, так как является одним из главных партнеров канадской компании и имеет в своем арсенале огромное количество продуктов, основанных на всей линейке чипов ATI RADEON X1000, благо, последняя довольно обширна (см. обзор «Radeon X1800 series: новая звезда линейки ATI»).
Несмотря на большое количество всевозможных интересных Hi-End продуктов у Sapphire, мы решили остановиться на Mainstream-решении Sapphire RADEON X1600 XT.
Мы уже не раз отмечали, что обозреватели незаслуженно обходят стороной среднеценовой и бюджетные рынки. Ни для кого не секрет, что спрос на дорогостоящие продукты значительно меньше, чем на массовые и дешёвые. Несомненно, Hi-End нужно тестировать, но не стоит забывать и о земных вещах, поэтому в данном материале мы решили уделить внимание Sapphire RADEON X1600 XT.
ATI RADEON X1600 XT:
- техпроцесс с нормой производства 90 нм на фабриках TSMC;
- частота ядра 590 МГц;
- 12 записей по пикселям за такт;
- 4 текстурных модуля;
- 128-битная память типа GDDR3 cо временем доступа 1,26 сек. объёмом 128 Мбайт;
- частота памяти 690 МГц (эффективная – 1,38 ГГц);
- 4 записи в контроллер памяти за такт;
- 6 блоков вершинных шейдеров;
- поддержка Pixel Shaders & Vertex Shaders 3.0 и API Microsoft DirectX 9.0 c;
- опциональная поддержка перманентной анизотропной фильтрации степени до 16Х включительно;
- адаптивный антиалиасинг для сглаживания внутрипрозрачных текстур (не суперсэмплинг!), общий максимальный уровень 6х (14х в режиме CrossFire);
- технология CrossFire после появления соответствующих материнских плат и MasterCard-версий.
Характеристики ATI RADEON X1600 XT впечатляют, учитывая тот факт, что данный продукт ориентирован на массовый рынок.
Вершинные и пиксельные процессоры
Графическое решение канадской компании располагает 5 вершинными процессорами, которые построены по схеме 3+1, т.е. Arithmetic Logic Unit вершинного процессора выполняет две разные операции одновременно над тремя компонентами вектора и четвертой компонентой. Похожую организацию вершинных процессоров имеет последнее поколение графики NVIDIA. Однако вершинный процессор G70 за один такт обрабатывает четырёхкомпонентный вектор и скаляр (схема 4+1) и не имеет возможности выборки значений из текстур.
Количество пиксельных процессоров равняется 12, однако архитектура ATI RADEON X1600 XT не предполагает 12 отдельных процессоров – последние сгруппированы по 4. Таким образом, 12 пиксельных процессоров образуют три так называемых квада, каждый из которых включает несколько блоков:
- Branch Execution Unit;
- Scalar Arithmetic Logic Unit 1;
- Scalar Arithmetic Logic Unit 2;
- Vector Arithmetic Logic Unit 1;
- Vector Arithmetic Logic Unit 1.
Они, в свою очередь, могут выполнить за такт над четырьмя пикселями несколько операций:
- операцию условного или безусловного перехода (Branch);
- Scalar ADD+модификация компонентов (Scalar Arithmetic Logic Unit 1);
- Scalar ADD/MUL/MAD и другие операции (Scalar Arithmetic Logic Unit 2);
- VEC3 ADD+модификация и перестановка компонентов (Vector Arithmetic Logic Unit 1);
- VEC3 ADD/MUL/MAD и другие операции (Vector Arithmetic Logic Unit 2);
- запрос данных из TMU (происходит параллельно с одной из вышенаписанных операций).
Итого, 6 операций за такт, что очень хорошо для mainstream-решения.
Для организации деятельности распределения работы между разными исполнительными устройствами используется специальная архитектура Ultra-Threaded Architecture. В её цели входит максимально возможное сокращение времени простоя исполнительных устройств (например, текстурных модулей и квадов пиксельных процессоров) и более эффективная организация вычислительных мощностей процессора. Ultra-Threaded Architecture присутствует в виде специального блока-коммутатора Ultra-Threading Dispatch Processor, который оптимально распределяет нагрузку между текстурными модулями и квадами пиксельных процессоров. Алгоритм технологии достаточно прост: Ultra-Threading Dispatch Processor анализирует работу пиксельных процессоров в составе каждого квада, и если какой-либо из них не загружен работой, он моментально получает выполнение новой задачи. Однако не исключены случаи, когда свободный пиксельный процессор попросту не получится загрузить из-за того, что не получены данные для выполнения шейдера. В таком случае деятельность пиксельного процессора приостанавливается до момента получения данных. По заявлению компании ATI, такой подход позволяет добиться 90% эффективности загруженности пиксельных процессоров при обработке любых шейдеров.
Помимо этого, взаимодействие текстурных модулей и блоков адресации текстур происходит не напрямую, а через Ultra-Threading Dispatch Processor. Это позволяет скрыть латентность вызова текстур.
В ATI RADEON X1600 XT в полной мере реализованы шейдеры, соответствующие стандарту Shader Model 3.0. Процессор RV530 производит вычисления в формате 128-bit FP, что способствует исключению накопления ошибок. Благодаря flow control, поддерживаются шейдеры практически неограниченной длины.
Ещё одной интересной особенностью архитектуры ATI RADEON X1600 XT является наличие branch execution unit – блока по выполнению ветвлений, который выполняет по одной инструкции управления потоком. Применение branch execution unit более чем оправданно – благодаря данному блоку очень сильно разгружаются основные ALU графического решения, что приводит к увеличению производительности, например, при обработке пиксельных шейдеров.
Кэш и контроллер памяти
Отдельным словом хотелось бы отметить ещё одну особенность новой архитектуры – кэширование сжатых данных, т.е. все текстурные данные, данные буфера кадра и глубины хранятся в кэше чипа в сжатом виде и по мере надобности распаковываются. Однако сегодня этим никого не удивишь, но у ATI RADEON X1600 XT данные не просто распаковываются и запаковываются, а делают это на лету в реальном времени, поэтому вполне можно предположить, что виртуальный объём кэш-памяти значительно увеличился.
Кэш RADEON X1600 XT стал полностью ассоциативным. Ни для кого не секрет, что ассоциативный кэш работает эффективнее, нежели кэш с прямым отображением, особенно это хорошо заметно при использовании высоких разрешений вкупе с антиалиасингом и анизотропной фильтрацией.
Изменения также коснулись технологии HyperZ – она получила новый усовершенствованный алгоритм определения невидимых областей, подлежащих отсечению, эффективность которого, в сравнении с RADEON X850, увеличилась на 50%.
Контроллер памяти ATI RADEON X1600 XT был полностью переработан и очень сильно эволюционировал в сравнении с предшественниками. Внутренняя шина памяти RADEON X1600 XT включает две кольцевые 128-битные шины. Использование кольцевой топологии позволяет упростить и оптимизировать разводку проводников или, говоря простым языком, позволяет соединить компоненты кратчайшим путем.
Благодаря новой архитектуре памяти производители видеокарт могут оснащать свои продукты, построенные на базе ATI RADEON X1600 XT, даже самой высокочастотной памятью GDDR4. Традиционная архитектура такого не позволяет. Как правило, при использовании памяти, работающей на завышенных частотах, наблюдаются помехи, приводящие к нестабильной работе видеокарты.
Память в RADEON X1600 XT подключена к шинам посредством так называемых четырёх «кольцевых остановок» (Ring Stop), которые в своё время имеют два канала доступа к памяти шириной 32 бита каждый.
Давайте немного поговорим о принципе работы Ring Bus подсистемы памяти, которой оснащён RADEON X1600 XT. Принцип работы Ring Bus довольно интересен: контроллер памяти, который находится в середине чипа, получает запрос от клиента. Затем контроллер памяти анализирует полученные запросы и определяет их приоритетность, отдавая предпочтению тому, который в наибольшей степени влияет на производительность. Затем контроллер памяти посылает соответствующий запрос чипам памяти и передаёт эти данные по Ring Bus до ближайшего Ring Stop, который затем передаёт данные клиенту.
Ещё одной интересной особенностью контроллера памяти RADEON X1600 XT является возможность программирования алгоритма работы непосредственно в самом драйвере, т.е. у компании ATI есть возможность последующего совершенствования функционирования подсистемы памяти.
HDR, 3Dc+, новые методы анизотропной фильтрации и антиалиасинга
ATI RADEON X1600 XT получил полноценную поддержку HDR – режимы отображения с расширенным динамическим диапазоном.
В новом поколении 3D графики значительные изменения также коснулись антиалиасинга и анизотропной фильтрации. Так, алгоритм последней подвергся серьёзному усовершенствованию, появился новый режим Quality AF, в основу которого положен алгоритм Area-Aniso, за счёт которого удалось добиться лучшего качества фильтрации текстур.
Помимо этого, X1600 XT получил возможность сглаживания прозрачных текстур – Adaptive Anti-Aliasing. Аналогичным режимом FSAA обладает G70. Главная фишка Adaptive Anti-Aliasing заключается в улучшении качества отображаемых объектов, которые используют так называемые прозрачные текстуры (например, листья, трава, вода).
И это далеко не все нововведения, призванные увеличить качество изображения. Технология сжатия карт нормалей (3Dc+) получила возможность сжатия одноканальных текстур. Применение 3Dc+ более чем оправданно, благодаря данной технологии, можно повысить детализацию 3D-объектов, не увеличивая количество полигонов.
ATI Avivo
Долгое время возможности решений ATI по обработке видео выглядели достаточно скудно, особенно на фоне разработок главного конкурента – компании NVIDIA. Однако выход нового семейства RADEON X1000 положил конец этой несправедливости. Так, ATI RADEON X1600 XT получил в свое распоряжение Avivo Display Engine, который может похвастаться возможностью кодирования/декодирования форматов H.264 и VC-1 на аппаратном уровне. Напомним, что именно H.264 и VC-1 лежат в основе таких стандартов, как Blu-Ray и HD-DVD. Давайте затронем «железную» сторону Avivo Display Engine. Он состоит из двух 10-битных «движков» и решения Xilleon.
Оба 10-битных процессора полностью независимы и имеют следующие особенности:
- возможность осуществления масштабирования и деинтерлейсинг;
- поддержку оверлея, цветовой коррекции и гамма-коррекции.
Устройство Xilleon осуществляет кодирование сигнала в ТВ-формат, поддерживается формат HDTV, что не может не радовать.
Sapphire X1600 XT
Технические характеристики карты Sapphire X1600 XT |
Производитель карты | Sapphire |
Графический процессор | RV530 |
Частота чипа, МГц | 590 |
Память | G-DDR 3, 256 Мбайт |
Частота памяти, МГц | 690 (1380 DDR) |
Ширина шины памяти, бит | 128 |
Интерфейс | PCI Express 16x |
RAMDAC | 2x400 МГц |
Количество вершинных конвейеров | 5 |
Количество пиксельных конвейеров | 12 |
API | DirectX 9.0c, OpenGL 1.5 |
Контроль системы охлаждения | Отсутствует |
Дополнительное питание | Отсутствует |
Разъёмы подключения мониторов | D-Sub и DVI |
Наличие TV-Out | Да |
Наличие TV-IN | Нет |
Цена, $ | 200-250 |
К нам на тестирование видеокарта Sapphire X1600 XT попала в OEM-варианте, поэтому металлизированный пакетик включал непосредственно саму видеокарту, диск с драйверами и стильную наклейку с логотипом компании.
Sapphire X1600 XT использует референсный дизайн PCB ATI RADEON X1600 XT. В этом нет ничего удивительного – разрабатывать свой собственной дизайн очень дорого, а референс, предложенный компанией ATI, достаточно продуман. Различия заключаются лишь в системе охлаждения. Так, радиатор Sapphire X1600 XT более массивен, чем таковой у референсной платы ATI, он прикрывает не только процессор, но и чипы памяти. В остальном система охлаждения точно такая же, как и на ATI RADEON X1600 XT: медное основание, к которому припаяны рёбра, прикрыто кожухом (в нашем случае он изготовлен из металла, а в референсной плате он пластиковый). Вентилятор с несколько изогнутыми частыми рёбрами направляет воздушный поток в стороны от вентилятора, прогоняя его через медные рёбра.
Кристалл графического процессора контактирует с подошвой радиатора через слой густой белой термопасты, память тоже имеет контакт с радиатором через прокладки. Охлаждение организовано довольно грамотно, ни GPU, ни память не перегреваются.
Видеокарта Sapphire X1600 XT, как и референс-плата ATI RADEON X1600 XT, использует упрощённую схему управления оборотами кулера: таходатчик отсутствует, и это хорошо видно; вентилятор подключается к плате всего двумя проводами.
Акустические характеристики применяемой системы охлаждения не порадовали. Видеокарта Sapphire X1600 XT достаточно шумная. Складывается такое впечатление, что скорость вращения вентилятора не регулируется, и её турбина все время работала на повышенных оборотах.
Место для установки чипа Rage Theater у Sapphire X1600 XT присутствует, однако сам чип не распаян. Тем не менее, в арсенале компании Sapphire есть модель, основанная на чипе ATI RADEON X1600 XT с поддержкой VIVO.
Видеокарта оснащена следующими выходами: один D-Sub, один DVI и S-Video.
Снимаем систему охлаждения…
На фотографии хорошо видно, что сам графический процессор ATI RADEON X1600 XT обладает очень компактными размерами. Выше мы уже отмечали, что новая архитектура ATI предполагает чёткую разбивку на отдельные независимые блоки. Поэтому урезание конвейеров в ATI RADEON X1600 XT благоприятным образом отразилось на его размерах и экономичности.
Обратите внимание на схему питания. Очевидно, что ATI RADEON X1600 XT потребляет значительно меньше электроэнергии, нежели топовые решения: количество элементов питания значительно меньше, и это видно невооружённым глазом. За управление в схеме питания применяются два программируемых PWM-контроллера RichTek RT9232A. Вы можете увидеть их на фотографии, они расположены с обратной стороны PCB.
Там же можно заметить место для установки дополнительного TMDS-трансмиттера
Основные элементы схемы питания расположены в правом верхнем углу печатной платы, однако силовые ключи, которые мы привыкли видеть здесь, перекочевали на левую сторону PCB и расположены недалеко от графического процессора.
Разъём для подключения внешнего питания отсутствует, так как мощности, подаваемой через разъём PCI Express x16, вполне достаточно для питания ATI RADEON X1600 XT.
Посадочные места для памяти имеются только на фронтальной стороне PCB, чипы памяти расположены в традиционном стиле ATI в виде буквы L, RADEON X1800 XT/XL с их ромашкой из микросхем памяти не в счёт.
Графический процессор, как и положено по спецификации RADEON X1600 XT, работает на частоте 400 МГц.
В видеокарте используется GDDR-3 память Infineon HYB18H512321AF-14.
Эти чипы имеют ёмкость 512 Мбит, время доступа 1,4 нс и напряжение питания 1,8 В. Номинальная рабочая частота составляет 693 (1386) МГц, но в ATI RADEON X1600 XT память работает на стандартной частоте в 690 (1380) МГц. Поскольку ёмкость одной микросхемы равна 512 Мбит, 4 таких микросхемы в сумме дают нам 256 МБ. Память Infineon HYB18H512321AF-14 имеет организацию 16Мх32, поэтому ширина шины памяти составляет 128 бит.
Разгон
Память Infineon с маркировкой HYB18H512321AF-14 показала себя не очень хорошо. Нам удалось повысить частоты с номинальных 590 МГц и 690 (1380) МГц до 635 МГц и 800 (1600 DDR) для графического чипа и памяти соответственно. Таким образом, прирост таковых частот в процентном показателе составил 7,6% для чипа и 16% для памяти.
Видеокарта разгонялась при помощи утилиты RivaTuner. Стабильность работы при разгоне проверялась с помощью бенчмарка 3DMark 2006, который прокручивался три раза. Если появлялись искажения на мониторе, частоту памяти понижали на несколько мегагерц. Если компьютер зависал, частоту графического ядра понижали на несколько мегагерц. Если же все три раза бенчмарк прокручивался нормально, то разгон удался, а автора данного материала посещало чувство глубокого самоутверждения. Для дополнительного охлаждения применялся, в частности, вентилятор, обдувающий память видеокарты.