Формулируя суть сегодняшнего события, так и хочется применить избитый штамп советских времён: "
Отныне официально стартовал новый виток в гонке вооружений". Разумеется, графических вооружений, тем более, что применение 3D графики класса top-end все равно традиционно связывается с наращиванием производительности в наиболее динамичных 3D Action играх.
Итак, сегодняшний день можно считать фактическим началом нового противостояния между двумя гигантами рынка 3D графики - ATI Technologies и NVIDIA Corp., поскольку в ответ на представленную недавно новую серию NVIDIA GeForce 7800 компания ATI сегодня официально представила новое поколение своих чипов под общим названием ATI Radeon X1000 Family.
Слухи о новых чипах семейства Radeon X1000, более известных под собирательным рабочим названием ATI R520, бурлили в Сети уже достаточно продолжительное время, но сегодня у нас появилась возможность впервые представить вам официальную информацию об архитектуре нового поколения графики ATI.
Ключевыми усовершенствованиями архитектуры, представленной чипами серии ATI X1000, можно назвать поддержку Shader Model 3.0 и 512-битную шину контроллера памяти.
Архитектура ядра ATI X1800
Полагаю, все уже наслышаны о том, какие имена получили чипы серии ATI X1000. На всякий случай - уточняю: чип с рабочим названием R520 будет теперь фигурировать как Radeon X1800, RV530 - как X1600, а RV515 - как X1300. Разумеется, по мере наполнения рынка новыми чипами на прилавках как грибы начнут появляться карты со всевозможными суффиксами после названия чипа. Традиционно все эти наименования вроде Radeon X1800XT, Radeon X1800XL, Radeon X1600XT, Radeon X1600 Pro, Radeon X1300 Pro и им подобные будут означать различные сочетания тактовых частот GPU и ширины шины контроллера памяти. Всё это будет потом, а сегодня мы поговорим об архитектуре чипов и ее ключевых характеристиках.
Для начала - небольшая сводная таблица, где приведены основные данные чипов серии ATI X1000.
GPU | X1800 (R520) | X1600 (RV530) | X1300 (RV515) |
Сегмент | Enthusiast | Performance / Mainstream | Mainstream / Value |
Техпроцесс | 90 нм |
Поддержка DirectX | DirectX9, Shader Model 3.0 |
Количество конвейеров | 16 | 12 | 4 |
Интерфейс памяти | 256 бит | 128 бит, 64 бит | 128 бит, 64 бит, 32 бит (HyperMemory) |
Поддержка AVIVO | Есть |
Поддержка памяти | GDDR3 | GDDR3 / 2 / 1 |
Интерфейс HDMI/HDCP | Есть |
Поддержка H.264 | Есть |
Возглавит линейку наиболее производительный 16-конвейерный чип Radeon X1800XT, поддерживающий тактовую частоту ядра 600 МГц, до 512 Мб 256-битной памяти GDDR3 с тактовой частотой до 700 МГц. Конечно, это не NVIDIA GeForce 7800 GTX, который даже с тактовой частотой 430 МГц выглядит внушительнее благодаря своей 24-конвейерной организации, однако Radeon X1800XT будет биться за первенство не только аритектурой ядра, но, получается, и более высокой тактовой частотой памяти - 700 МГц против 600 МГц у GeForce 7800 GTX.
Увы, активно муссировавшиеся ранее слухи о том, что R520 будет обладать чуть ли не 32-конвейерной архитектурой не подтвердились. На самом деле графическое ядро обладает 16-конвейерной пиксельной архитектурой, или, как это называют в ATI, "16 пиксельно-шейдерными процессорами", плюс 8 вертексными процессорами с полноценной поддержкой Shader Model 3.0. На этом усовершенствования архитектуры не заканчиваются: также добавлено динамическое управление потоком данных и многопоточная (в терминологии ATI - Ultra-Threading) обработка данных, что позволяет R520 исполнять одновременно 512 пиксельных тредов. Изменения также коснулись вертексных процессоров, которые теперь в состоянии обрабатывать две шейдерные инструкции за такт, или, теоретически, до 10 млрд. инструкций в секунду.
В новой архитектуре заявлен значительно улучшенный механизм предсказания ветвления и обработки тредов. Сама по себе возможность параллельной обработки 512 пиксельных тредов является наиболее значительным усовершенствованием новой архитектуры.
Шейдерный модуль Radeon X1800
На практике 16 пиксельных процессоров чипа X1800 организованы в группы по четыре ядра (ATI называет эту структуру Quad-pixel Shader Core), плюс массив регистров общего назначения, шестнадцать блоков адресации текстур и распределительный Ultra-Threading процессор.
Шейдерный модуль Radeon X1800, фрагмент
Пиксельная обработка организована небольшими 4x4 группами, в результате чего X1800 обрабатывает 16 пикселей в треде, а каждый пиксельный процессор исполняет в треде шесть различных шейдерных инструкций с четырьмя пикселями за такт. Организация пикселей небольшими 4x4 группами имеет свои неоспоримые преимущества:
Данные из установочного блока (Setup Engine) пересылаются на распределительный Ultra-Threading чип, который равномерно распределяет нагрузку между четырьмя "квадро-пиксельными" ядрами. Инструкции обрабатываются с 128-битной FP разрядностью и затем, в случае не востребованности сохранения в текстурном кэше, данные пересылаются в массив регистров общего назначения, который позволяют не только увеличить пропускную способность и обеспечить промежуточное хранение инструкций, но также гарантируют более быстрое переключение тредов, снижая тем самым загрузку исполнительных модулей ветвления.
В сочетании с динамическим контролем процесса, реализованным в распределительном Ultra-Threading процессоре, все шейдерные процессоры постоянно загружены данными, за счет чего также оптимизируется количество исполняемых инструкций за такт.
Стоит отметить, что каждый чип семейства X1000 обладает распределительным процессором UltraThreading. Чип Radeon X1800, как уже было сказано выше, обладает четырьмя "квадро-пиксельными" ядрами, то есть, имеет 12-конвейерную архитектуру; восемью вертексными конвейерами, шестнадцатью текстурными блоками (TMU), откуда и получается возможность работы с 512 тредами одновременно. Чип Radeon X1600 обладает тремя "квадро-пиксельными" ядрами, то есть, имеет 12-конвейерную архитектуру; пятью вертексными конвейерами и четырьмя текстурными блоками, его архитектура ограничена возможностью обработки 128 тредов. Чип Radeon X1300 обладает одним "квадро-пиксельным" ядром, что дает соответственно, 4-конвейерную архитектуру; двумя вертексными конвейерами и четырьмя текстурными блоками, что также дает ограничение в 128 тредов.