Архитектура AMD K8L: собираем все слухи воедино
Всего каких-то 10 лет назад на компьютерном рынке всё было предельно просто. Intel производила самые быстрые и популярные процессоры для потребительского рынка, то и дело превосходя свои собственные достижения. У её конкурентов не было достойного аналога. Поэтому никакого усложнения не происходило: для трёх сегментов рынка (бюджетного, потребительского и серверного) выпускалось по одному семейству процессоров.
Выход процессора AMD Athlon перевернул всё с ног на голову. У Intel не было достойного ответа на момент анонса Athlon. С тех пор AMD хоть и осталась в отстающих, но её стали принимать всерьёз. Представление в 2003 году архитектуры AMD64 подтвердило серьёзные намерения второго производителя ЦП отвоевать как можно большую долю рынка.
Как раз в то время началось то самое усложнение. Вместе с Athlon 64 был выпущен первый Athlon 64 FX, который на самом деле был переименованным Opteron серии 100. Intel в ответ выпускает Pentium 4 Extreme Edition, оснащённый кэшем третьего уровня. По сути, это была разогнанная версия Xeon MP, выпускаемая в те времена.
Далее события стали развиваться по нарастающей: Pentium 4 5xx, Pentium 4 6xx, Pentium D, Core 2 Duo – все эти процессоры производятся до сих пор, и все они предназначаются только для настольного сегмента. Но на основе одних можно собирать более дешёвые компьютеры, а на основе других – более дорогие.
У AMD ситуация не лучше. Сегодня в настольном сегменте у неё минимум четыре процессора: Athlon 64 Sempron, Athlon 64, Athlon 64 X2 и Athlon 64 FX. Все они существуют в четырёх (!) исполнениях: Socket 754, Socket 939, Socket 940 и Socket AM2. Но в последнее время AMD встала на путь унификации процессорного разъёма, за что честь ей и хвала. Вскоре все настольные чипы перейдут «под крыло» Socket AM2, а экстремальные (как в плане быстродействия, так и в плане стоимости) Athlon 64 FX опять станут походить на серверные Opteron, но уже серии 2ххх, что выпускаются под Socket F.
Однако следующие два года готовят нам встречу с тремя новыми процессорными разъёмами AMD: Socket AM2+, Socket AM3 и Socket F+. С ними будут выпускаться чипы, основанные на архитектуре, условно названной K8L. Что это такое, какие процессоры будут представлены на её базе, а также смогут ли они дать достойный ответ производительным Intel Core 2 Duo – в этом мы и попробуем разобраться.
Архитектурные изменения
Главная особенность обновлённой архитектуры K8 заключается во внесении изменений в алгоритмы вычисления. Эти так называемые архитектурные изменения должны будут вывести производительность процессоров AMD хотя бы на сравнимый с Core 2 Duo уровень. Конечно, при работе на одинаковых тактовых частотах.
|
Примерные улучшения, «грозящие» процессору K8L |
Все процессоры K8 производят выборку команд из L1-кэша блоками по 16 байт. Такой темп позволяет умещать в один блок до четырёх команд длиной по 4 байт или до трёх длиной по 5 байт. Однако длина может быть и больше. Таким образом, эффективность может оказаться ниже заявленной. Процессор Core 2 Duo также делает выборку по 16 байт. Но у него есть специальный буфер, кэширующий циклы размером до 64 байт. Отчасти это позволяет обойти ограничение 16-байтной выборки. В K8L AMD планирует увеличить выборку команд до 32 байт.
Помимо этого, будет улучшена схема работы с SSE-командами. Как известно, их разрядность составляет 128 бит. Но из-за 64-битных регистров процессора их приходится обрабатывать по частям: сначала одну половину, а потом вторую. В K8L разрядность блоков, работающих с SSE, будет увеличена до 128 бит. Таким образом, AMD избавится от ещё одного узкого места.
Одним из самых узких мест в архитектуре K7 и K8 была разрядность шины, объединяющей кэши первого и второго уровней. Если в K7 с этим было совсем плохо (её ширина составляла 64 бит, тогда как уже в Pentium III на ядре Coppermain она была 256 бит), то в K8 AMD несколько улучшила ситуацию. Она добавила второй 64-битный канал. Однако каждый из них используется для передачи данных только в одну сторону. То есть шина кэша как бы равна 128 бит, но на самом деле более 64 бит данных в одну сторону не передашь. Выходит, что двукратная эффективность достигалась далеко не во всех случаях.
Насчёт изменения этой ситуации в K8L пока известно только то, что процессор одновременно сможет производить либо две операции чтения, либо одно чтение и одну запись. Но этого также может оказаться недостаточно, если ширина каналов, связывающих кэши L1 и L2, не возрастёт.
Продолжая тему кэша, необходимо упомянуть и кэш третьего уровня. По вышеприведённому слайду ясно видно, что процессор будет выполнен по «настоящему» четырёхъядерному дизайну. Судя по всему, это означает наличие общего для всех ядер L3-кэша. Это нововведение должно поднять эффективность обмена данными между ядрами. Сегодня обмен производится с использованием шины памяти, что, согласитесь, совсем малоэффективно из-за высокой латентности такого способа.
В Core 2 Duo эта проблема решается благодаря использованию общего кэша второго уровня. Но в своих первых четырёхъядерных процессорах Intel собирается отказаться от такой схемы. В ЦП Kentsfield (версия для производительных настольных компьютеров) и Clovertown (серверная версия) она банально объединит в одном корпусе два кристалла Conroe и Woodcrest соответственно. Получится, что четыре ядра будут иметь попарно общий L2-кэш, но для обмена информацией с другой парой придётся прибегать к системной шине, что ещё менее эффективно, чем в случае с процессорами AMD64, где контроллер памяти встроен прямо в процессор. Так что будет очень интересно, что же окажется быстрее: K8L или новые четырёхъядерники Intel.
Процессорные разъёмы, новый тип памяти и HyperTransport 3.0
AMD всегда гордилась тем, что после очередного обновления линейки процессоров не приходится менять материнскую плату для их использования. Формально почти любой чип Socket A можно установить в любую плату, причём так, чтобы это всё заработало (конечно, не без шаманства с бубном и танцами, но всё же). Однако перенос контроллера памяти на кристалл изменил эту ситуацию.
При смене типа памяти или добавлении ещё одного канала теперь приходится менять и процессорный разъём. Это случилось уже два раза: при переходе от Socket 754 к Socket 939 (был добавлен второй канал памяти) и от Socket 939 к Socket AM2 (внедрена поддержка DDR2). В будущем нас ждёт как минимум ещё один тип памяти: DDR3. Неудивительно, что многие потенциальные покупатели систем Socket AM2 насторожились, – его может хватить опять на год-два, а после этого для замены процессора придётся докупать новую плату и память.
И действительно, так и есть, но только отчасти. К 2008 году современный Socket AM2 сначала сменится на Socket AM2+, а затем на Socket AM3. Сведём все свойства этих разъёмов в одну таблицу:
Разъём | Socket AM2 | Socket AM2+ | Socket AM3 |
Поддержка памяти | DDR2 | DDR2 | DDR2, DDR3 |
Версия HyperTransport | 1.0 | 3.0 | 3.0 |
Поддержка процессоров | Rev F/G (K8) Rev B (K8L) Будущие 45 нм ЦП | Rev F/G (K8) Rev B (K8L) Будущие 45 нм ЦП | Будущие 45 нм ЦП |
Частота HyperTransport | 2,0 ГГц | Больше 4,0 ГГц | Больше 4,0 ГГц |
Тип соединения | Параллельный | Параллельный | Последовательный |
Мониторинг температуры | Диод | Диод и FSI | FSI |
Размер BIOS | 4 Мбит | 8 Мбит | 8 Мбит |
Размер кэша | 2x1 Мбайт | 2x1 Мбайт | 2x1 Мбайт |
Дата выхода | Май 2006-го | 3-й кв. 2007-го | 2-й кв. 2008-го |
Первое, что бросается в глаза, – обратная совместимость процессоров под Socket AM2+ и Socket AM3 с Socket AM2. Да, да – даже внедрение поддержки DDR3 никак не отразится на совместимости современных плат с будущими ЦП. AMD смогла достичь этого довольно просто: новый контроллер памяти сможет работать как с DDR2, так и с DDR3. Нечто подобное мы могли наблюдать при переходе на DDR2: первая серия чипсетов Intel 915 могла работать как с DDR, так и с DDR2. Конечно, не одновременно. То же самое произойдёт и при переходе на DDR3. В следующем году Intel представит чипсеты серии Bearlake, которые смогут работать с двумя типами памяти – DDR2 и DDR3.
Вместе с тем в серверном сегменте наблюдается несколько иная ситуация. С выходом Xeon на ядре Woodcrest Intel выпустила новый чипсет, поддерживающий FB-DIMM. Главное преимущество этих модулей заключается в большой ёмкости. Но вместе с тем мы получили очень большие задержки (а, как известно, именно из-за них AMD в своё время не торопилась с переходом на DDR2) и тепловыделение.
|
Высокое тепловыделение модулей FB-DIMM сводит на нет все преимущества низкого TDP новых Xeon |
С тепловыделением вообще отдельная история. На недавно проведённой презентации в Москве AMD открыто говорила о высокой тепловой эффективности новых чипов Xeon. Но из-за сильно греющихся чипсетов и модулей памяти энергопотребление всей системы в целом оказывается выше, чем у основанной на базе Opteron. Неудивительно, что AMD изначально относилась к FB-DIMM скептически. И, судя по всему, даже Intel начинает признавать очередное своё упущение в вопросе памяти (заметим, далеко не первое упущение такого рода).
Сегодня второй производитель процессоров принимает активное участие в разработке нового типа памяти DDR3. Новые модули позволят поднять пропускную способность в два раза в сравнении с DDR2. Кроме того, новый тип позволит выпускать планки ёмкостью от 512 Мбайт до 32 Гбайт, что уже как минимум сравнимо с современными FB-DIMM. Кстати, если FB-DIMM каким-то макаром всё же выживет и получит широкое распространение, AMD внедрит и его поддержку. Так что здесь всё зависит от «as market requires».
Вернёмся к нашим процессорным разъёмам. Единственным серьёзным отличием Socket AM2 от Socket AM2+ станет внедрение поддержки новой шины HyperTransport 3.0. Она должна будет поднять пропускную способность на участке «процессор-чипсет», а также «процессор-процессор» в случае Opteron и будущих Athlon 64 FX. Что интересно, скорость новой шины будет зависеть от частоты процессора. Эту зависимость хорошо отражает следующая таблица:
Частота процессора | Частота тактового генератора | Пропускная способность HyperTransport |
2,0 ГГц | 1,5 ГГц | 12,0 Гбайт/с |
2,1 ГГц | 1,5 ГГц | 12,0 Гбайт/с |
2,2 ГГц | 1,6 ГГц | 12,8 Гбайт/с |
2,3 ГГц | 1,7 ГГц | 13,6 Гбайт/с |
2,4 ГГц | 1,8 ГГц | 14,4 Гбайт/с |
2,5 ГГц | 1,8 ГГц | 14,4 Гбайт/с |
2,6 ГГц | 1,9 ГГц | 15,2 Гбайт/с |
2,7 ГГц | 2,0 ГГц | 16,0 Гбайт/с |
2,8 ГГц | 2,0 ГГц | 16,8 Гбайт/с |
2,9 ГГц | 2,1 ГГц | 16,8 Гбайт/с |
3,0 ГГц | 2,2 ГГц | 17,6 Гбайт/с |
3,1 ГГц | 2,3 ГГц | 18,4 Гбайт/с |
3,2 ГГц | 2,3 ГГц | 19,2 Гбайт/с |
3,3 ГГц | 2,4 ГГц | 19,2 Гбайт/с |
3,4 ГГц | 2,5 ГГц | 20,0 Гбайт/с |
3,5 ГГц | 2,6 ГГц | 20,8 Гбайт/с |
В сравнении с HyperTransport, что применяется в современных чипах AMD, пропускная способность возрастёт минимум в два раза (сегодня она составляет 6,4 Гбайт/с). А для самых быстрых представителей новых процессоров, частота которых достигнет в ближайшие год-два 2,9-3,0 ГГц, этот показатель возрастёт в три раза.
Кроме того, нам гарантируется обратная совместимость со старой шиной. Конечно, если установить ЦП с поддержкой HT 3.0 в Socket AM2, он будет обмениваться данными с чипсетом на сниженной скорости. Но благодаря тому, что контроллер памяти встроен в процессор, это вряд ли приведёт к серьёзному падению производительности. Исключением могут стать четырёхъядерные процессоры – там повышенная пропускная способность HT 3.0 может оказаться более востребованной.
Все остальные изменения, ожидаемые при переходе на Socket AM2+ и Socket AM3, не столь значительны. Они касаются нового типа BIOS, а также изменённого мониторинга рабочего состояния процессора (температуры, напряжения). Что касается сроков появления новых разъёмов на рынке, то Socket AM2+ мы сможем «потрогать» уже через год, а Socket AM3 выйдет не ранее второго квартала 2008 года. Но, опять же, это неофициальная информация, и она может измениться.