Первоначальной целью статьи было исследование производительности в зависимости от частоты шины и параметров памяти на системах nForce2. Интересной являлась частота 183 МГц, на которой происходит резкое падение производительности. Если увеличение частоты системной шины с 166 МГц до 200 МГц даёт определённое повышение в скорости, то переход с 182 МГц до 200 МГц далеко не так однозначен. К тому же, для работы на повышенной частоте с минимальными задержками необходима более качественная память. Такая информация будет полезна для оптимального разгона тем, кто не обременён удачной материнской платой и хорошей памятью. Однако использовавшаяся материнская плата ASUS A7N8X-X обладает некоторыми "особенностями", которые не позволяют распространять результаты на все платы nForce2. Но общую тенденцию, тем не менее, полученные результаты отражают.
Тестовая система.
- Материнская плата – nForce2 400, ASUS A7N8X-X, BIOS 1007.
- Процессор – AMD Athlon 1700+ Thoroughbred-B.
- Видеокарта – Radeon 9000, 64 МБ, 128 bit.
- Память – 1х512 МБ, 5-2-2-2,5, Nanya PC3200.
- Жёсткий диск – WD400JB.
- Операционная система – MS Windows 2000 SP4.
Отмечу, что материнская плата одноканальная. Разница в производительности с двухканальной системой, в большинстве случаев, находиться в пределах 0%-3%. Задержки памяти почти не изменяются или даже чуть лучше. По документации и внешне она ничем не отличается от A7N8X кроме одноканальности и внешних контроллеров.
Какие тесты использовались?
Учитывая, что падение на 183 МГц происходит при повышении частоты шины, был сделан вывод - падение связано с задержками при обращении к памяти. Поэтому для тестов использовались два архиватора 7-zip и RKC. Стоит отметить, что существуют специфические программы, зависимость скорости которых в проведенном исследовании может сильно отличаться от протестированных.
Итак, тестировались:
- 7-zip, fb=255. Использовался режим Ultra, размер слова 255. Пиковое использование памяти – 200 МБ. Размер файла для сжатия – 20 МБ.
- 7-zip, fb=64. Так как при увеличении размера слова скорость архивирования больше зависит от частоты процессора, то дополнительно было произведено тестирование при размере слова 64. Использовался режим Ultra, размер слова 64. Пиковое использование памяти – 200 МБ. Размер файла для сжатия – 20 МБ.
- RKC. RKC – это не полноценный архиватор, а экспериментальная версия. Его выбор связан с тем, что он использует перспективный алгоритм PPM и в ближайшее время ожидается выход полноценной версии WinRK с удобной графической оболочкой. Использовался максимальный режим. Пиковое использование памяти – 400 МБ. Размер файла для сжатия – 20 МБ.
- UT2003. Этот игровой тест является одним из лучших для оценки общей производительности домашнего компьютера. В отличие от 3DMark, результаты меньше зависят от видеокарты, а увеличенное до 32 количество ботов заставляет процессор больше времени тратить на работу искусственного интеллекта и физику. Использовался тест BotMatch на карте Antalus. Настройки качества – все на максимум. Разрешение 640х480х32. Количество ботов – 32.
- ScienceMark 2.0. Использовался для тестирования пропускной способности памяти и задержек памяти. Выбор именно этой программы обусловлен тем, что она сразу представляет задержки памяти в абсолютном значении в наносекундах и формирует лог-файл.
Насколько можно доверять результатам?
Результаты UT2003 обладают достаточно большим разбросом при одинаковых условиях. Поэтому встроенный тест не использовался, а запускался BotMatch. Для получения удовлетворительной точности, время выполнения теста было установлено в 240 секунд (около 7 минут реального времени).
Тестирование 7-zip встроенным тестом выявило такую особенность. Во-первых, первые результаты теста после перезагрузки очень сильно отличаются (порядка 4%). Во-вторых, на экране отображаются результаты только первого прохода, что не логично. Приходиться постоянно нажимать кнопку "Restart" и вручную усреднять результаты каждого прохода. Поэтому тестирование выполнялось при помощи консольной версии и утилиты timer 3.01.
В ScienceMark 2.0 тест выполнялся несколько раз, до получения одинаковых результатов (задержек памяти). Информация о частоте шины и процессора получалась при помощи CPU-Z. Для оценки погрешности, на двух разных частотах тесты были запущены несколько раз и взята максимальная разница результатов. Конечно, это не является строгой погрешностью, но для её оценки вполне сгодится.
Зависимость производительности от параметров памяти.
Начнём с наиболее простого, тестирования влияния параметров памяти. Основной задачей являлось определение того, насколько каждый из параметров влияет на производительность. Поэтому этот тест небольшой, но наглядный.
Но уже тут возникли некоторые затруднения с материнской платой ASUS A7N8X-X. Дело в том, что изменения CAS Latency с 2,5 до 3 не приводили к изменению результатов при частоте 200х9,5. А при частоте 160x12,5 (минимальная частота работы CAS Latency = 2), не было разницы между 2 и 2,5. Поэтому тестирование проводилось при такой "странной" частоте 180х11.
Внимание, отображен интервал 90% - 100%.
В основном, влияние оказывают параметры RAS to CAS Latency и CAS Latency. Причем RAS to CAS немного большее. RAS Precharge имеет гораздо меньшее значение, а увеличение Active Precharge может даже повышать производительность, но разница находится в пределах погрешности.
Зависимость производительности от частоты шины.
Частота процессора была зафиксирована на отметке 1900 МГц. Память работала с параметрами 5-2-2-2,5. Частота шины изменялась от 166 до 205. Это обусловлено максимальной частотой разгона процессора - 2200 МГц при 1,85 В, максимальной частотой разгона материнской платы ASUS A7N8X-X – 208 МГц и некоторыми ограничениями. Как говорится, добро пожаловать на землю. Никаких частот 2400 МГц для процессора (при предельном напряжении) и 220-230 МГц для материнской платы мне достичь не удалось. Причем это не первая моя материнская плата, а процессор я менял 6 раз в течение нескольких месяцев.
Для того чтобы изолировать влияние частоты процессора, тестирование проводилось при двух значениях коэффициента процессора. Искомая производительность на частоте 1900 МГц получалась банальной линейной интерполяцией.
Но "странности" A7N8X-X преследовали и здесь. На частоте 185 МГц возникли две проблемы. Во-первых, не все коэффициенты были доступны. Во-вторых, при коэффициенте х11 и х11,5 производительность резко отличалась от х8,5 и х9,5. Поэтому результаты при коэффициенте х11 приводятся отдельно. Небольшой поиск в Интернете абсолютных значений задержек показало, что на других материнских платах разница тоже есть, но её характер иной. На частоте шины 166 МГц абсолютные значения задержек везде совпадают.
Для сравнения, результаты низкоуровневых тестов.
Force2 400 ASUS A7N8X-X. PC3200 5-2-2-2.5. |
Конфигурация | Частота шины, МГц | Частота процессора, МГц | Пропускная способность памяти (ScienceMark 2.0), МБ/с | Задержки памяти (ScienceMark 2.0), нс |
166x11 | 167.00 | 1837.6 | 2 406 | 97.41 |
166x11.5 | 167.00 | 1921.0 | 2 421 | 96.30 |
175x10.5 | 175.40 | 1841.7 | 2 540 | 91.76 |
175x11 | 175.40 | 1929.4 | 2 522 | 92.78 |
180x10.5 | 180.40 | 1894.4 | 2 607 | 89.21 |
180x11 | 180.40 | 1984.5 | 2 602 | 90.20 |
185x8.5 | 185.00 | 1572.8 | 2 460 | 99.19 |
185x9.5 | 185.00 | 1757.8 | 2 493 | 98.99 |
190x8.5 | 190.00 | 1615.1 | 2 526 | 96.59 |
190x9.5 | 190.00 | 1805.2 | 2 575 | 96.39 |
195x8.5 | 195.10 | 1658.2 | 2 592 | 94.08 |
195x9.5 | 195.10 | 1853.3 | 2 634 | 93.89 |
200x9.5 | 200.50 | 1904.3 | 2 700 | 91.37 |
205x8.5 | 205.50 | 1746.5 | 2 731 | 89.32 |
205x9.5 | 205.50 | 1951.9 | 2 769 | 89.14 |
185x11 | 185.00 | 2035.3 | 2 655 | 89.91 |
190x11 | 190.00 | 2090.1 | 2 720 | 87.07 |
190x11.5 | 190.00 | 2185.1 | 2 749 | 87.41 |
195x11 | 195.10 | 2146.0 | 2 793 | 85.28 |
200x11 | 200.50 | 2205.1 | 2 872 | 82.54 |
Для получения производительности на частоте процессора 1900 МГц для частот шины 185 МГц и выше, в некоторых случаях, использовалась линейная экстраполяция. Соответственно результаты там оказались менее точными. Тесты не выполнялись на частотах шины 182 МГц и 183 МГц, однако, падение производительности происходит именно здесь.
Итак, низкоуровневые тесты. Чтобы легче было сравнивать, приводится график не задержек, а величины, обратной задержкам.
Внимание, отображен интервал 80% - 100%.
Все очень четко, на частоте 183 МГц (по графику на 185 МГц) происходит падение производительности. Причем задержки памяти ухудшаются значительно больше, чем пропускная способность. А в остальном, все линейно от частоты шины с коэффициентом близким к единице.
А теперь результаты приложений.
Внимание, отображен интервал 90% - 100%.
Назвать это "странным" – ничего не сказать. Точность RKC – порядка 0,01%. Так что придется с этим мириться и как-то объяснять.
По результатам можно сделать вывод, что на частоте шины 183 МГц (по графикам на 185 МГц) происходит увеличение задержек, а на частоте 190 МГц происходит что-то ещё, не влияющее на низкоуровневые тесты, но влияющее на приложения. Возможно, замедление или отключение nForce2 DASP. Но определённо сказать что-либо сложно. Тест RKC показывает, что разница между результатами х8,5-9,5 и х11 небольшая, хотя задержки отличаются весьма сильно. А на задержки памяти RKC реагирует четко. В случае 7-zip разница значительна. Полный бардак.
Чтобы подлить масло в огонь, скажу, что изменение частоты шины с помощью утилиты ClockGen1.01 не равносильно увеличению частоты в BIOS. Пресловутый провал на 183 МГц отсутствует, но производительность на 200 МГц совпадает. В любом случае, необходимо дополнительное исследование, и на других материнских платах. Пока же, ограничимся выводом, что на частоте 183 МГц наступает провал в производительности. Лишь после поднятия частоты шины до 200 МГц результаты достигают уровня 182 МГц. При переходе с 200 МГц на 205 МГц, наблюдается отсутствие прироста производительности. Но, учитывая, что на 210 МГц тесты не проводилось, какие-либо определённые выводы делать не будем.
Производительность может изменяться при разных коэффициентах умножения процессора.
Итоги.
Материнская плата ASUS A7N8X-X обладает некоторыми "странностями". Не всегда можно изменить параметр CAS Latency. После частоты шины 185 МГц не работаю некоторые коэффициенты умножения процессора. При разных коэффициентах производительность может сильно отличаться. Сильно ругать A7N8X-X я не буду, т.к. у других материнских плат "странности" тоже есть, надо просто поискать.
Наибольшее влияние на производительность памяти оказывают параметры RAS to CAS Latency и CAS Latency. Причем, вопреки все ещё бытующему мнению, RAS to CAS Latency имеет большее значение, чем CAS Latency (это справедливо для DDR SDRAM).
На материнских платах nForce2 на частоте шины 183 МГц наступает значительный провал в производительности (при одинаковой частоте процессора). Только где-то на 200 МГц производительность достигает уровня 182 МГц. К сожалению, остались неизученными причины, вызывающие падение производительности на 183 МГц (и выше), а так же зависимость производительности при частоте шины 210 МГц и выше.