Hard

15.11.2010 Автор: Иван Савватеев Версия для печати

Тестируем шестиядерный процессор Intel i7-970 для гнезда LGA1366

Долгое время четыре ядра были пределом мечтаний для настольных систем. Но технологии совершенствуются, что позволяет увеличивать число ядер. Полгода назад Intel выпустила первую ласточку нового семейства — рассчитанный на фанатов «экстремальный» кристалл Core i7-980X EE с частотой 3,33 ГГц, разблокированными множителями и вполне экстремальной рекомендованной ценой 40 тыс. руб. Ну а через несколько месяцев, в июле, появился чуть более доступный Core i7-970 (3,2 ГГц, фиксированные множители, рекомендованная цена — 30 тыс. руб.). О нем и пойдет сегодня разговор.


 Первые процессоры микроархитектуры Nehalem (Core i7-965 и ряд других, кодовое имя Bloomfield) Intel выпустила в конце 2008 г. по хорошо отработанному к тому времени 45-нм технологическому процессу. В дальнейшем был выпущен целый ряд процессоров с другими ядрами той же микроархитектуры (с небольшими усовершенствованиями вроде добавления нескольких команд) и по тому же техпроцессу. Затем последовал переход на более тонкий 32-нм техпроцесс, причем фирма, будучи верной своему принципу «тик-так» (менять либо техпроцесс, либо микроархитектуру, но не оба этих параметра одновременно), никаких крупных архитектурных изменений не вносила. Наконец, обкатав новую технологию на сравнительно мелких кристаллах (процессоры семейств Core i5 и i3), она вплотную занялась топовыми моделями.

 Здесь, в отличие от «малышей», был прямой смысл увеличить число ядер на одном кристалле — ведь только этим путем можно добиться существенного роста производительности, пусть и на ограниченном круге задач (дальнейшее повышение тактовой частоты, как мы знаем, зашло в тупик еще несколько лет назад). Так Intel и поступила: в новых кристаллах (кодовоеимя Gulftown), предназначенных, как и их 45-нм «одноклассники», для гнезда LGA 1366 и оснащенных трехканальным контроллером памяти, число ядер увеличилось до шести, что благодаря технологии Hyper Threading позволяет одновременно исполнять до 12 потоков. Однако других крупных изменений по сравнению с «предками» нет — даже обозначения поменялись незначительно (вместо Core i7-965 и -975 появились -970 и -980, работающие на тех же частотах — 3,2 и 3,33 ГГц соответственно). Характеристики новых процессоров и их предшественников можно увидеть в таблице, а также (для i7-970 и i7-965) на скриншотах утилиты CPU-Z.

 Как мы можем видеть, в 1,5 раза был увеличен общий для всех ядер кеш третьего уровня, что вполне логично: самих-то ядер и их собственных кешей L1 и L2 стало тоже в 1,5 раза больше. Из других отличий в цифрах можно заметить лишь уменьшение множителя QPI, повлекшее соответствующее снижение скорости этой шины, связывающей процессор с внешними устройствами, с 6,4 до 4,8 Гтранзакции/с. Вероятно, это связано с тем, что Core i7-965 является «экстремальной» версией процессора, в то время как Core i7-970 — обычный ЦП. В общем, возникает искушение считать «новичков» просто увеличенной в 1,5 раза вариацией «старичков», что, конечно, не совсем верно: новые процессоры вобрали в себя все те мелкие усовершенствования, что уже были внедрены в кристаллах среднего и нижнего сегментов, и в первую очередь различные расширения системы команд (смотрим на строчку Instructions на скриншотах: у нового процессора там добавилась аббревиатура AES, обозначающая наличие команд, предназначенных для ускорения шифрования данных по этому алгоритму). В целом же, опираясь на сухие цифры, можно предсказать, что Core i7-980X будет как минимум не медленнее, чем Core i7-975. А вот со второй парой все сложнее: окупит ли увеличение числа ядер уменьшившуюся на четверть пропускную способность шины QPI? Что ж, приступим к экспериментальной проверке.

 Для тестирования нами использовалась материнская плата Intel DX58SO с тремя модулями памяти частотой DDR3-1066, работающими по таймингам 7-7-7-20, видеоконтроллером Gigabyte GV-R583UD-1GD (AMD Radeon HD 5830) и жестким диском Western Digital WD1002FAEX. Режим Turbo Boost был включен. Применялась операционная система Windows 7 x64 Ultimate, видеодрайверы версии 10.7 и июньская вер- сия DirectX. Полученные результаты представлены в таблице.

 Первое, что бросается в глаза — существенно ухудшившиеся у нового процессора характеристики памяти (скорость обмена снизилась на 18–25%, латентность возросла на 13%). Чем это вызвано, сказать затрудняемся, ведь настройки контроллера памяти в обоих случаях одинаковы (частота 1066 МГц, тайминги 7-7-7-20). Конечного пользователя, однако, по-настоящему волнует производительность приложений в целом, а не отдельных подсистем компьютера, а с этим дела обстоят явно лучше. В общем зачете новый шестиядерник опередил аналогичный по параметрам четырехъядерник на 21% — очень существенный прирост, надо сказать, ведь частоты не изменились, а шина QPI, обеспечивающая общение процессора с «внешним миром», стала работать, как мы помним, даже на четверть медленнее (4,8 Гтранзакции/с вместо 6,4). Однако наши испытания снова подтверждают старую истину, что «средняя температура по больнице», по большому счету, ни о чем не говорит.

 Снова обратимся к таблице. Такой интересующий большинство пользователей ПК показатель, как производительность игр, у обоих процессоров получился абсолютно одинаковым: хотя разница в скорости игр есть, но она, во-первых, незначительна (по большому счету, укладывается в рамки возможной погрешности), а во-вторых, в большинстве случаев лидером оказался старый процессор, но с незначительным отрывом (пара процентов). И только в случае с демобенчмарком новейшей игры Lost Planet 2 шестиядерный ЦП ушел в ощутимый отрыв: в зависимости от разрешения он колебался между 2 и 10%. Вероятно, тут дело в том, что даже в современных играх многопоточность не используется слишком интенсивно (ведь они должны эффективно работать не только на топовых моделях, но и на совершенно средних и даже ниже двухъядерных кристаллах без всякого гипертрединга), а значит, от прибавки двух лишних ядер и четырех потоков выигрыша они не получили.

 С наилучшей стороны, как и стоило ожидать, новичок проявил себя в скорости рендеринга (один из тестов пакета CINEBENCH и специальный набор тестов SPECapc для пакета трехмерного моделирования и анимации LighWave): «старичок» проиграл примерно 30%, что почти идеально совпадает с разницей в числе потоков. Очень хороший результат был показан и в бенчмарке для Java — 25%. Научные расчеты и преобразование аудиофайлов из одного формата в другой тоже получили ощутимую, но значительно меньшую прибавку — 7–10%. (Заметим, что в случае расчетов это сильно зависит от их характера: есть алгоритмы, хорошо поддающиеся распараллеливанию, а есть и абсолютно однопоточные, так что, если процессор приобретается именно для такого рода работ, пользователь должен сам задуматься о том, что именно предстоит считать.) Ну а тесты интерактивной составляющей трехмерного моделирования («художественно-игровые» пакеты LightWave и Maya, САПР SolidWorks и Pro/ENGINEER), как и тесты браузеров (скорость исполнения JavaScript и Flash), показали практически полную «пофигистичность» этих категорий задач к числу потоков: новый процессор оказался быстрее, но на жалкие 2%, а то и меньше.

 Лишь с одной категорией тестов новичок справился хуже: это архивация данных, но разрыв здесь составил всего 2%. Однако здесь имеется маленькая тонкость: почти весь проигрыш объясняется тестированием сжатия набора файлов архиватором RAR в один поток. Поскольку вычислительное ядро процессоров Gulftown не имеет принципиальных отличий от такового у Bloomfield, а частота работы одинакова, то и производительность собственно ядра будет близкой. Но тут в дело вступают два других фактора: скорость обмена данными «процессор–память» и «память–диск». Обе эти величины у новичка ощутимо хуже. Правда, влияние более «тормознутой» шины QPI вряд ли слишком велико: в конце концов, даже самые быстрые диски имеют не такую уж высокую скорость реального считывания информации, поскольку она напрямую связана со скоростью физического перемещения записанной информации под считывающими головками. Большой может быть лишь скорость передачи информации между контроллером диска и микросхемами кеш-памяти, расположенными на самом накопителе, что, надо полагать, и приводит к такому результату. Когда же архивация выполнялась тем же самым RAR, но в 16 потоков, разрыв сократился до 7,5%, ну а в архиваторе 7-Zip ее и вовсе нет. В то же время синтетический тест производительности архивирования, встроенный в WinRAR, показал полное превосходство нового процессора (до 7%), причем и в одно-, и в многопоточном режимах — это лишний раз показывает, что относиться к синтетическим тестам надо с большой осторожностью, поскольку в реальной эксплуатации картина может получаться совершенно иной. (В данном случае можно предположить, что столь хорошие результаты «синтетики» объясняются увеличившимся в 1,5 раза объемом кеша третьего уровня, что резко сократило количество обращений к ОЗУ, чего не происходит на практике.)

 Напоследок опять обратимся к пакету синтетических тестов Everest. Помимо тестирования латентности и пропускной способности памяти, в него входит некоторое число расчетных задач. Как видим, цифры там разнятся: один тест оказался равнодушен к числу ядер (Photoworkxx), большинство других показали преимущество новичка в 30–32% (почти идеальное распараллеливание). Но в одном тесте — AES — новый процессор «рвет» своего предка: разрыв в 12 раз! Все объясняется очень просто: здесь «работают» новые инструкции шифрования данных по алгоритму AES, имеющиеся в процессорах Gulftown, но отсутствующие в Bloomfield (строчка Instructions в скриншотах утилиты CPU-Z). Понятно, что на таких очень узких задачах преимущество новых технологий будет неоспоримым.

 Подведем итог. Реальное преимущество от шестиядерника получат лишь пользователи ПК, для которых важна в первую очередь скорость выполнения не самых распространенных задач, допускающих их значительное распараллеливание. Например, для студии, занимающейся трехмерным моделированием и анимацией, был бы смысл купить для рабочих мест дизайнеров относительно дешевые четырехъ- или даже двухъядерные процессоры (интерактивная составляющая, как мы видели, практически не зависит от числа ядер), а вот на машины, предназначенные для рендеринга, — новейшие шестиядерники, поскольку разница в скорости будет весьма ощутимой. Однако как средство обеспечения повседневной рутинной деятельности обычных пользователей, будь то офисные работники, инженеры-конструкторы или геймеры, новый процессор реальных преимуществ над предыдущей моделью с той же частотой практически не имеет, соответственно, при покупке надо в первую очередь смотреть на цену.


Назад в раздел

Текст сообщения*
Защита от автоматических сообщений

Читайте также