Hard

30.09.2010 Автор: Алексей Климов Версия для печати

Оцениваем технологию разгона многоядерных ЦП от AMD

Производительность процессора зависит от многих факторов, но среди них есть два самых важных - тактовая частота и число ядер. Чем выше частота, тем быстрее работает ЦП. Чем больше ядер, тем скорее выполняются многозадачные приложения. Первые час- тотные заигрывания с пользователями начались довольно давно, примерно 20 лет назад. Тогда большинство системных корпусов оснащались кнопкой Turbo, увеличивающей частоту функционирования ЦП в режиме реального времени.


 Уверены, многим до сих пор вспоминается взаимодействие турбокнопки и компьютерной игры «Поле чудес» — скорость вращения виртуального барабана напрямую зависела от положения включателя Turbo. Затем игры с частотами переместили в настройки BIOS, и чтобы разогнать систему, пользователям приходилось менять опорные частоты и множители, а затем перегружаться. Разумеется, можно было переборщить — и система намертво зависала, сбрасывать настройки приходилось перемычками.

 С появлением нескольких ядер в одном процессоре появились новые забавы. В ряде случаев можно отключать часть ядер в BIOS и работать на оставшихся. Такие трюки позволяют оценить эффективность однопоточного и многопоточного кодов для разных ситуаций и попутно снизить энергопотребление.

 Современным воплощением кнопки Turbo и желанного ускорения стали технологии Intel Turbo Boost и AMD Turbo Core. Инновация Intel появилась первой, почти два года назад, вместе с ядрами Core i7 и Core i5. Турбоподъем от Intel повышает тактовую частоту процессора автоматически, в режиме реального времени. Но при этом потребление электроэнергии находится в рамках спецификации теплового пакета TDP (Thermal Design Power). Алгоритм работы Turbo Boost выглядит до- статочно сложным. В зависимости от вычислительной нагрузки управляющий модуль поднимает частоты с шагом 133 МГц.

 Если речь идет о выполнении кода на одном ядре, то его частота может вырасти вначале на 133 МГц, затем на 266. Если придется поднимать частоты на двух, трех, четырех (и т.д.) ядрах, то их частотные характеристики вырастут строго на одну ступеньку (т.е. на 133 МГц). Для примера, эталонная характеристика Intel Core i7 Extreme Edition i7-980X (Gulftown) или Intel Core i7 Extreme Edition i7-975 (Bloomfield) составляет 3,33 ГГц, а в моменты максимального турбирования — 3,6 ГГц. И это не предел, серверный ЦП Intel Xeon X5677 (Westmere-EP) с рабочей частотой 3,46 ГГц самоускоряется до 3,73 ГГц. Интересно, что все работает по умолчанию — никаких турбо-кнопок или сложных настроек в BIOS.

 Стоит ли говорить о популярности технологии Intel Turbo Boost — пользователи прониклись рекламными слайдами и эффектными презентациями. И тут специалистам AMD оставалось лишь разводить руками, ведь от программной утилиты AMD OverDrive толку мало.

 Все изменилось с появлением шестиядерных новинок AMD Phenom II X6 — Phenom II X6 1090T и Phenom II X6 1055T. Изюминкой обеих моделей стала буква T в наименовании, которая обозначает поддержку инновации Turbo Core. Эта технология AMD выжимает максимум производительности в ряде вычислительных задач. Турбированные процессоры в случае обнаружения нагрузки только на одно, два или три ядра могут повышать скорость работы автоматически, путем увеличения частоты и напряжения питания. Это позволяет обеспечить более высокую производительность на задачах, которые не умеют или не могут использовать преимущества шестиядерной архитектуры. Для примера, в жаркие моменты на активные ядра Phenom II X6 1090T подается напряжение 1,475 В вместо 1,325, и функционируют они на частоте 3,6 ГГц вместо 3,2. Что касается модели Phenom II X6 1055T, то напряжение на ее ядрах может вырасти с 1,3 В до 1,45, а частота повысится на 500 МГц (с 2,8 ГГц до 3,3).

 По сути, технология AMD Turbo Core работает в рамках стандарта управления питанием ACPI версии 4.0, включающего характерные уровни управления системой (S-State), подсистемой, устройством (D-State), шиной, процессором (C-State и P-State). Турби-рованные процессоры AMD распознают запросы операционной системы по режимам P-States (Processor Performance States, рабочее состояние процессора), указывающим на правильные комбинации «напряжение + частота» процессора для разных нагрузок. Если утрировать, то вот как все выглядит.

 На первом шаге операционная система анализирует накопленную статистику простоев и решает, что требуется сделать переход от одного P-State к другому. Для турбоускорения процессора его драйвер ожидает вызова состояния P0. При этом важно, чтобы число загруженных ядер не превышало трех.

 На втором шаге ОС получает позитивную отмашку и начинается осуществление перехода на новый P-State. Энергопотребление всего процессора остается ограниченным сверху штатным значением TDP (в зависимости от модели шестиядерного процессора, это или 125 Вт, или 95 Вт), поскольку часть ядер бездействует.

 На третьем шаге повышается напряжение на активных ядрах, а затем меняется и частота их функционирования. Причем новое частотное значение достигается сразу за счет изменения множителя.

 На четвертом шаге активные ядра работают на максимальной частоте. Осуществляется термоконтроль в рамках TDP.

 Сам процесс турбирования продолжается, пока выполняются два усло- вия. Первое: три или более ядер не имеют нагрузки и находятся в состоянии сна. Второе: операционная система максимально использует вычислительную мощность активных ядер. В противном случае поступает запрос на состояние P1 и все характеристики ЦП возвращаются к исходному положению.

 

Как мы тестировали

 Тестирование технологии AMD Turbo Core проводилось с использованием следующей конфигурации: ЦП AMD Phenom II X6 Black Edition 1090T, системная плата Gigabyte GA-890FXA-UD7 (прошивка F2), память Transcend TX2000KLU-4GK (DDR3, 1333 МГц, 4 Гбайт, 9-9-9-24, 2-канальный режим), видеоплата ASUS EAH5830, жесткий диск Western Digital Caviar Black WD1002FAEX (2 Гбайт, SATA 6 Гбит/с, кеш 64 Мбайт, 7200 об/мин), оптический привод Plextor DVDR PX-810SA. Испытания проводились при подключенном мониторе Samsung SyncMaster PX2370 с графическим разрешением 1920 x 1080.

 Все программные тесты проводились под управлением ОС Windows 7 Ultimate 64 бит. Задействовались измерительные программные комплексы PCMark Vantage 1.0.2, SiSoftware Sandra Pro 2009 SP3. В качестве игровых тестов использовались Crysis, Serious Sam 2, The Chronicles of Riddick: EFBB и Enemy Territory — QUAKE Wars. Запуски игровых приложений осуществлялись с помощью утилиты SmartFPS.com v1.11.

 

Роль «мамки» в турбоускорении

 По мнению специалистов компании AMD, технология Turbo Core, интегрированная в шестиядерные процессоры Phenom II X6, заработает на любой материнской плате, созданной на базе фирменных микросхем серии 8xx. Однако на практике не все так гладко.

 В документации к большинству системных плат нет прямых указаний на поддержку AMD Turbo Core. Более того, зачастую нет и следов этой инновации в настройках BIOS (даже после обновления прошивки). В таких случаях хочется верить: Turbo Core включен в обязательном порядке и его нельзя отключить.

 Порадуемся, что в нашем тесте на базе топовой платы Gigabyte GA-890FXA-UD7 (rev. 2.0) все прошло без сомнений. Даже в майской прошивке F2 был «включатель» AMD Turbo Core. Правда, назывался он иначе — Core Performance Boost. Но это результат автоматического перевода слов Turbo Core с английского языка на китайский, а потом назад.

 Рассмотрим возможности самой системной платы Gigabyte GA-890FXA-UD7 — она попала к нам впервые, и на ее основе мы осуществили несколько тестирований. В ее гнездо AM3 можно устанавливать процессоры семейства Phenom II и Athlon II. Модель GA-890FXA-UD7 построена на связке системных микросхем AMD 890FX (северный мост) и AMD SB850 (южный мост), выпускаемых на заводах TSMC по техпроцессу 65 нм. В четыре разъема DIMM можно установить до 16 Гбайт оперативной памяти типа DDR3, которая может работать в двухканальном режиме. Пропускная способность шины Hyper Transport 3.0 составляет 5200 МТранзакций/с.

 Аудиоподсистема формата High Definition Audio реализована на кодеке Realtek ALC889, то есть можно подключать до восьми динамиков акустической системы, и даже больше — если подключить звук по схеме 7.1, а по пути вывести аудиопоток по двум стереоканалам с разъемами на передней панели системного корпуса.

 Сетевые возможности модели опираются на два(!) контроллера Realtek RTL8111D (10/100/1000 Мбит), реализующих технологию Smart Dual LAN. Один из режимов работы SDL называется Teaming, в нем пропускная способность двух независимых соединений объединяется и в теории максимальная скорость передачи данных составляет 2 Гбит/с. На базе платы GA-890FXA-UD7 можно построить файловый сервер.

 Среди разъемов для плат расширения есть два порта PCI Express x16, еще два разъема PCI-E х16, работающих в режиме х8, плюс еще два порта PCI-E х16, работающих в режиме х4. Таким образом, можно без проблем масштабировать технологию 2-/3-/4-Way ATI CrossFireX. Впечатляет?

 Есть и один разъем «устаревшего» интерфейса PCI — пользователи смогут установить на плату либо TV-тюнер, либо Wi-Fi-модуль. Не забываем и про «устаревший» контроллер iTE IT8720 — к нему подключаются флоппи-дисководы.

 Теперь про USB. У модели GA-890FXA-UD7 имеется 14 портов USB. Восемь из них смонтированы на задней панели, включая два комбинированных порта eSATA/USB. Напомним, что универсальные разъемы eSATA/USB позволяют пользователям подключать внешний НЖМД без дополнительного кабеля энергопитания. Еще четыре порта USB можно вывести на дополнительную планку. Оставшиеся два ультрамодных интерфейса USB 3.0/2.0 функционируют за счет микросхемы NEC D720200F1.

 Присутствие сертифицированного чипа Texas Instruments TSB43AB23 порадует двумя портами IEEE 1394a на задней панели. Еще один выносной IEEE 1394 можно подключить непосредственно к системной плате.

 К материнской плате Gigabyte GA-890FXA-UD7 можно подключить шесть дисков SATA 3.0 c пропускной способностью до 6 Гбит/с. Появляется возможность организовать дисковые массивы уровней RAID 0, 1, 5, 10 или JBOD. Контроллер Gigabyte SATA2 обеспечивает работу одного порта IDE и двух разъемов SATA для устройств SATA 2.0 с пропускной способностью до 3 Гбит/с. С его помощью можно строить RAID-массивы уровней RAID 0, 1 или JBOD. А благодаря дополнительной микросхеме JMicron JMB362 через заднюю панель подключаются еще два внешних SATA 2.0 — возможность создать еще один массив уровней RAID 0, 1 или JBOD.

 Системная плата Gigabyte GA-890FXA-UD7 относится к премиум-классу и на ее борту есть масса полезных решений. Аккуратными кнопками дублируются функции включения и перезагрузки ПК, сброса настроек BIOS. Есть двухзначный светодиодный индикатор POST-кодов, отображающий текущее состояние вычислительной системы. Важные разъемы снабжены отдельными светодиодами, помогающими быстро выявить и устранить возможные неполадки. В комплекте с платой GA-890FXA-UD7 поставляется модуль дополнительной системы охлаждения Hybrid Silent-Pipe с полноценным радиатором и тепловыми трубками, обеспечивающими более эффективный теплоотвод из зоны ЦП и НМС.

 

 Вспомнить все и быстро

 Знаете, в чем отличие дорогой оперативки от дешевой? Дорогостоящие модули смогут надежно работать на более высоких частотах, оставляя тайминги на предельно низком уровне. Так, вначале мы тестировали технологию AMD Turbo Core с использованием модулей памяти Transcend TX2000KLU-4GK, работающих на рекомендованных частотах в рамках SPD. То есть на эффективной частоте 1333 МГц с таймингами 9-9-9-24. Но DDR3-планки от Transcend способны на большее.

 Мы подняли частоту модулей TX2000KLU-4GK до 1600 МГц и при этом сохранили тайминги 9-9-9-24. И в таком режиме испытательная платформа на основе Gigabyte GA-890FXA-UD7 работала надежно даже в специальных стресс-тестах.

 Что касается производительности, то в большинстве синтетических тестов на пропускную способность памяти мы наблюдали позитивный эффект (см. табл.). А чтобы ощутить прирост производительности в реальных приложениях, потребуются более высокие частоты и тонкие настройки таймингов.

 Так, в SPD памяти Transcend, помимо JEDEC-стандарта 1333 МГц, с таймингами 9-9-9-24 при напряжении 1,5 В есть поддержка XMP-стандарта с частотой 2000 МГц при таймингах 9-9-9-24 и напряжении 1,6 В. И с такими характеристиками модель TX2000KLU-4GK работает без нареканий — была бы поддержка со стороны контроллера памяти в ЦП.

 Можно сказать, что двухканальный комплект Transcend TX2000KLU-4GK увеличивает производительность системы за счет низкого напряжения питания, высокой тактовой частоты и низких таймингов. Отметим и алюминиевый радиатор с вентиляционными столбиками, позволяющими эффективно отводить тепло и сохранять рабочую температуру на низком уровне.

 

Что показали тесты

 У специалистов AMD есть любимая песня про «нечестные» ядра Intel, когда многоядерные ЦП получаются путем банального объединения двух кристаллов в одном корпусе. Так вот, у специалистов Intel появилась приятная возможность говорить в ответ о «нечестной» турботехнологии AMD. Дело в том, что Intel Turbo Boost реализована на аппаратном уровне, а вот в инновации AMD Turbo Core большую роль играет операционная система.

 Тем не менее технология турбоускорения от AMD работает и в ряде тестов демонстрирует ощутимый прирост. Так, в однопоточных сценариях Memories, TV and Movies, Music, Communications прогресс очевиден. В моменты, когда нагружается одно ядро ЦП Phenom II X6 1090T частота процессора повышается и мы видим ощутимый прирост. А вот в ряде случаев с многоканальными вычислениями наблюдается обратная картина. Прыжки с шести ядер до трех и назад вызывают небольшие задержки в работе, и в результате получается небольшой регресс в плане производительности. Аналогичная картина выходит и в чистой «синтетике».

 В качестве игровых тестов мы выбрали пару «устаревших» игр, когда о многопоточном коде даже не мечтали (Serious Sam 2 и The Chronicles of Riddick: EFBB), и зафиксировали заметный позитив. В более свежих игрушках Crysis и Enemy Territory QUAKE Wars с небольшой оптимизацией под несколько потоков мы видим регресс.

 Получается ситуация, когда большинство владельцев Phenom II X6 1090T и Phenom II X6 1055T вместе с купленными процессорами получают в подарок серьезную дилемму «включать или не включать» опцию AMD Turbo Core. Можно выиграть, а можно проиграть. Причем в повседневных задачах трудно разобраться, есть толк от AMD Turbo Core или нет.

 В тестах современных процессоров Intel технология Intel Turbo Boost всегда включена — хуже не будет. А вот с новейшими процессорами от AMD придется выполнять двойную работу по тестированию в конкретных приложениях.


Назад в раздел

Текст сообщения*
Защита от автоматических сообщений

Читайте также