Hard

08.02.2011 Автор: Алексей Набережный Версия для печати

Тестируем новейший Radeon HD 6970 против GeForce GTX 580, но выигрывает устаревший Radeon HD 5970

Давайте порадуемся — конкуренция на рынке дискретных ускорителей между фирмами AMD и Nvidia достигла своего апогея. Новые графические решения сыпятся со всех сторон, а по пути свежеиспеченные цены подкупают все больше пользователей.


 Не успела Nvidia анонсировать GeForce GTX 580 и разослать несколько пресс-релизов на тему «самый быстрый ускоритель», как вот вам ответное решение — Radeon HD 6970. И оно поспело как нельзя вовремя. По статистике системы Steam, почти три четверти реальных пользователей (всего более 30 млн) используют акселераторы поколения DirectX 10. А значит, в свете тотального нашествия игрушек под DirectX 11 грядет заметная волна модернизации компьютеров всех энтузиастов — AMD и Nvidia в предвкушении больших денег.

 Прошлый раз мы аплодировали плате GeForce GTX 580, теперь пришла очередь Radeon HD 6970. И можно только посочувствовать разработчикам обеих компаний, ведь их горячие новинки приходится делать в условиях застойного 40-нм техпроцесса.

 Так, инженеры AMD выполнили задачу по модернизации архитектуры Cypress, легшей в основу плат серии 5800. Новое ядро Cayman получилось производительнее, компактнее и энергоэкономнее. В результате ИТ-мир облетела обнадеживающая новость про ГПУ-архитектуру VLIW4 вместо VLIW5, лежащей в основе семейства Evergreen.

 

Как мы тестировали

 Все испытания проводились на основе тестового стенда следующей конфигурации: процессор AMD Phenom II X4 970, системная плата Gigabyte GA-880GA-UD3H, память Transcend TX2000KLU-4GK (DDR3, 1333 МГц, 4 Гбайт, 9-9-9-24, 2-каналь-ный режим), жесткий диск Western Digital Caviar Black WD1002FAEX (2 Гбайт, SATA 6 Гбит/с, кеш 64 Мбайт, 7200 об/мин), оптический привод Plextor DVDR PX-810SA, блок питания Tagan SuperRock TG880-U33II (880 Вт). Работа с тестовой платформой осуществлялась при подключенном мониторе Philips Brilliance 202P7 при графических разрешениях 1600 x 1200, 2048 x 1536, 1366 x 768 и 1920 x 1080.

 Программные тесты выполнялись под управлением ОС Windows 7 Ultimate 64 бит. Для работы с графической подсистемой использовались видеодрайверы ForceWare 64-bit вер- сии 262.99/263.09 и Catalyst 64-bit версии 8.79.6.2RC2/10.10. В качестве измерительного инструментария применялся сценарный тест SmartFPS.com версии 1.13 для автоматизированного определения производительности в игровых приложениях Aliens vs Predator (DirectX 11), DiRT 2 (DirectX 11), Crysis (DirectX 10), Serious Sam 2 (DirectX 9), Call of Juarez (DirectX 9), Unreal Tournament 3 (DirectX 9), Enemy Territory — QUAKE Wars (OpenGL), The Chronicles of Riddick (OpenGL). Также использовался тестовый пакет 3DMark 11 v1.0.

 Исследование 3D-производительности проводилось в режиме с включенными четырехкратным сглаживанием (AA:04) и 16-кратной анизотропной фильтрацией (AF:16). Все настройки качества визуализации контролировались с помощью глобальных установок в соответствующих видеодрайверах.

 

Солидный тюнинг

 Специалисты AMD серьезно переработали существующую шей-дерную архитектуру. Во-первых, увеличили число SIMD-кластеров до 24.

 Напомним, что в процессорах Radeon HD 5850 и Radeon HD 5870 содержится 18 и 20 активных SIMD engines, а в ГП 6850 и 5870 их число составляет 12 и 14 соответственно. Нарастили количество текстурных блоков до 96. Во-вторых, изменили структуру потоковых процессоров. Если раньше один такой блок состоял из пяти юнитов (Unit), отличающихся функциональными возможностями, то теперь в каждом потоковом блоке по четыре юнита, выполняющих все типы операций. Такое преобразование, по заверениям AMD, позволило уменьшить число транзисторов, сократить площадь кристалла на 10% и при этом сохранить эффективность в плане производительности.

 Уверены, довольно скоро инженеры AMD вернут размеры графического кристалла в прежние рамки за счет «лишних» юнитов, приумножающих показатели вычислительной  мощности. Ждем решения AMD-ATI Radeon HD 6980.

 По пути отметим некоторые улучшения в так называемых бэкендах (Back-Ends) блоков растеризации, занимающихся записью пикселей в буфер кадра. Проведенная оптимизация скажется при включении антиалиасинга и тяжелых режимов HDR (High Dynamic Range — визуализация в широком динамическом диапазоне). Помнится, еще четыре года назад (до пришествия парочки GeForce 8800GTX и GeForce 8800GTS) возможность одновременной работы разных методов сглаживания и технологии HDR была присуща лишь решениям ATI.

 Сегодняшние пользователи стали еще привередливее: помимо связки AA+HDR, они ждут особой эффективности в работе с вычислениями над числами с плавающей точкой в 32-битном формате. И в этом плане Radeon HD 6970 мало кого разочарует.

 Если заниматься обсчетом игровых кадров, то основной поток данных, состоящий главным образом из текстур и вершин, посылается в одном курсе — от центрального процессора к графическому. Но если сосредоточиться на других прикладных задачах, то информационный поток будет идти во всех направлениях. И тут ядро Cayman радует вторым дополнительным блоком DMA с прямым доступом к памяти. Независимо от основного, DMA-engine 2 может слать данные в обратную сторону по линиям PCI Express. Разумеется, это увеличивает эффективность вычислений с двойной точностью и выводит на новый уровень показатели DP (double precision) для плат серии 6900.

 Теперь несколько слов о самом важном, что есть в DirectX 11, то есть о тесселяции. Это было слабым местом в архитектуре Cypress, но с выходом плат серий 6800 и 6900 проблема исчезла. Инженеры AMD-ATI удвоили число внутренних блоков, связанных с технологией тесселяции (т.н. рас-теризаторов и тесселяторов). В результате в синтетических тестах, где фактор тесселяции соответствует девяти, производительность AMD Radeon HD 6970 выросла втрое по сравнению с AMD Radeon HD 5870. В реальных играх вроде Metro 2033, Aliens vs Predator и Lost Planet 2 показатели прогресса новинки гораздо скромнее — всего +30%.

 Отметим, что в дополнение к новому режиму сглаживания Morphological AA, появившемуся с платами серии 6800, возник еще один режим антиалиасинга — Enhanced Quality AA. При обычном антиалиасинге в буфере кадра хранится большое число семплов (например, 4 для AA:4х или 8 для AA:8х), что ведет к загрузке видеопамяти и увеличению объемов передачи данных из памяти и обратно. На практике большинство информации теряется, ведь весь набор сопикселей сжимается до одного. Вся избыточная нагрузка нужна лишь для того, чтобы понять, какую часть пикселя перекрывает определенная текстура. Так вот, при включении Enhanced Quality AA в буфере хранится вдвое меньше семплов для каждой точки, но при этом учитывается, попадает ли текстура на оставшиеся субпиксели. Получается удивительная зарисовка, когда при включении Enhanced Quality AA 4х качество игровой картинки доходит до Multi Sampling AA 8x, а производительность остается на обычном уровне AA:4х.

 Более того, поверх EQAA можно включить Morphological AA, напоминающий работу сглаживающих фильтров из программ Adobe Photoshop и Corel Photo-Paint над кадром из фреймбуфера. Когда не имеет никакого значения, где лежит пиксель — на краю треугольника или внутри текстуры, —

идет дополнительный проход по конкретной картинке и все «лестницы» сглаживаются автоматически. Что получится в визуальном плане, судить придется пользователям со своими предпочтениями, но вот падение производительности можно гарантировать всем. Поэтому экспериментируйте на игровых хитах прошлых лет, например Serious Sam 2 или The Chronicles of Riddick.

 

Питаемся правильно

 В процессе проектирования нового ядра полет инженерной мысли ограничен предельным уровнем энергопотребления. Приходится экспериментировать с рабочими частотами кристалла и памяти для того, чтобы удержаться в заданных рамках. При этом максимальные нагрузки умеют создавать лишь синтетические приложения, далекие от реальных игр (например, Furmark). И вот какую технологию придумали в AMD, дабы выжать из ускорителей максимум производительности (за счет частотных характеристик) и не потерять в надежности.

 По разным областям графического ядра Cayman разбросаны сотни специальных сенсеров, следящих за состоянием чипа. По сути, они проверяют, включен ли тот или иной набор транзисторов в логике кристалла. Вся полученная информация анализируется внутри интегрированного контроллера, оценивающего уровень текущего энергопотребления. Если в оценке загрузки ГП обнаруживаются недопустимые значения, то рабочие частоты кристалла снижаются — между тактами появляются пустоты. Это позволяет удержаться в пределах TDP (Thermal Design Power — метрика тепловой мощности), а заодно охладить процессор.

 Представленная технология носит имя AMD PowerTune — полностью аппаратная, от работы драйверов не зависит. Понять, на какой частоте работает кристалл в данный момент времени, не представляется возможным. Однако мало что в будущем сможет помешать программистам AMD добавить частотную вкладку в панель Catalyst Control Center или сделать соответствующую утилиту.

 Отметим, в актуальной версии CCC в окне AMD Overdrive появился ползунок Power Control settings. Он позволяет сдвигать границу срабатывания инновации AMD PowerTune в пределах 20% как в одну, так и в другую сторону. Так, смещение тротлинга в позицию «-10%» в тестовой игре Aliens vs Predator не сказывается на играбельности показателей кадров в секунду, зато дает заметное снижение энергопотребления всего ПК. Более того, по данным испытаний AMD, холостой режим работы ГП включается крайне редко. Пока в настройках по умолчанию добиться тротлинга удается для плат AMD Radeon HD 6950 в тестовом сценарии 3DMark Vantage: Perlin Noise. При этом временное снижение тактовых частот мало сказывается на итоговой производительности.

 Кстати, технология AMD PowerTune может ускорить появления двойного Cayman, ведь основная проблема будущей платы Radeon HD 6990 будет заключаться в планке TDP.

 

Право на ошибку

 В продолжение разговора про технологию AMD PowerTune надо указать, что основные настройки срабатывания задаются в BIOS-прошивке платы. Там же можно задать рабочие частоты для кристалла и памяти. Дерзайте и не переживайте за печальный исход, когда ваши желания превзойдут возможности ускорителя.

 На эталонных платах AMD Radeon HD 6970 и AMD Radeon HD 6950 есть две области хранения BIOS и соответствующий переключатель (рядом с контактной площадкой CrossFireX). В стандартном положении «1» можно модифицировать подпрограмму BIOS как угодно. Получите черный экран — перейдите в неубиваемый режим «2» и загрузитесь с фабричными установками. На наш взгляд, функцию Dual BIOS оценят все любители разгона и не только они.

 

 

Куда целим?

 Давайте похвалим маркетологов компании AMD за неожиданную скромность. В рыночном позиционировании AMD Radeon HD 6970 (рекомендованная цена 369 долл.) поставили ниже конкурирующего решения Nvidia GeForce GTX 580, а Radeon HD 6950 (рекомендованная цена 299 долл.) опустили за спину GeForce GTX 570.

 Однако в AMD работают специалисты с изрядным чувством юмора. Знаете, какая плата на самом верху маркетинговой елки из продуктов класса hiend? Тут находится довольно устаревшее двухпроцессорное решение AMD Radeon HD 5970 с рекомендованной ценой в 499 долл. Именно эта одиночная плата зафиксировала мировой рекорд производительности в тесте 3DMark Vantage на уровне отметки x14240. И столь знаменательное событие произошло всего за пару недель до официального анонса видеоплаты AMD Radeon HD 6970, то есть 1 декабря.

 Очевидно, что компания AMD остается приверженной своей устоявшейся философии, когда для ультрапроизводительных решений создаются двухпроцессорные карты. И если в момент появления акселератора AMD Radeon HD 6990 на основе парочки «кайманов» у компании Nvidia будут пустые рукава, мы увидим «избиение младенца». А пока чуда не произошло и GeForce GTX 580 выглядит более желанным.

 Что касается технических характеристик при сравнении Radeon HD 6970 и Radeon HD 5870, мы видим прыжок вперед лишь в вычислительной мощности на операциях с двойной точностью — 675 Гфлопс. В большой плюс запишем и 2 Гбайт видеопамяти GDDR5, которые особенно необходимы при построении мультидисплейной технологии Eyefinity или при работе в режиме CrossFireX. Есть позитивные подвижки по частотам ядра и числу текстурных блоков.

 

 

Что показали тесты

 Во всех хитах под OpenGL, в самых разных разрешениях ускоритель GeForce GTX 580 обходит и Radeon HD 6970, и Radeon HD 5970 — тут проигрыш AMD-ATI стал традиционным. В DX9-игре Call of Juarez сложилась довольно любопытная картина, когда Radeon HD 6970 заметно проигрывает GeForce GTX 580, но при этом древний Radeon HD 5970 идет с Nvidia ноздря в ноздрю. Меняем местами HD 6970 и HD 5970 в результатах к DX9-тесту Serious Sam 2 — двухпроцессорное решение в проигрыше, а вот Cayman выступает против GeForce GTX 580 на равных.

 Отдельным абзацем остановимся на играх под DirectX 11. И в Aliens vs Predator, и в DiRT 2 чувствуем схожую производительность между Radeon HD 6970 и GeForce GTX 580, но Nvidia чуть лучше. При этом похлопаем старичку Radeon HD 5970 — он бьет и своих, и чужих. А от фантазий на тему «что будет с выходом двухпроцессорного AMD Radeon HD 6990» захватывает дух.

 Итак, мы уже знаем, что крупные кристаллы дороги в производстве. К тому же вырастает вероятность попадания в отбраковку. Решив все вопросы в свою пользу, инженерам компании AMD удалось выжать максимум из прежних наработок и предложить еще большую производительность по цене, доступной большинству энтузиастов. Подождем однопроцессорный AMD Radeon HD 6980 — может, он сотворит чудо и превзойдет Nvidia GeForce GTX 580 по всем фронтам.


Назад в раздел

Текст сообщения*
Защита от автоматических сообщений

Читайте также