Hard

29.06.2011 Автор: Иван Савватеев Версия для печати

Топовые однопроцессорные видеокарты

Хотя основной доход разработчикам графических процессоров приносят решения среднего уровня, наиболее престижными, безусловно, являются топовые модели. Уже долгий срок (как минимум с 2006 г., когда появились G80, первый процессор, поддерживающий DirectX 10, и основанная на нем видеоплата GeForce 8800 GTX) безусловным лидером среди одночиповых решений является компания Nvidia, хотя на рубеже 2009–2010 гг. при переходе к DirectX 11 она на несколько месяцев припозднилась, оставив AMD Radeon HD 58xx без конкуренции. Выход GeForce GTX 470/480, однако, вернул соперников на прежние позиции. Посмотрим, где они пребывают сейчас, ведь за несколько последних месяцев оба конкурента обновили свои графические архитектуры, выпустив платы GeForce GTX 570/580 на процессоре GF110 и Radeon HD 6950/6970 на кристалле Cayman.


 Nvidia менее чем через год после официального выпуска GF100, первого процессора, основанного на новой архитектуре Fermi и послужившего основой видеоплат GeForce GTX 470/480, порадовала своих поклонников кристаллом GF110 и созданными на его базе платами GeForce GTX 570/580, о которых мы уже кратко писали. Существенных отличий от своего предка он не имеет: были внесены отдельные улучшения, связанные с текстурированием и отбрасыванием невидимых поверхностей, а также переработан дизайн кристалла, чтобы при в целом аналогичном внутреннем устройстве и неизменном количестве транзисторов (3 млрд) оптимизировать энергопотребление. Эти меры вкупе с уже отлаженным 40-нм технологическим процессом позволили поднять выход полностью годных кристаллов до приемлемого уровня, поэтому на плате GeForce GTX 580 активны все функциональные блоки процессора (у 570-й модели, как и у первенцев поколения DirectX 11 GeForce GTX 470/480, часть блоков отключена). Понятно, что даже при неизменной частоте новый графический процессор за счет увеличения количества работающих блоков, а также внесенных в них мелких улучшений будет быстрее своего предшественника GF100, однако оптимизация и «вылизывание» техпроцесса позволили поднять и частоту, причем весьма значительно — с 700 МГц (у GeForce GTX 480) до 772 (у GTX 580).

 У AMD положение сложнее. Эта компания уже несколько лет декларирует свой подход к созданию видеоплат высшего уровня, заключающийся в обязательном использовании на них нескольких (фактически — двух) графических процессоров. Однако подобное решение имеет не меньше отрицательных сторон, чем положительных. Так, хотя пиковая производительность у двухпроцессорной конфигурации оказывается выше (поэтому, например, в «голых» результатах тестов Radeon HD 4870X2 обычно обгоняла GeForce GTX 285, а Radeon HD 5970 — GeForce GTX 480), в реальных играх что Crossfire-, что SLI-решения страдают разного рода «тормозами», «лагами» и прочими неприятностями. Ведь частота кадров в худшем (и не таком уж редком на практике) случае определяется производительностью одного процессора, а второй часто работает вхолостую. Немало проблем доставляют и ошибки в драйверах: весьма нередкой является ситуация, когда игра совершенно нормально работает на однопроцессорной «видюхе», но начинает глючить на двухпроцессорной. Наконец, двухпроцессорный «монстр» имеет существенно большие габариты (Radeon HD 5970, например, поместится далеко не в каждый корпус ПК из-за своей длины) и потребляет больше энергии, поскольку на плате приходится размещать не только лишний процессор, но и удвоенное количество памяти, а также всякие вспомогательные схемы. Прекрасно понимая это, инженеры AMD постоянно стараются если не догнать конкурентов, то хотя бы сократить разрыв. Хорошей иллюстрацией этому стали новые платы Radeon HD 6970 и 6950, основанные на чипах с кодовым именем Cayman: количество транзисторов у них существенно возросло (с 2,15 млрд до 2,64 млрд), заметно приблизившись к таковому у конкурентов (3 млрд). Вызвано это, понятное дело, стремлением поднять скорость отдельно взятого процессора. На этот раз совершенствование не свелось к наращиванию «грубой силы» в виде количества исполнительных блоков, а выразилось в весьма существенных изменениях в архитектуре, которым мы посвятили отдельную врезку. Заметим лишь, что процессоры AMD сохранили за собой значительное преимущество в скорости текстурирования, заодно повысив вычислительную мощь и нарастив геометрическую производительность, в том числе в тесселяции — откровенно слабой стороне кристаллов RV870.

 Перед тем как приступить к тестированию, изучим попавшие к нам видеоплаты. С их основными характеристиками можно ознакомиться в таблице.

 Asus ENGTX570/2DI/1280MD5 является почти референсным образцом, отличаясь от него увеличенной на 10 МГц частотой процессора. Столь мизерная разница, конечно, не могла существенно повлиять на производительность, хотя прирост все же имеется. Система охлаждения — штатная, с одним вентилятором и прочным кожухом, обеспечивающим выброс воздуха за пределы корпуса ПК. В небольших корпусах, лишенных достаточно мощной приточно-вытяжной вентиляции, именно подобные системы охлаждения обычно являются оптимальными, хотя они и не позволяют охладить графический процессор так хорошо, как это делают навороченные вентиляторы. Видеовыходов три: два DVI и один HDMI. Питание подается сверху через два шестиконтактных гнезда.

 KFA2 GeForce GTX 560 EX OC Anarchy не успела к тестированию решений среднего класса, поэтому была использована нами в качестве образца для сравнения стоповыми моделями. От референсного дизайна она отличается системой охлаждения (два откидных вентилятора, которые легко чистить; к сожалению, их реальная эффективность может оказаться ниже, чем у эталонного образца Nvidia, поскольку воздух циркулирует лишь внутри корпуса ПК, а не выбрасывается наружу), а также незначительно (на 13 МГц) увеличенной рабочей частотой процессора. Кстати говоря, KFA2 предлагает еще один вариант на базе этого же графического процессора, причем сильно разогнанный, но уже с одиночным вентилятором, выбрасывающим воздух наружу. Наличествуют три видеовыхода (два DVI и HDMI), питание по двум шестиконтактным коннекторам подается сверху.

 MSI R6950 Twin Frozr, как часто бывает у продукции этой фирмы, отличается симпатичной, но на практике зачастую недостаточно эффективной системой охлаждения с двумя вентиляторами, поскольку потребуется обеспечить в закрытом корпусе ПК надежную принудительную вентиляцию воздуха, что имеет место далеко не всегда. Впрочем, если таковая все же обеспечена, подобные системы охлаждения на «видюхах» нередко оказываются способными создать более низкую температуру графического процессора по сравнению с менее привередливой к вентиляции в ПК эталонной системой от AMD или Nvidia. Видеовыходов у MSI R6950 Twin Frozr целых пять: по два DVI и DisplayPort и один HDMI. Питание подается по двум шестиконтактным коннекторам в верхней части, что исключает возникновение дополнительных проблем при сборке компьютера. По сравнению с эталонным образцом процессор на R6950 работает несколько быстрее, но разница настолько мала (10 МГц), что назвать это разгоном язык не поворачивается.

 Palit GTX 570 Sonic Platinum довольно сильно отличается от эталонного образца Nvidia как разводкой платы, так и системой охлаждения. Последняя, оборудованная двумя вентиляторами, весьма привлекательна и, что бывает довольно редко, неплохо работает даже в плохо вентилируемом корпусе (хотя есть ощущение, что в такой ситуации эталонная система охлаждения от Nvidia работает как минимум не хуже. Впрочем, провести полноценное сравнение мы не имели возможности). Число видеовыходов увеличено: помимо штатных (два DVI, один HDMI) добавился еще и DisplayPort. Система электропитания переработана, однако энергия по-прежнему подается сверху через шести- и восьмиконтактный разъемы. Благодаря приличному разгону эта плата лишь немного уступила топовой модели GeForce GTX 580.

 Point of View GTX 570 и 580 лишены каких-либо дизайнерских изысков: на самом деле эти платы и их системы охлаждения произведены самой Nvidia. Применительно к топовым «видюхам» это нередко является достоинством, а не недостатком. Во всяком случае большая часть горячего воздуха благополучно удаляется из корпуса ПК наружу без применения дополнительных вентиляторов. Видеовыходов три: два DVI и один HDMI. Питание по двум разъемам (6- и 8-контактному) подается сверху. GTX 580 работает на штатных частотах, а вот ее младшая сестра значительно разогнана и в результате уступает по производительности всего на пяток процентов.

 Sapphire Radeon HD 6970, по сути, является прошедшим в Sapphire «предпродажную подготовку» изделием AMD, без заметных отличий от референсного образца. Плата имеет пять видеовыходов — по паре DVI и DisplayPort, плюс один HDMI. Питание подается сверху через шести- и восьмиконтактный разъемы.

 Sapphire Radeon HD 6870 тоже использует референсный дизайн с жестким кожухом и выбросом воздуха наружу. Имеется пять видеовыходов: два DVI, один HDMI и два DisplayPort. Последние обеспечивают подключение нескольких мониторов к каждому. Два шестиконтактных разъема питания расположены сверху.

 VTX3D HD 6970 ничем, кроме внешнего оформления, не отличается от аналогичной платы Sapphire, что неудивительно: по сути, это одно и то же изделие. Естествен- но, все характеристики у них находятся на одном уровне.

 Тестирование мы проводили на нашем новом стенде, включающем системную плату Intel DP67BG, процессор Core i7-2600K (его охлаждение обеспечивает кулер Thermaltake Frio), пару модулей памяти Transcend по 2 Гбайт каждый (частота 1333 МГц, тайминги 9-9-9-24) и жесткий диск Western Digital WD1002FAEX. Использовались драйверы версий 266.66 (для платы KFA2 GeForce GTX 560 EX OC), 266.58 (остальные платы Nvidia) и 11.1 (для всех «видюх» AMD). Все графические настройки, кроме полноэкранного сглаживания, были установлены на максимум, антиалиасинг зафиксирован на уровне 4x. Полученные результаты приведены в таблице.

 Как видим, по голым цифрам самое мощное решение Nvidia — плата GeForce GTX 580. Примерно соответствует двухпроцессорному старичку AMD Radeon HD 5970, причем с ростом разрешения пальма первенства переходит именно к нему. Однако, если принять во внимание все недостатки, свойственные двухпроцессорным видеоплатам, а также их более высокую стоимость, однозначное предпочтение здесь следует отдать «джифорсу».

 Если сравнивать между собой различные платы Nvidia, то мы увидим, что производительность в линейке GeForce GTX580 — 570 — 560 снижается плавно, на 10–15%, цены же при этом снижаются быстрее (570-я в полтора раза дешевле, чем топовая модель, а GeForce GTX 560 Ti — и вовсе вдвое). Понятно, что по критерию «стоимость/эффективность» лучше выглядят модели среднего уровня, однако в современных играх их производительность может оказаться недостаточной, особенно на высоких разрешениях (например, в Metro 2033 при разрешении 1920 х 1080 точек хоть как-то играть можно лишь на GeForce GTX 580, способной выдавать около 25 кадр./с).

 Наиболее интересно, однако, сравнение конкурирующих решений. В общем зачете Radeon HD 6970 чуть-чуть уступает неразогнанной GeForce GTX 570, причем только на малых разрешениях, которые для таких мощных плат уже неактуальны. Отставание HD 6970 от одночипового лидера — GeForce GTX 580 — составляет примерно 15%. Следует, однако, учесть, что у 570-й разгонный потенциал существенно выше: штатная частота ее процессора составляет всего 732 МГц против 880 у Radeon HD 6970. Неудивительно, что на рынке представлены образцы с заводским разгоном до 800 МГц и даже больше (две такие платы — от Palit и Point of View — попали в наш обзор). В связи с этим средняя цена «радеона» (примерно такая же, как у GeForce GTX 570) кажется неоправданной. Впрочем, при выборе платы всегда надо обращать внимание на степень ее разгона. Вот Radeon HD 6950 стоит столько, сколько должен — как GeForce GTX 560. Но это уже решения среднего уровня, использованные нами для сравнения.

 В целом можно сказать, что выпуск нового графического процессора улучшил позиции AMD, но безусловное и весьма ощутимое лидерство в одночиповых решениях по-прежнему сохраняет (и, по всей вероятности, сохранит в обозримом будущем) Nvidia. Если наивысшая производительность не является абсолютным и безусловным критерием, то целесообразность покупки топовой видеоплаты с графическим процессором той или иной фирмы определяется в первую очередь ценой. На момент написания статьи таковая для плат Radeon HD 6970 представляется завышенной, из-за чего более разумной выглядит покупка GeForce GTX 570. Тем более что разогнанные варианты последней вплотную приближаются по скорости к существенно более дорогой GeForce GTX 580. Однако цены меняются очень быстро, так что, по всей вероятности, уже в ближайшее время они станут вполне адекватными.

 

 

Архитектура графических процессоров AMD Cayman

 Новые графические процессоры AMD были выпущены с опозданием в несколько месяцев. Вероятно, компания первоначально планировала использовать для них новую, 32-нм технологию. Однако отказ от ее внедрения на фабриках TSMC и неготовность еще более тонкого 28-нм техпроцесса заставили в итоге освоить выпуск существенно усложнившихся кристаллов (2,64 млрд транзисторов против 2,15 в RV870) по уже освоенной 40-нм технологии.

 На приведенной схеме нетрудно заметить, что архитектура «кайманов» довольно существенно отличается от Cypress. Наиболее заметное отличие — появление двух графических движков(Graphics Engine) вместо одного, имеющегося у процессоров AMD предыдущих архитектур. Каждый из этих движков включает в себя растеризатор, тесселятор и узлы, подготавливающие геометрические данные для последующей обработки в вычислительных блоках (SIMD Engines). Кроме того, раздвоился и диспетчер, отвечающий за выдачу инструкций вычислительным блокам. Эти меры позволили распараллелить графический конвейер и тем самым поднять реальную, а не теоретическую производительность процессора. Заметим, что Nvidia пошла по такому пути раньше: каждый из четырех кластеров обработки графики (GPC) процессора GF100 представляет собой, по сути, почти законченный процессор, работающий практически не- зависимо от других GPC.

 Одним из положительных моментов, связанных с распараллеливанием геометрической обработки, стал рост скорости тесселяции (на который, впрочем, повлияла и переработка самого тесселятора). По данным AMD, ее прирост у Cayman по сравнению с Cypress достигает трех раз — весьма внушительно, однако попрежнему недостаточно, чтобы тягаться с Nvidia на тяжелых задачах.

 Как и раньше, вычисления выполняются потоковыми процессорами, объединенными по 16 в каждом SIMD- ядре, коих у Cayman 24 штуки. В отличие от Cypress потоковые процессоры «ухудшились»: вместо одновременного выполнения пяти операций они способны выполнять лишь четыре (в связи с чем суперскалярная архитектура VLIW5 была переименована в VLIW4). В результате Cayman может выполнять до 1536 вычислительных операций одновременно, в то время как Cypress — 1600. На такое «ретроградство» инженеров AMD подвигли следующие соображения. Арифметикологические устройства (АЛУ), из которых со- стояли потоковые процессоры Cypress, существенно различались между собой. Причем одно из них было предназначено исключительно для выполнения сложных операций вроде вычисления синуса и значительную часть времени попросту стояло без дела: подобные инструкции встречаются не так уж и часто. Кроме того, планировщику команд было доста- точно трудно подобрать для одновременного выполнения несколько инструкций, ведь они при этом должны «укладываться» на разные АЛУ и не мешать друг другу. Таким образом, упрощение потокового процессора (сложные операции теперь выполняются благодаря совместной работе нескольких АЛУ, каждое из которых само по себе может выполнять простые операции) позволило увеличить его загрузку, снизив простои отдельных АЛУ, а также упростить работу по подбору одновременно выполняемых команд. По оценкам специалистов AMD, новая организация вычислительных блоков помогла поднять производительность примерно на 10% без увеличения количества транзисторов.

 Была улучшена также обработка вещественных чисел двойной точности (64 бит). В процессорах Cypress они обрабатывались в пять раз медленнее, чем 32-разрядные. Теперь скорость падает лишь вчетверо, благодаря чему пиковая производительность «каймана» поднялась с 544 до 675 Гфлопс (миллиардов операций с плавающей запятой в секунду).

 Улучшились и возможности по одновременному выполнению нескольких независимых потоков команд, причем каждый располагает собственной защищенной виртуальной памятью. По сути, новое поколение графических процессоров в этом плане все больше становится похожим на центральные процессоры, где, как известно, каждое ядро (или даже каждый логический процессор в ядре, как в случае с ЦП Intel с технологией HyperThreading) является отдельным процессором, работающим над своей задачей независимо от других процессоров. Подобные улучшения существенно упрощают организацию одновременного выполнения графическим процессором нескольких разных задач (например, подлинно параллельного расчета графики и «физики»).

 Помимо перечисленных крупных изменений в архитектуре, совершенствованию подверглись и другие узлы процессора. Блоки растровых операций (ROP), например, стали значительно быстрее работать с данными, представленными в продвинутых форматах, постепенно набирающих популярность. Можно отметить и улучшения в качестве рендеринга путем совершенствования алгоритмов сглаживания и фильтрации текстур. Часть из них носит программный характер, а посему доступна и на предыдущих графических ускорителях AMD. Однако есть и аппаратное новшество: в «кайманах» появился улучшенный метод полноэкранного сглаживания EQAA (Enhanced Quality Anti-Aliasing), являющийся в первом приближении аналогом «невидийного» CSAA (Coverage Sampling Anti-Aliasing), появившегося еще в графических процессорах G80 — первых, поддерживающих DirectX 10. По данным AMD, новый метод ценой незначительного уменьшения производительности (несколько процентов) обеспечит более высокое качество сглаживания, чем классический MSAA. Отметим, что EQAA включается в настройках драйвера через Catalyst Control Center.

 Графические процессоры все более сближаются с центральными и в плане управления энергопотреблением. В «кайманах» применяется технология PowerTune, позволяющая автоматически регулировать частоту и напряжение питания в зависимости от нагрузки и тепловыделения.


Назад в раздел

Текст сообщения*
Защита от автоматических сообщений

Читайте также