- Технічні характеристики відеокарт
- Конфігурація тестового стенда
- Продуктивність в тесселяции
- синтетичні тести
- Ігрові тести
- Температура, енергоспоживання і розгін
- висновки
Архітектура нового покоління графічних процесорів NVIDIA Fermi, розглянута нами в попередніх двох частинах огляду, безперечно, вражає своєю складністю і орієнтованістю на високопродуктивні обчислення. Тепер подивимося, як же вона веде себе в сучасних іграх.
Компанія NVIDIA надала нам зразок топової відеокарти GeForce GTX 480, яка на сьогоднішній день є старшою моделлю серед заснованих на GPU GF100. Що цікаво, навіть цей флагманський акселератор базується не на повнофункціональному ядрі з 512 потокових процесорів, а на урізаною до 480 SP модифікації. Очевидно, зроблено це для того, щоб укластися в заявлений TDP 250 Вт, прийнятні температурні режими і забезпечити більш-менш широку доступність.
Справа в тому, що ядро GF100 містить 3,2 млрд транзисторів і займає площу 529 мм 2, для техпроцесу 40 нм виготовлення подібного чіпа без вад - завдання не з легких. Для порівняння, флагманська модифікації AMD Evergreen - GPU Cypress, що встановлюються на Radeon HD 58xx (складаються з 2,1 млрд транзисторів і займають 334 мм 2) - в півтора рази менше. При цьому AMD початку налагодження 40-нм техпроцесу на потужностях TSMC на півроку раніше NVIDIA і все одно зазнає труднощів з виходом придатних кристалів, що формують дефіцит на топові модифікації відеокарт. Що вже говорити про ситуацію, коли потрібно виростити в півтора рази більший кристал, а потім ще й змусити його працювати на частоті 700 МГц без проблем ... Тому NVIDIA пішла на відключення одного з потокових мультипроцессоров, а повноцінний варіант Fermi поки що буде встановлюватися тільки в прискорювачі Tesla. Можливо, з часом буде випущена і прискорена ігрова відеокарта, в якій будуть активні всі 512 процесорів. До речі, згадавши Tesla, варто зауважити цікаве рішення NVIDIA по штучному «стимулювання» розробників, що орієнтуються на серйозні наукові та комерційні проекти, до придбання професійних прискорювачів: в ігровій модифікації Fermi - GeForce GTX 400 - продуктивність в обчисленнях з подвійною точністю штучно обмежена на 1 / 8 від продуктивності в одинарної точності, в той час як засновані на GF100 Tesla такого обмеження не матимуть.
Отже, на сьогоднішній день сімейство GeForce GTX 400 складається з двох відеокарт, GeForce GTX 480 і GTX 470. Старша, яку ми сьогодні протестуємо, заснована на GPU з 480 SP, 60 текстурними блоками, 15 PolyMorph Engine, 48 ROP і 768 КБ кеша ( останні два параметри відповідають максимальній конфігурації GF100). Пристрій оснащується 1536 МБ пам'яті GDDR5, що працює на частоті 3696 МГц QDR і спілкується з ядром за допомогою шести шин по 64 біта, що сумарно становить ширину 384 біт. Ядро (точніше, контролери пам'яті і ROP) працює на частоті 700 МГц, а SM з текстурними блоками, PolyMorph Engine і кешем - на подвоєною частоті 1,4 ГГц. Що цікаво, в графічних процесорах минулого покоління співвідношення між растровим і шейдерних доменом встановлювалося певним для кожного GPU коефіцієнтом, і ними можна було керувати окремо. У Fermi основними блоками є мультипроцесори, і управління частотою доступно тільки для них, а для растрового домену вона просто ділиться навпіл.
Оскільки відеокарта, виходячи з технічних характеристик, споживає 250 Вт, для її харчування потрібне підключення двох роз'ємів, одного восьми- і одного шестиконтактного. NVIDIA приділила велику увагу системі охолодження: GeForce GTX 480 оснащується досить складним кольором, що складається з декількох частин: пластини, що покриває чіпи пам'яті і друковану плату, масивного хромованого радіатора з 5 тепловими трубками з конструкцією direct contact (трубки безпосередньо контактують з кришкою GPU) і турбіни , продуває всю цю систему. Гаряче повітря виводиться назовні корпуса, окрім того, невелику лепту в ефективність охолодження вносить і металева зовнішня сторона радіатора, яка не закривається пластиковим кожухом, як раніше. Довжина плати становить 10,5 дюйма (26,7 см), роз'єми живлення орієнтовані вгору, кулер займає сусідній роз'єм на платі. Таким чином, GeForce GTX 480 складно назвати компактною відкритий, однак в більшість повнорозмірних корпусів ATX вона все ж поміститься і не буде впиратися в дискову кошик.
За виведення зображення відповідають два роз'єми Dual Link DVI і один mini-HDMI. За словами представника NVIDIA, останній був обраний, оскільки DisplayPort поки не надто популярний, на відміну від HDMI, а для повнорозмірного роз'єму місця просто не залишилося. Питання лише в тому, чи не виявиться ситуація з перехідниками з mini-HDMI на звичайний HDMI ще гірше, ніж з DisplayPort.
Молодша модель Fermi - GeForce GTX 470 - оснащується ще більш обмеженим ядром. У ньому відключені два мультипроцессора і один блок растеризації. В результаті конфігурація виглядає наступним чином: 448 SP, 56 текстурних блоків, 14 PolyMorph Engine, 40 ROP, 5 каналів пам'яті загальною шириною 320 біт, 620 КБ кешу. Ядро працює на частоті 607 МГц, шейдерний домен - на 1215 МГц. Відеокарта оснащується 1280 Мб пам'яті GDDR5 з частотою 3348 МГц. TDP цього пристрою становить 215 Вт, що дозволило обмежитися лише двома шестиконтактних роз'ємами живлення. Як і в старшій моделі, кулер на GeForce GTX 470 займає два слота, проте виглядає набагато більш схожим на ті, що зустрічалися на відкритих минулих серій СО.
Приступимо до тестування. Оскільки в огляді використовувалися тільки відеокарти вищого класу, режими роботи тестових програм вибиралися відповідно: у всіх іграх настройки виставлялися на максимум, повноекранне згладжування і анізотропна фільтрація встановлювалися в режими 8x MSAA і 16x AF.
Технічні характеристики відеокарт
МодельATI Radeon HD 5870NVIDIA GeForce GTX 285NVIDIA GeForce GTX 295NVIDIA GeForce GTX 480ЯдроCypress XT GT200b 2xGT200b GF100 Кількість транзисторів, млн 2154 1400 2 × 1400 3200 Площа ядра, мм 2 334 470 2 × 470 529 Техпроцесс, нм 40 55 55 40 Кількість потокових процесорів 1600 (320 × 5) 240 2 × 240 480 Кількість текстурних блоків 80 80 2 × 80 60 Кількість ROP 32 32 2 × 28 48 Частота GPU *, МГц 850 648 (1476) 576 (1242) 700 (1401) Шина пам'яті, біт 256 512 2 × 448 384 Тип пам'яті, обсяг, МБ 1024, GDDR5 1024, GDDR3 2 × 896, GDDR3 1536, GDDR5 Частота пам'яті, МГц 4800 2484 1998 3696 TDP, Вт 188 204 289 250 Підтримувані API DirectX 11, OpenGL 4.0, OpenCL 1.0 DirectX 10, OpenGL 3.2 DirectX 10, OpenGL 3.2 DirectX 11, OpenGL 4.0, OpenCL 1.0 Орієнтовна вартість $ 425 $ 375 $ 525 $ 499
Конфігурація тестового стенда
КатегоріяМодельНаданоПроцесорIntel Core i7 965 Extreme Edition 3,8 ГГц Представництво Intel в Україні, www.intel.ua Материнська плата ASUS P6T Deluxe / WiFi AP Представництво ASUS в Україні, www.asus.ua Оперативна пам'ять Kingston KHX1600C9D3K3 / 3GX 3 × 1 ГБ DDR3-1600 Представництво Kingston в Україні, www.kingston.com Жорсткий диск Kingston SSDNow V + SNVP325-S2 / 128 GB AHCI Відкрите NVIDIA GeForce GTX 480 NVIDIA, www.nvidia.com Sapphire Radeon HD 5870 Vapor-X Sapphire, www. sapphiretech.de Zotac GeForce GTX 285 Zotac, www.zotac.com inno3D GeForce GTX 295 Блок живлення Seasonic S12D-850 потужність 850 Вт "Синтекс", (044) 593-02-01 Монітор LG W3000H Представництво LG в Україні, ua.lge. com Програмне забезпечення Microsoft Windows 7 Ultimat e 64-bit, NVIDIA ForceWare 197.17 / 197.13, ATI Catalyst 10.3
Продуктивність в тесселяции
Обчислювальні можливості NVIDIA Fermi в одній з ключових функцій DirectX 11 вражають: тестовий пакет Unigine Heaven 2.0 в режимі тесселяции Extreme демонструє дворазову перевагу нової архітектури перед минулим фаворитом - Radeon HD 5870. Також цікаво, що падіння продуктивності при переході з режиму High на Extreme у Fermi досить невелика, чого не скажеш про Evergreen. Очевидно, чималу роль в цьому відіграє наявність ємного кеша в мультипроцесорах, радикально знижує кількість звернень в DRAM. Єдине «але» - хоч Heaven і базується на реальному ігровому движку, який Unigine продає розробникам, до справжніх ігор він не має практично ніякого відношення: готових продуктів на його основі не існує, а навантаження в бенчмарке чисто синтетична. Сучасні ігри поступово починають використовувати тесселяцию (вона реалізована в STALKER: Call of Pripyat, Colin McRae Dirt2, Metro 2033), проте в дуже невеликих кількостях для легкого поліпшення вигляду персонажів, землі і т. П. Природно, з плином часу вона стане все більш і більш популярною і складною, однак на сьогоднішній день дворазову перевагу NVIDIA Fermi перед ATI Evergreen в тесселяции на практиці буде практично непомітно.
синтетичні тести
Тестові пакети Futuremark 3DMark06 і 3DMark Vantage використовують API DirectX 9 і 10 відповідно, тому ніякого впливу додаткових можливостей Fermi по тесселяции надавати не повинні. Так і відбувається: в обох тестових пакетах перевага перед топової відеокартою ATI досить невелика і складає лише близько 10% для DirectX 10 і всього 2% для 3DMark06 і, відповідно, DirectX 9. При цьому перевагу над флагманської одночіповою моделлю на базі ядра GT200, безперечно , величезна: GeForce GTX 285 відстає від новачка на 30-40%, і конкуренцію Fermi може скласти тільки GeForce GTX 295, що оснащується двома GPU. При цьому варто враховувати, що не всі ігри будуть так само добре сприймати масив SLI, який являє собою ця відеокарта, і масштабироваться, як 3DMark.
Ігрові тести
У наш тестовий пакет входять як новітні ігри, що використовують DirectX 11, так і більш старі з DirectX 10. Відзначимо, що свіжий продукт українських розробників - Metro 2033 - був запланований як одне з тестових додатків, однак в процесі дослідження з'ясувалося, що він не дозволяє адекватно порівнювати відеокарти ATI і NVIDIA, принаймні з використанням FRAPS. По-перше, Radeon HD 5870 показує аномально низькі результати з застосуванням повноекранного згладжування (близькі до нуля), що говорить про некоректну роботу драйвера або движка гри. По-друге, Metro 2033 досить активно використовує PhysX і CUDA для обробки деяких ефектів, зокрема, тіней, перспективи (Depth of Field), освітлення і т.д. Таким чином, виходять просто нерівні умови для Radeon і GeForce, хоча, безперечно, з точки зору гравця це не має значення, тим більше що на GeForce GTX 480 Metro 2033 виглядає помітно ефектніше. 4A Games готує до виходу утиліту для тестування в Metro 2033, і коли вона вийде, ми ще раз все перевіримо, можливо, ситуація і виправиться.
Перейдемо до тестів. Перш за все розглянемо результати в додатках, заснованих на DirectX 10. Цікаві показники демонструє Unreal Tournament 3: в режимі максимальної якості перевага GeForce GTX 480 перед Radeon HD 5870 становить 8-14%, знижуючись з ростом дозволу, проте лідером несподівано виявляється GeForce GTX 295. очевидно, дається взнаки більш висока пропускна здатність пам'яті (2 × 111,9 ГБ / с проти 177,4 ГБ / с у Fermi).
Tom Clancy's HAWX також показує, що новий флагман NVIDIA випереджає суперника зі стану ATI, проте не настільки, наскільки хотілося б: розрив становить від 17% до 7% в здатністю 2560 × 1600. GeForce минулих поколінь тут в явних аутсайдерах, оскільки, крім усього іншого, HAWX використовує деякі ефекти DirectX 10.1, які при емуляції в DirectX 10 вимагають великих витрат.
На тлі інших тестів осібно стоїть Far Cry 2, що демонструє, як багато в підсумковому швидкодії значить оптимізація ПО. Ця гра розроблялася в рамках програми NVIDIA The Way It's Meant To Be Played, і не дивно, що на GeForce вона працює швидше, але в даному випадку «швидше» - невдале слово: Fermi випереджає ATI Evergreen на 48-54%! Як шкода, що це одиничний випадок ...
І STALKER: Поклик Прип'яті, і Colin McRae Dirt2 використовують тесселяцию для обробки грунту, персонажів (автомобілів) і деяких інших об'єктів, однак ефекту, подібного спостережуваному в Unigine Heaven, немає: GeForce GTX 480 працює швидше Radeon HD 5870 на 15-20% просто завдяки більш швидкій архітектурі і більшого обсягу пам'яті. У зв'язку з цим варто згадати, що ATI планує випустити модифікацію Radeon HD 5870 з 2 ГБ пам'яті, що повинно благотворно позначитися на продуктивності при надвисоких дозволах. Цікаво, якою буде розстановка сил між GeForce GTX 480 і цією відеокартою?
Результати нової гри Just Cause 2, також розробленої в рамках програми NVIDIA TWIMTBP, показують два аспекти сучасної ситуації з ігровими движками на PC, сформованої протистоянням двох вендорів. З одного боку, завдяки розширеному використанню PhysX і CUDA на GeForce GTX 480 гра виглядає абсолютно по-іншому (наприклад, ефект боке для віддалених джерел світла замість звичайного розмиття всього «задника» сильно впливає на якість картинки). З іншого боку, додаткові ефекти приносять і додаткове навантаження на GPU, і продуктивність помітно знижується. В результаті Radeon HD 5870 демонструють значно вищі результати, однак без безпосереднього порівняння двох відеокарт адекватно оцінити їх неможливо, все ж граємо ми не заради лічильника FPS, а заради задоволення, в якому візуальна складова - далеко не другорядний фактор. Для порівняння ми привели два однакових кадру з тестового сценарію, відтвореного на максимальних налаштуваннях на обох графічних архітектур.
Температура, енергоспоживання і розгін
Величезний GPU і 1.5 ГБ пам'яті GDDR5, природно, не могли не позначитися на енергоспоживанні і тепловиділення. Система охолодження, встановлена на GeForce GTX 480, цілком справляється зі своїми обов'язками і утримує температуру в безпечних межах в будь-якому режимі роботи, проте нагрівається відеокарта все ж дуже сильно. Так, під час стрес-тесту в OCCT графічний процесор спочатку прогрілося до 96оС, а потім турбіна підвищила частоту обертання до 80% і знизила температуру до 94оС, і на цій позначці вона і зафіксувалася. Форсування вентилятора до 100% швидкості знижує режим роботи GPU до 82оС, однак шум, видаваний СО при цьому, просто нестерпний. У просте графічний процесор також холодним не назвеш: 55оС - досить велике значення, особливо з урахуванням того, що частоти в 2D знижуються майже в 5 разів. Питання робочої температури насправді досить цікавий: ядро GF100 має безпечний поріг до 105оС, тому за його збереження турбуватися не варто, однак високий нагрів знижує надійність багатьох інших компонентів плати, до того ж виділяється відеокартою тепло буде частково гріти і інші компоненти ПК. Варто також враховувати, що наш стенд - відкритий, а в закритому корпусі ситуація посилиться. NVIDIA навіть окремо вимагає від користувачів, що встановлюють дві і більше Fermi в масив SLI, забезпечувати примусове обдування потужними вентиляторами.
Що стосується енергоспоживання, то і тут у Fermi все не дуже добре: в спокої наш тестовий стенд споживав від розетки 192 Вт, а при повному завантаженні відеокарти в OCCT - цілих 491 Вт! Перевершити цей показник вдалося тільки GeForce GTX 295 (202 і 508 Вт відповідно), а ось безпосередній конкурент від ATI - Radeon HD 5870 - виявився набагато економічніше, з ним стенд споживає 156 Вт в спокої і 339 Вт під навантаженням. Скажімо прямо, GeForce GTX 480 - сама «ненажерлива» одночіпова відеокарта з бачених нами.
На подив непоганим виявився розгінний потенціал нашого зразка. Якщо від пам'яті можна було очікувати значного запасу міцності, оскільки на референсних частотах відеокарти вона працює набагато повільніше номінальних, то GPU показав, що «простір для маневру» є і там. При повній швидкості кулера ми змогли досягти стабільної роботи на частоті 810 (1620) МГц для ядра і 2550 (5100) МГц для пам'яті, що відповідно дорівнює 16% і 38% приросту. В першу чергу велике значення матиме розгін пам'яті на високій роздільній здатності, оскільки саме вона стає пляшковим горлечком при обміні величезними обсягами даних в такому режимі.
висновки
NVIDIA Fermi залишає суперечливе враження. З одного боку, нова графічна архітектура значно випереджає минуле покоління продуктів компанії і знову виводить її на перше місце. GeForce GTX 480 - дійсно найшвидша одночіпова відеокарта з існуючих. Можливості, закладені в чіп GF100, значно перевищують можливості відеокарт конкурента. З іншого боку, на сьогоднішній день просто не існує прикладного ПО, яке б могло повністю розкрити потенціал Fermi, оскільки навіть найсучасніші гри не задіють високопродуктивні блоки тесселяции і інші особливості цієї архітектури в повній мірі. Звичайно, в майбутньому почнуть з'являтися і гри, і програмні продукти на основі CUDA і OpenCL, в яких завдяки більш потужної архітектурі GeForce GTX 480 значно вирветься вперед в порівнянні з Radeon HD 5870, однак поки їх немає, а існуючі демонструють відрив всього в 10 15%. З огляду на, що рекомендована вартість новинки NVIDIA становить $ 499, а в українському роздробі вона напевно досягне $ 600, суперництво з флагманом ATI, цінники на який на сьогоднішній день знаходяться на рівні $ 400-450, виявляється явно нерівним. До того ж значним «обтяжуючою обставиною» є висока гучність і високе енергоспоживання і тепловиділення Fermi, що пред'являють додаткові вимоги до корпусу і блоку живлення. Звичайно, кілька скрашує ситуацію додаткова функціональність нових відеокарт - значний приріст продуктивності в CUDA (і поступове розширення асортименту ПО з використанням цієї платформи), підтримка технологій 3D Vision і PhysX, для яких у ATI поки немає конкурента. Однак, на нашу думку, гідності ці вторинні і не виправдовують основних недоліків - невідповідного ціннику приросту продуктивності в сучасних іграх, жахливого теплового режиму при роботі і шумності. Практично всі основні «мінуси», втім, можуть бути виправлені: великі вендори напевно будуть випускати моделі з більш тихими і потужними кулерами, а поступова налагодження техпроцесу і вихід нових ревізій GPU можуть допомогти NVIDIA знизити собівартість і, отже, роздрібну ціну GeForce GTX 480. А там, может быть, и ПО подоспеет…
Ще раз підкреслимо: архітектура NVIDIA Fermi вийшла не поганий, а навпаки, відмінною і перспективною. Проблема лише в тому, що вона випереджає свій час. Говорячи аналогіями, перед нами Ferrari Enzo на вулицях Києва: красиво, дорого, потужно, ось тільки їздити ніде.
Цікаво, якою буде розстановка сил між GeForce GTX 480 і цією відеокартою?