Порівнюємо архітектури Nvidia: Tesla vs Fermi vs Kepler

Дата публікації: 29

Дата публікації: 29.06.2012

З тих пір як гендиректор Nvidia розповів світові про стратегію випуску відеокарт мене часто цікавило одне питання ... З кожним новим поколінням відеокарт Nvidia кількість основних обчислювальних блоків (шейдеров, CUDA ядер) неухильно зростає. Дійшло до того, що в відеокарті останньої архітектури Nvidia KEPLER GTX 680 налічується аж +1536 CUDA ядер. А в старенькій, але бадьорою 8800 GT їх тільки 112. Та й частоти не ті. Так що ж - вона слабше в 15 разів? Як би не так!

Спробуємо розібратися, наскільки ж цінний одиничний блок CUDA різних архітектур Nvidia: Tesla, Fermi і Kepler.

Нова епоха в світі графіки почалася з цієї презентації ...

Нова епоха в світі графіки почалася з цієї презентації

Начальник Nvidia розжовує плани по зміні поколінь відеокарт

Підозри закрадалися досить давно. Ще з часів тестування 3D Mark 2006, де вбудований тест Pixel Shader показував не такі вже високі результати для нових відеокарт. Підозри посилилися, коли новий флагман GTX 680 маючи однакову кількість транзисторів ранок число шейдеров в порівнянні з GTX 580. Звідки б їм узятися ?? Висновок очевидний - їх довелося спростити, щоб потім помістити більше число.

Висновок очевидний - їх довелося спростити, щоб потім помістити більше число

Основні характеристики архітектур Tesla, Fermi і Kepler видно в таблиці. Зверніть увагу, що при зовсім незначному ускладненні схеми (3,5 млн. Транзисторів проти 3-х млн.) Графічний чіп GK104 примудрився отримати утроенное к-ть шейдеров в порівнянні з GF110.

- До архітектури TESLA можна віднести відомі і понині відеокарти: 8600 GT, 8800 GT / GTS / GTX, 9800 GT / GTX, GTX 260, GTX 280 і їх різні модифікації.
- До архітектури FERMI можна віднести повсюдні відеокарти: GTX 480, GTS 450, GT 430, GTX 580, GTX 560Ti і подібні. Іншими словами 4-я і 5-я серії GeForce.
- До архітектури KEPLER можна віднести новітні відеокарти: GTX 680, GTX 670, GTX 690, GT 640/630/620 (не у всіх випадках Kepler, тому що є підробки) .

Для початку порівняємо результати двох відеокарт, типових для Tesla і Fermi (9800 GT проти GTX 580). Тестування проводилося в 3D Mark 2006 Pixel Shader / Advsnced Vertex Shader.

Тестування проводилося в 3D Mark 2006 Pixel Shader / Advsnced Vertex Shader

Незважаючи на те, що у GTX 580 є 512 ядер CUDA проти 112 у конкурента, і що її частоти значно вище - ми не бачимо чотириразового відриву. Причому співвідношення зберігається не тільки в синтетичних тестах, але і в реальних іграх. З поправкою на частоту виходить, що шейдерниє блоки архітектури Fermi майже в 2 рази слабкіше старих шейдеров Tesla.

Щоб з'ясувати шейдерну потужність CUDA ядер покоління Fermi проти Kepler, порівняємо два однакових мобільних рішення на різні архітектури.

Популярна мобільна відеокарта NVIDIA GeForce GT 525M Fermi проти подібної NVIDIA GeForce GT 640M на Kepler .

Архітектура Fermi Kepler Ім'я GT 525M GT 640M CUDA ядер 96 384 Частота ШБ 675 МГц 625 МГц 3DMark Vantage P 2930 6430 3DMark 2011 P 743 1718 Шина, біт 128 128 Частота пам'яті 1800 МГц 1800 МГц

------------------------------
Як видно з таблиці, обидві відеокарти дуже схожі як за частотами чіп / пам'ять, так і по ширині шини. При цьому у новій GT 630M в ЧОТИРИ (!) Рази більше шейдерних блоків. А що ж зі швидкістю?

Тест 3DMark 2011 Performans настільки складний (особливо для слабких відеокарт, якими і є мобільні рішення), що підсумковий результат практично повністю впирається в шейдерну потужність. Але замість чотириразового переваги ми бачимо лише дворазове (якщо усереднити по двох тестів, а інакше ще менше).

Виходить, що при рівних частотах одиничний шейдерний блок архітектури Fermi майже вдвічі потужніша нових CUDA Kepler. Виробник компенсує це тільки більшими частотами і потрійним числом самих блоків.

ВИСНОВОК

Від однієї архітектури Nvidia до іншої питома потужність шейдерних блоків CUDA постійно знижується.

Співвідношення питомої потужності архітектур Tesla проти Fermi проти Kepler (дуже умовно) можна виразити формулою 4: 2: 1 або трохи слабкіше. Тобто з кожним наступним поколінням одиночний шейдер стає майже в два рази слабкіше.

Щоб перевірити справедливість твердження звернімося до чудесного архіву результатів відеокарт 3D itogi на ixbt.com. Тест CRYSIS WARHEAD, Cargo був проведений навіть на відкритих старих поколінь, але при цьому дуже навантажує шейдерниє блоки. Його і використовуємо. Три відеокарти: 9800 GT (112 CUDA), GTS 450 (192 CUDA), GT 640 (384 CUDA). Як бачимо - к-ть шейдеров співвідноситься як 1,125: 2: 4. Тобто продуктивність в іграх повинна бути приблизно однаковою, з невеликою перевагою 9800 GT.

Тобто продуктивність в іграх повинна бути приблизно однаковою, з невеликою перевагою 9800 GT

І справді - так і є! Всі відеокарти дають результат на рівні 11 fps +/-. 9800 GT очікувано попереду, незважаючи на найменше число шейдерних блоків, а GTS 450 трохи слабше через меншу частоти пам'яті.

Чому так? Можливо, це більш правильно з інженерної точки зору, адже завдяки збільшенню числа виконавчих блоків випереджаючими темпами підсумкова міць відеокарт Nvidia зростає. З іншого боку - впарювати якусь нову «супер відеокарту» GT 630, у якій рекламуються 192 шейдерних блоку, набагато простіше. І не страшно, що вона в два рази поступиться 8800 GT, якій скоро шість років. Продавати невдалому покупцеві великі циферки на коробочці набагато приємніше і вигідніше 🙂

PS Ще раз нагадаю, що співвідношення потужності обчислювальних блоків різної архітектури наведено лише приблизно і всі висновки досить умовні. Хоча б тому, що архітектура Tesla не підтримує DX11 і порівняти їх все в сучасних тестах не представляється можливим. Проте, факт спрощення CUDA ядер і зниження їх обчислювальної потужності в наявності.

Так що ж - вона слабше в 15 разів?
580. Звідки б їм узятися ?
А що ж зі швидкістю?
Чому так?

Новости

Порівнюємо архітектури Nvidia: Tesla vs Fermi vs Kepler