- Архітектура Turing і відеокарти
- Star Wars Demo "Reflections"
- Обчислення частково виконуються в хмарі
- GeForce RTX 2080 Ti, RTX 2080 і RTX 2070
- Ціни і доступність
- Програмне забезпечення теж вносить свій внесок
Майже всі подробиці нового покоління GeForce на основі архітектури Turing стали відомі в останні дні, але сьогодні NVIDIA офіційно представила нові відеокарти в рамках заходу Gaming Celebration. На початку презентації NVIDIA нагадувала кроки розробки за останні десятиліття - від двох пікселів, які з'єднує лінія, до сучасних графічних движків.
Засновник компанії Дженсен Хуанг особливо підкреслив трасування променів, яка стала одним з найбільш важливих кроків за останні роки. "Наріжний камінь" графічної технології дозволить підняти якість освітлення об'єктів на принципово інший рівень. Трасування променів дозволяє симулювати поведінку якомога більшої кількості променів на сцені. Відображення, розсіювання, поглинання світла, тінь, напівпрозорі матеріали - все це можна прорахувати методом трасування променів.
20 років тому для розрахунку картинки 512 x 512 пікселів за допомогою трасування променів потрібен був би суперкомп'ютер. Сьогодні для розрахунку трасування променів на всій сцені потрібні багато петафлоп продуктивності. І при збереженні нинішніх темпів пройде ще десять років розробки, перш ніж ми отримаємо таку обчислювальну потужність. Саме з цієї причини NVIDIA розробила RTX - програмний інтерфейс, що поєднує класичну растеризування і трасування променів.
NVIDIA називає RTX "гібридним рендерингом", що поєднує класичну растеризування для відображення об'єктів і глобальне освітлення - метод на основі різних алгоритмів, що дозволяє домогтися максимально реалістичною картинки.
Трасування променів дозволяє обчислювати тільки ті промені, які потрапляють в очі користувача. NVIDIA спирається на глибоке навчання і тренує драйвер і програмний інтерфейс, використовуючи дані в хмарі. Тому трасування променів вже може виконуватися на наявних сьогодні ресурсах.
Архітектура Turing і відеокарти
Тисячі інженерів витратили сотні людино-годин на розробку архітектуру Turing. NVIDIA говорить про десять людино-років. Якщо вірити NVIDIA, архітектура стала найбільшим технічним проривом після подання ядер CUDA, які ми називаємо сьогодні потокових процесорів.
Найбільш важливі технічні специфікації трасування променів можна сформулювати наступним чином:
- 14 TFLOPS (розрахунки з плаваючою комою)
- 14 TIPS (цілочисельні розрахунки)
- Ядра RT з продуктивністю 10 гігалучей в секунду (1080 Ti дає тільки 1,21 гігалучей / с)
Що характеризує обчислювальну продуктивність, на яку спирається NVIDIA. З графічними процесорами на архітектурі Pascal і Volta подібні розрахунки не представляються можливими. NVIDIA привела інформацію про розрахунок показаної раніше демонстрації "Зоряних воєн":
Star Wars Demo "Reflections"
Frametimes
мілісекунди
Менше - краще
З архітектурою Turing NVIDIA змінила поведінку GPU під час побудови і розрахунку кадру. Крім класичного затінення INT32 і FP32, використовуються обчислення трасування променів і DNN (Deep Neural Network). Для GeForce RTX 2080 Ti NVIDIA вказує комбіновану обчислювальну потужність 78 TRTX OPS (операцій тера-RTX), причому у NVIDIA Titan X число ми отримуємо всього 12 TRTX OPS.
NVIDIA напевно використовує різні диспетчери для різних розрахунків в межах GPU. Буде цікаво більш глибоко поглянути на архітектуру Turing, щоб знайти відповіді на деякі питання.
Другий компонент - тензорні ядра, теж відомі по архітектурі Volta. Вони також вносять свій внесок в трасування променів, оскільки висока продуктивність виконання запитів в мережу глибокого навчання допомагає в алгоритмах усунення шуму. Розрахунок декількох тисяч або навіть мільйонів світлових променів вимагає певного часу навіть на сучасному "залізі". І області, в яких розрахунок ще не проведений, представлені шумом. Оскільки рендер не знає, які об'єкти на сцені більш важливі, він розраховує промені в логічному порядку. Щоб зменшити час підготовки фінального зображення і швидше усунути шуми, алгоритм глибокого навчання виділяє важливі області кадру, розраховуючи їх в першу чергу.
Третій компонент - нові ядра RT. Вони відповідають за розрахунок перетину променів з трикутниками (Ray Triangle Intersection) і BVH (Bounding Volume Hierarchy). BVH є дерево, в якому розташовуються геометричні об'єкти. Дані алгоритми допомагають у визначенні перетинів / накладень і трасування променів. 576 ядер RT в архітектурі Turing забезпечують швидкість розрахунок до 10 гігалучей в секунду.
Обчислення частково виконуються в хмарі
Незважаючи на всі потокові процесори, тензорні ядра і ядра RT, NVIDIA поки не може виконати повні розрахунки трасування променів навіть на GPU Turing. Ми вже згадали усунення шуму за допомогою тензорних ядер, але тут необхідні хмарні ресурси Neural Graphics Framework. NVIDIA NGX звертається до мережі глибокого навчання для обробки зображень, а результат уже відсилається відеокарти.
Серед усього іншого NVIDIA говорить і про нові режимах згладжування. Замість TAA на вирішенні 4K тепер може використовуватися DLSS (Deep Learning Super Sampling). Для тренування мережі NVIDIA спирається на власні апаратні ресурси у вигляді серверів DGX на кількох сотнях або навіть тисячах Tesla V100. Запити в таку мережу виконуються на ігровому комп'ютері з відеокартою Turing, їх якраз обробляють тензорні ядра.
Але апаратне забезпечення нових відеокарт навряд чи буде користуватися попитом, якщо в найближчі тижні і місяці не вийдуть гри, що підтримують нові функції. Трасування променів в реальному часі буде підтримуватися в наступних іграх:
- Assetto Corsa Competizione
- Atomic Heart
- Battlefield V
- Control
- Enlisted
- Justice
- JX3
- MechWarrior 5: Mercenaries
- Metro Exodus
- ProjectDH
- Shadow of the Tomb Raider
Deep Learning Super Sampling буде підтримуватися в наступних іграх:
- Ark: Survival Evolved
- Atomic Heart
- Dauntless
- Final Fantasy XV
- Fractured Lands
- Hitman 2
- Islands of Nyne
- Justice
- JX3
- Mechwarrior 5: Mercenaries
- PlayerUnknown's Battlegrounds
- Remnant: From the Ashes
- Serious Sam 4: Planet Badass
- Shadow of the Tomb Raider
- The Forge Arena
- We Happy Few
GeForce RTX 2080 Ti, RTX 2080 і RTX 2070
Технічні специфікації GeForce RTX 2080 Ti, RTX 2080 і RTX 2070 Модель GeForce RTX 2080 Ti GeForce RTX 2080 GeForce RTX 2070 Ціна 1.259 євро 849 євро 639 євро технічні специфікації Архітектура Turing Turing Turing GPU TU102 TU104 TU104 Потокові процесори 4.352 2.944 2.304 Тактова частота GPU (базова ) 1.350 МГц 1.515 МГц 1.410 МГц Тактова частота GPU (Boost) 1.635 МГц 1.800 МГц 1.710 МГц RTX OPS 78 TRTX OPS 60 TRTX OPS 45 TRTX OPS Гігалучей / с 10 Глучей / с 8 Глучей / с 6 Глучей / с частота пам'яті 1.750 МГц 1.750 МГц 1.750 МГц Тип пам'яті GDDR6 GDDR6 GDDR6 Speichergröße 11 GB 8 GB 8 GB Speicherinterface 352 біт 256 біт 256 біт Пропускна здатність 616 Гбайт / с 448 Гбайт / с 448 Гбайт / с TDP 250 Вт 215 Вт 185 Вт Доп. харчування 2x 8-конт. 1x 8-конт. + 1x 6-конт. 1x 8-конт. + 1x 6-конт. SLI / NVLink NVLink 2-Way NVLink 2-Way NVLink 2-Way
GeForce RTX 2080 Ti в чомусь можна назвати моделлю Titan в лінійці GeForce RTX 20. GPU містить 4.352 потокових процесора, базова частота становить 1.350 МГц, в режимі Boost мінімальна планка збільшується до 1.635 МГц. 11 Гбайт пам'яті ідентичні GeForce GTX 1080 Ti, але NVIDIA використовує для лінійки GeForce RTX 20 пам'ять GDDR6. NVIDIA вказує пропускну здатність пам'яті 616 Гбайт / с через 352-бітний інтерфейс. Названа ціна € 1.259, яка теж знайома по відеокартам Titan.
Середній сегмент лінійки GeForce RTX 2080 буде представлений відкритий GeForce RTX 2080, чиї 2.944 потокових процесора працюватимуть на частоті від 1.800 МГц. Об'єм вбудованої пам'яті становить 8 Гбайт, пропускна здатність 448 Гбайт / с. Ціна GeForce RTX 2080 Founders Edition становить € 849.
Поки що лінійка GeForce RTX 20 починається з відеокарти GeForce RTX 2070, оснащеної 2.304 потокових процесорів. Базова частота становить 1.410 МГц, в режимі Boost гарантується частота від 1.710 МГц. Обсяг відеопам'яті теж становить 8 Гбайт, як і 256-бітний інтерфейс пам'яті. Тобто пропускна здатність пам'яті ідентична. Ціна становить € 639, тобто дану відеокарту складно назвати бюджетної.
Відкрите пропонують три порти DisplayPort 1.4, один HDMI 2.0a і один VirtualLink.
Ціни і доступність
Відкрите Founders Edition GeForce RTX 2080 Ti, RTX 2080 і RTX 2070 можна буде придбати безпосередньо у NVIDIA. Попередні замовлення приймаються з сьогоднішнього дня, відвантаження почнеться 20 вересня. GeForce RTX 2070 буде доступна трохи пізніше. Ціна становить € 1.259 за GeForce RTX 2080 Ti, € 849 за GeForce RTX 2080 і € 639 за GeForce RTX 2070. Рекомендовані ціни FE в Росії: GeForce RTX 2080 Ti - 95.990 рублів, GeForce RTX 2080 - 63.990 рублів, 47.990 рублів.
NVIDIA ні словом не обмовилася про відкритих партнерів з альтернативним дизайном.
Програмне забезпечення теж вносить свій внесок
Кілька днів тому ми роз'яснили нинішню орієнтацію NVIDIA на трасування променів . В принципі, напрямки розвитку нинішньої архітектури Turing відеокарт GeForce було зрозуміло ще з уявлення інтерфейсу NVIDIA RTX, сумісного з Microsoft DXR API для трасування променів.
З лінійкою карт Quadro RTX для робочих станцій і новою архітектурою NVIDIA проклала відповідний курс і з апаратного забезпечення. Лінійка GeForce 20 забезпечує доступ до нових технологій звичайним споживачам. Тепер хіба що залишилося дочекатися сумісних ігор.
NVIDIA на заході представила кілька сумісних ігор. А саме Shadow of the Tomb Raider, Metro Exodus, Assetto Corsa і Battlefield V.