Rtx 3070 ������ linux

Содержание
  1. RTX 3070 Mobile vs RTX 3070
  2. Общая информация
  3. Характеристики
  4. Совместимость и размеры
  5. Оперативная память
  6. Видеовыходы
  7. Поддержка API
  8. Тесты в бенчмарках
  9. Майнинг на RTX 3070. Разгон, настройка, доходность, потребление
  10. Майнинг на RTX 3070 в NiceHash
  11. Разгон и потребление RTX 3070. +11.5 Mh/s и -85 ватт
  12. Разгон RTX 3070 на Windows в Afterburner
  13. Разгон RTX 3070 на Hive OS
  14. Разгон RTX 3070 на Rave OS
  15. Часто задаваемые вопросы
  16. Самый прибыльный и надежный пул для майнинга эфира на RTX 3070
  17. ASUS TUF RTX 3070 Gaming OC в майнинге эфира (ETH)
  18. MSI RTX 3070 Ventus 2X OC в майнинге эфира (ETH)
  19. Обзор видеоускорителя Nvidia GeForce RTX 3070: очень привлекательное по цене младшее решение из топового семейства Nvidia Ampere
  20. Оглавление
  21. Теоретическая часть: особенности архитектуры
  22. Архитектурные особенности
  23. Технологии и программная поддержка
  24. Особенности видеокарты Nvidia GeForce RTX 3070 Founders Edition
  25. Характеристики карты
  26. Память
  27. Особенности карты и сравнение с Nvidia GeForce RTX 2070 Super Founders Edition
  28. Нагрев и охлаждение
  29. Подсветка
  30. Комплект поставки и упаковка
  31. Тестирование: синтетические тесты
  32. Конфигурация тестового стенда
  33. Тестирование: игровые тесты
  34. Список инструментов тестирования

RTX 3070 Mobile vs RTX 3070

  • Интерфейс PCIe 4.0 x16
  • Частота ядра 1500
  • Объем видеопамяти 8192 MB
  • Тип памяти GDDR6
  • Частота памяти 14000
  • Максимальное разрешение

Общая информация

Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce RTX 3070 Mobile и GeForce RTX 3070, а также о времени начала продаж и стоимости на тот момент.

Место в рейтинге производительности 60 8
Соотношение цена-качество (0-100) нет данных 1.77
Архитектура Ampere Ampere
Графический процессор GN20-E5 GA104 Ampere GA104
Тип Для ноутбуков Десктопная
Дата выхода 4 января 2021 (меньше года назад) 16 сентября 2020 (1 год назад)
Цена на момент выхода нет данных 499$
Цена сейчас нет данных 1280$

Для получения индекса мы сравниваем характеристики видеокарт и их стоимость, учитывая стоимость других карт.

Характеристики

Общие параметры GeForce RTX 3070 Mobile и GeForce RTX 3070: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce RTX 3070 Mobile и GeForce RTX 3070, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.

Количество потоковых процессоров 5120 5888
Частота ядра 780 — 1100 МГц 1500 МГц
Частота в режиме Boost 1290 — 1620 МГц 1725 МГц
Количество транзисторов 17,400 млн 17,400 млн
Технологический процесс 8 нм 8 нм
Энергопотребление (TDP) 115 Вт 220 Вт
Скорость текстурирования 287.0 317.4

Совместимость и размеры

Параметры, отвечающие за совместимость GeForce RTX 3070 Mobile и GeForce RTX 3070 с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания). Для ноутбучных видеокарт это предполагаемый размер ноутбука, шина и разъем подключения, если видеокарта подключается через разъем, а не распаивается на материнской плате.

Размер ноутбука Большой нет данных
Интерфейс PCIe 4.0 x16 PCIe 4.0 x16
Длина нет данных 242 мм
Дополнительные разъемы питания нет 1x 12-pin

Оперативная память

Параметры установленной на GeForce RTX 3070 Mobile и GeForce RTX 3070 памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.

Тип памяти GDDR6 GDDR6
Максимальный объём памяти 8 Гб 8 Гб
Ширина шины памяти 256 бит 256 бит
Частота памяти 14000 МГц 14000 МГц
Пропускная способность памяти 320.0 Гб/с 448.0 Гб/с
Разделяемая память

Видеовыходы

Перечисляются имеющиеся на GeForce RTX 3070 Mobile и GeForce RTX 3070 видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.

Видеоразъемы 1x HDMI, 3x DisplayPort 1x HDMI, 3x DisplayPort
HDMI + +

Поддержка API

Перечислены поддерживаемые GeForce RTX 3070 Mobile и GeForce RTX 3070 API, включая их версии.

DirectX 12 Ultimate (12_2) 12 Ultimate (12_2)
Шейдерная модель 6.5 6.5
OpenGL 4.6 4.6
OpenCL 2.0 2.0
Vulkan 1.2 1.2
CUDA 8.5 8.5

Тесты в бенчмарках

Это результаты тестов GeForce RTX 3070 Mobile и GeForce RTX 3070 на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.

Источник

Майнинг на RTX 3070. Разгон, настройка, доходность, потребление

by InsidePC 24.03.2021, 18:50 2.2k Просмотров

Всем привет, сегодня на обзоре майнинг на RTX 3070. Посмотрим как можно оптимально настроить и оптимизировать эту карту под майнинг, там есть что посмотреть, разгоним, изучим потребление и доходность. Карта RTX 3070 на данный момент, является наиболее интересным вариантом для майнинга ETH и других монет, так как является самая прибыльная в плане мегахэш на ватт. Об этом всем подробнее в материале.

Майнинг на RTX 3070 в NiceHash

Если карту не разгонять и не настраивать, карта выдает 52 Mh/s на эфире, при этом потребление карты в районе 210 ватт. Учитывая ценник данной карты на конец марта 2021 года в 1600$, покупка за такие деньги просто не имеет смысла. Так как карта получается очень дорогой. Но при правильном разгоне RTX 3070 и оптимизации питания, мы можем получить результат в 11Mh/s больше и питание на 85 ватт ниже.

Давайте приступим к манипуляциям с картой.

Разгон и потребление RTX 3070. +11.5 Mh/s и -85 ватт

Разгон покажем в трех самых популярных системах для майнинга. Для более наглядного примера, мы взяли сразу 2 карты от MSI, это Ventus 2x. Разгоним обе 3070 для майнинга и посмотрим на стабильность и результат.

Две 3070 в разгоне

На температуры первой карты в 74 градуса не обращайте внимания, карты находятся впритык друг к другу, и первой карте попросту негде брать воздух. Вторая карта показывает что вас примерно ждет в риге, но если в риге карты хотя бы разделены на 8-10 см, данные карты будут держать 45-50 градусов.

Разгон RTX 3070 на Windows в Afterburner

В первую очередь установить MSI Afterburner. Это самая популярная программа для разгона и настройки видеокарт.

Нам нужно изменить в программе следующие характеристики:

  • Core Clock (Mhz), частота ядра: -100 Mhz.
  • Memory Clock (Mhz), частота памяти: +1200-1400. Смотрите под ваш экземпляр.
  • Power Limit (%), лимит напряжения: 55-60%. Тестируйте что будет стабильнее для вас.
  • Обороты вентиляторов можете не трогать, либо задать сразу на 55-70%. Если хотите что бы карта всегда была холодная. Нажимаете кнопку с галочкой после всех изменений и смотрим на окно майнера. Хэшрейт с 50-52 должен подняться до 60.5-63 Mh/s. При этом потребление с 200-220 ватт упадет до 125-130 ватт.

Разгон RTX 3070 в MSI Afterburner

Разгон RTX 3070 на Hive OS

Разгон RTX 3070 для майнинга ETH в Hive OS, если вы еще не зарегистрированы в Hive OS, пройдите регистрацию по этой ссылке с промокодом InsidePC и получите 10$ на счет, т.к. в системе бесплатный только 1 риг, со второго рига нужно платить 3$ в месяц за каждый риг.

1. Во вкладке Farms(Фермы), выбираем нужную ферму, где стоят 3070.

Hive OS — Farms

2. Выбираем риг в котором стоят 3070.

Workers в Hive OS

3. Выбираем нужную карту и нажимаем на значок спидометра. Можно выбрать этот значок напротив конкретной карты, либо выбрать значок спидометра с надписью ALL. Тут задаются настройки разгона для всех карт Nvidia или AMD. Если у вас несколько 3070, можно применить разгон сразу ко всем картам.

Разгон RTX 3070 в HiveOS

4. Далее нужно в поле +Core Clock Mhz выставить -100. В поле Memory Clock, Mhz выставить 2400. OhGodAnETHlargementPill выключите, это только для разгона майнинга 1080 и 1080 Ti.

Оптимальный разгон и настройки RTX 3070 в Hive OS

Процесс разгона видеопамяти RTX 3070 для майнинга в Rave OS и Hive OS сильно отличается от разгона видеопамяти 3070 в Windows. В Hive OS вводим значение которое будет добавлено к базовой частоте умноженное на 2. Т.е. в поле Memory Clock, Mhz, мы указываем на сколько увеличить частоту памяти умноженную на 2. Если нам нужно указать 1200 Mhz, мы тем самым увеличиваем частоту памяти на 2400 Mhz. Указывая 900 Mhz, мы увеличиваем частоту на 450 Mhz.

Так же нужно указать Power Limit, W. Для RTX 3070 ставьте значение 125 — 130W. Этого будет достаточно.

Разгон RTX 3070 на Rave OS

Разгон RTX 3070 для майнинга ETH в Rave OS. Прежде всего, зарегистрируйтесь в Rave OS.

1. Заходим во вкладку Workers.

Вкладка Workers в RaveOS

2. Заходим в настройки воркера (Edit worker).

3. Переходим во кладку Tunning. И выставляем значения для разгона. В поле Core Clock offset, Mhz ставим значение -100, а в поле Memory Clock offset, Mhz, ставим значение 2400 Mhz, это работает так же как и в Hive OS, частоту делим на 2. Т.е. значение 2400, увеличивает частоту памяти на 1200 Mhz. И выставляем значение напряжения 120 ватт.

4. Нажимаем кнопку «Save & Apply».

Вот собственно и все, ничего сложного, 4 простых действия.

Часто задаваемые вопросы

Самый прибыльный и надежный пул для майнинга эфира на RTX 3070

На данный момент, Binance Pool по майнингу эфира является одним из самых прибыльных и эффективных пулов. Как настроить Binance Pool, читайте на сайте.

ASUS TUF RTX 3070 Gaming OC в майнинге эфира (ETH)

Карта потребляет 120 ватт, температурный предел стоит 55 градусов, при этом вентиляторы крутят на 44%. Хэшрейт карты 61.53. Это не предел для этой карты, разогнав память до 2700, вы можете получить 62.5 -63.5 Mh/s. При этом потребление нужно будет увеличить. Каждый экземпляр нужно тестировать отдельно.

MSI RTX 3070 Ventus 2X OC в майнинге эфира (ETH)

Карта потребляет 120 ватт, температурный предел стоит 55 градусов, при этом вентиляторы крутят на 30%. Хэшрейт карты 61.51. Это не предел для этой карты, разогнав память до 2700, вы можете получить 62.5 -63.5 Mh/s. При этом потребление нужно будет увеличить.

Источник

Обзор видеоускорителя Nvidia GeForce RTX 3070: очень привлекательное по цене младшее решение из топового семейства Nvidia Ampere

Оглавление

Теоретическая часть: особенности архитектуры

Мы продолжаем рассматривать модели видеокарт нового семейства GeForce RTX 30, основанные на архитектуре Ampere, которые компания Nvidia представила в этом году. Предыдущие решения архитектуры Turing были революционными из-за аппаратной поддержки трассировки лучей и аппаратного ускорения задач искусственного интеллекта. Но производительности тех GPU порой не хватало, а в этом году стали доступны новые технологии производства полупроводников, что позволило улучшить в архитектуре Ampere именно производительность, хотя и некоторые новые возможности также появились.

Благодаря оптимизации и производству по более тонкому техпроцессу, игровые решения архитектуры Ampere примерно в 1,5-1,7 раза быстрее аналогичных Turing в традиционных задачах растеризации и до 2 раз быстрее при трассировке лучей. Еще одна важная характеристика нового семейства GeForce RTX 30 — приемлемые цены, принесшие значительное улучшение соотношения цены и производительности по сравнению с предыдущим семейством GeForce RTX 20.

Игровые видеокарты на базе архитектуры Ampere были анонсированы во время виртуального мероприятия в начале сентября, когда были представлено три модели: RTX 3070, RTX 3080 и RTX 3090. Мы уже рассмотрели две дорогие, основанные на разных модификациях чипа GA102, а сегодня у нас в обзоре, пожалуй, самая интересная видеокарта из анонсированных — RTX 3070, имеющая самую доступную цену. Она основана на графическом процессоре GA104, стоящем на шаг ниже GA102. Предварительные данные о производительности новинки говорят о том, что целью Nvidia было получение производительности топового решения GeForce RTX 2080 Ti из предыдущего поколения, но в ином ценовом сегменте.

При этом GA104 сохранил все ключевые особенности старшего чипа GA102, и RTX 3070 отличается от RTX 3080 и RTX 3090 разве что применением типа памяти GDDR6, а не нового GDDR6X. Но для ее уровня производительности этого вполне достаточно. Куда важнее то, что все технологии и особенности новой архитектуры Ampere остались и в младшем чипе. GeForce RTX 3070 не только обеспечивает производительность топовой видеокарты недавнего времени, но и поддерживает все новые технологии. Что касается скорости нового GPU, то при FP32-вычислениях он обеспечивает производительность более 20 терафлопс, а это больше, чем у RTX 2080 Ti. Но главное, что новинка будет продаваться за $499 (чуть больше 45 тысяч рублей)!

Сама Nvidia сравнивает Ampere с Pascal — графические процессоры той архитектуры были значительно быстрее предыдущей Maxwell. Nvidia считает, что Ampere дает скачок производительности даже еще больший, по сравнению с Turing. Посмотрите на показатели RTX 3070 сами — практически все они вдвое выше, чем у модели RTX 2070 семейства Turing. Похоже, настало самое удачное время для апгрейда! Правда, если не будет проблем с доступностью новых GPU в продаже, как это случилось со старшими моделями линейки GeForce RTX 30.

Понятно, что в играх у новинки все прекрасно — даже по нескольким примерам игр с применением растеризации и трассировки лучей хорошо видно преимущество GeForce RTX 3070 перед той моделью, последователем дела которой она является — GeForce RTX 2070. Разница между ними порядка 60% в пользу видеокарты семейства Ampere. По сути, новинка обеспечивает скорость RTX 2080 Ti (с вдвое более высокой ценой на момент ее выхода более двух лет назад) архитектуры Turing, что очень впечатляет.

Но не только игроков может заинтересовать сегодняшняя новинка. Все большее количество профессионалов используют графические процессоры для ускорения своей работы и повышения комфорта при разработке. Возможно, большинство из них выберет более мощные старшие варианты, но кому-то вполне хватит и RTX 3070 для их задач. Ведь она дает в 1,6-2,3 раза более высокую производительность в приложениях для создания 3D-контента по сравнению с RTX 2070, да и RTX 2080 Ti частенько обходит.

Основой рассматриваемой сегодня модели видеокарты стал новый графический процессор архитектуры Ampere, но так как она имеет достаточно много общего с предыдущими архитектурами Turing, Volta и местами даже Pascal, то перед прочтением материала мы советуем ознакомиться и с нашими предыдущими статьями:

Графический ускоритель GeForce RTX 3070
Кодовое имя чипа GA104
Технология производства 8 нм (Samsung «8N Nvidia Custom Process»)
Количество транзисторов 17,4 млрд (у TU104 — 13,6 млрд)
Площадь ядра 392,5 мм² (у TU104 — 545 мм²)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 256-битная: 8 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6
Частота графического процессора до 1725 МГц
Вычислительные блоки 46 потоковых мультипроцессоров (из 48 в полном чипе), включающих 5888 CUDA-ядер (из 6144 ядер) для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки 184 тензорных ядер (из 192) для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей 46 RT-ядра (из 48) для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 184 блоков (из 192) текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 12 широких блоков ROP на 96 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)
Спецификации референсной видеокарты GeForce RTX 3070
Частота ядра до 1725 МГц
Количество универсальных процессоров 5888
Количество текстурных блоков 184
Количество блоков блендинга 96
Эффективная частота памяти 14 ГГц
Тип памяти GDDR6
Шина памяти 256-бит
Объем памяти 8 ГБ
Пропускная способность памяти 448 ГБ/с
Вычислительная производительность (FP32) до 20,3 терафлопс
Теоретическая максимальная скорость закраски 166 гигапикселей/с
Теоретическая скорость выборки текстур 317 гигатекселей/с
Шина PCI Express 4.0
Разъемы один HDMI 2.1 и три DisplayPort 1.4a
Энергопотребление до 220 Вт
Дополнительное питание один 8-контактный разъем
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $499 (45 490 рублей)

Наименование третьей модели из нового поколения соответствует принципу наименования решений компании, выше нее стоят только более дорогие RTX 3080 и RTX 3090. Рекомендованная цена для GeForce RTX 3070 составляет $499, да и ценовая рекомендация для нашего рынка в 45490 рублей кажется довольно выгодной, особенно с учетом падения курса национальной валюты в последнее время. О повышенном интересе покупателей именно к этой модели мы и не говорим — очень похоже, что она имеет все шансы стать бестселлером, если получится наладить стабильные поставки.

Пока что у RTX 3070 на рынке просто нет конкурентов. Модели предыдущего поколения в свое время продавались дороже, да и сейчас RTX 2080 Ti не осталось смысла покупать по цене RTX 3070. Топовый Turing имеет преимущество разве что по объему видеопамяти, и если кому-то недостаточно 8 ГБ видеопамяти у RTX 3070, то вполне можно обратить внимание и на модель прошлого поколения. Но по производительности новинка ей не уступит, а иногда будет быстрее, особенно при трассировке лучей. Да и технологии некоторые новые она поддерживает, которых нет у Turing.

В очередной раз нам пока что нечего сказать о конкурентах со стороны компании AMD, хотя они тоже вот-вот будут объявлены, а уж когда появятся в продаже — пока что неизвестно. Скорее всего, лишь в декабре. Что касается имеющегося на рынке, то Radeon VII давно устарел, а Radeon RX 5700 XT является решением более низкого уровня. Так что с большим нетерпением ждем аналогичных решений на базе архитектуры RDNA2, способных конкурировать с GeForce RTX 3070 по всем статьям.

Читайте также:  Amd radeon hd 6700m series driver windows 10

Аналогично моделям RTX 3080 и RTX 3090, компания Nvidia предлагает собственный вариант RTX 3070 Founders Edition. Такие видеокарты предлагают любопытные системы охлаждения и строгий дизайн, которого не найти у большинства производителей видеокарт, гонящихся за количеством и размером вентиляторов, а также разноцветной подсветкой. Самое интересное в GeForce RTX 30, продаваемых под собственным брендом Nvidia — совершенно новый дизайн системы охлаждения с двумя вентиляторами, один из которых привычно выдувает воздух через решетку с торца платы, а второй протягивает воздух прямо сквозь видеокарту. Единственная разница по сравнению со старшими моделями в том, что у RTX 3070 вентилятор установлен не с обратной стороны карты, но принцип его работы ровно тот же.

В результате RTX 3070 FE предлагает тихую и эффективную систему охлаждения, неплохо включающуюся в большинство систем охлаждения в корпусах ПК. Тепло отводится от различных компонентов на карте к радиатору, левый вентилятор выводит нагретый воздух через большие вентиляционные отверстия в рамке видеокарты, а правый направляет воздух к выдувному вентилятору в верхней части корпуса, где он обычно установлен в большинстве современных систем.

При создании этой модели Founders Edition, инженеры компании хорошо поработали над компактностью печатной платы — как и в старших видеокартах, это сделано для того, чтобы второй вентилятор продувал воздух через радиатор напрямую, без препятствий. В итоге, по замерам Nvidia, кулер RTX 3070 до 16 дБА тише и на 44% эффективнее охлаждает GPU, по сравнению с кулером RTX 2070 Founders Edition. Младшая из трех моделей семейства GeForce RTX 30 также использует новый формат 12-контактного разъема питания, позволяющий эффективнее разместить некоторые элементы на карте.

Видеокарта модели GeForce RTX 3070 в теории должна появиться в продаже в ближайшие дни, но в связи с возможным недостаточным объемом производства, огромным спросом и дефицитом старших видеокарт семейства GeForce RTX 30, достоверно что-то утверждать сложно. Скорее всего, эту видеокарту еще придется поискать в продаже, особенно по хорошей цене, но есть некоторые признаки того, что сделать это будет проще, чем с RTX 3080. Естественно, партнеры компании выпустили и карты собственного дизайна: Asus, Colorful, EVGA, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и другие.

Архитектурные особенности

При производстве графического процессора GA104 используется все тот же техпроцесс 8 нм компании Samsung, оптимизированный для нужд Nvidia, который мы уже знаем по GA102. Младший чип Ampere содержит 17,4 миллиарда транзисторов и имеет площадь 392,5 мм² — это хороший шаг вперед по сравнению Turing, ведь примерно аналогичный по позиционированию TU104 имеет 13,6 млрд. транзисторов, а TU102 лишь чуть больше — 18,6 млрд. При этом, площадь схожего по сложности TU102 равна 754 мм², а менее сложного TU104 — 545 мм². Даже TU106 имеет площадь в 445 мм², а ведь он значительно проще и медленнее.

Так что по плотности размещения транзисторов техпроцесс Samsung довольно неплох, он позволил снизить площадь GPU при повышении количества транзисторов, а вот по параметрам максимальных частот и энергопотреблению он хоть и лучше, чем 12 нм у TSMC, но, судя по имеющимся данным, уступает техпроцессу 7 нм тех же тайваньцев. Скорее всего, Nvidia выбрала его исходя из себестоимости и доступности массового производства немаленьких чипов. Да и выход годных на заводе Samsung может быть лучше, и условия для Nvidia наверняка особые, тем более, что производственные мощности TSMC заняты другими компаниями.

Как и все чипы Nvidia, GA104 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации Raster Operator (ROP) и контроллеры памяти. Полный чип GA104, схему которого мы видим ниже, содержит шесть кластеров GPC и 48 мультипроцессоров SM. Каждый GPC содержит по четыре TPC, состоящих из пары SM и движка PolyMorph Engine для работы с геометрией.

GPC — это высокоуровневый кластер, включающий все ключевые блоки для обработки данных внутри него, каждый из них имеет выделенный движок растеризации Raster Engine и в Ampere включает два раздела ROP по восемь блоков каждый. В итоге, полный GA104 содержит 6144 потоковых CUDA-ядра, 48 RT-ядер второго поколения и 192 тензорных ядра третьего поколения. Подсистема памяти GA104 содержит восемь 32-битных контроллеров памяти, что дает 256-бит в общем. Каждый 32-битный контроллер связан с разделом кэш-памяти второго уровня объемом в 512 КБ, и общий объем L2-кэша получается равным 4 МБ.

Но это мы говорили о полном чипе, а модель видеокарты GeForce RTX 3070 использует слегка урезанный по количеству блоков вариант GA104. Эта модификация получила количество блоков SM, меньшее на два — то есть, в одном из GPC просто отключили один кластер TPC с парой мультипроцессоров. Соответственно, отличается и количество остальных блоков, новый GPU имеет 5888 CUDA-ядер, 184 тензорных ядра и 46 RT-ядра. Текстурных блоков в этой модификации 184 штук, а вот блоки ROP активны все — 96.

Важное отличие RTX 3070 от старших моделей заключается в подсистеме памяти. У новинки в наличии 8 ГБ GDDR6-памяти, известной нам по предыдущим поколениям GPU, а не новой GDDR6X, которая была разработана совместно с Micron и применяется только в двух старших моделях. Память у RTX 3070 подключена по полной 256-битной шине, что дает чуть менее полутерабайта пропускной способности. Интересно, что у RTX 2080 Ti пропускная способность на четверть выше, но это не дает ей преимущества в большинстве реальных задач. Видимо, современные игры не слишком требовательны к ПСП, да и алгоритмы внутричипового сжатия достаточно эффективно работают.

Теперь что касается объема видеопамяти. Некоторым может показаться, что RTX 3070 будет не хватать 8 ГБ памяти. Но пока что игры даже в 4K-разрешении при максимальных настройках действительно не требуют большего объема памяти. Они могут занимать его и даже как-то использовать, но ускорения при увеличении объема от 8 до 16 ГБ никакого не будет. Есть лишь одна оговорка — скоро выйдут консоли нового поколения с большим объемом памяти и быстрыми SSD, и в будущем некоторые мультиплатформенные или портированные с консолей игры могут начать требовать большего, чем 8 ГБ локальной видеопамяти. Но пока что этого объема точно хватает.

Подробно рассматривать архитектурные улучшения Ampere в этой статье мы не будем, все уже было написано в теоретическом материале по GeForce RTX 3080. Основным нововведением Ampere является удвоение FP32-производительности для каждого мультипроцессора SM, по сравнению с семейством Turing, что привело к значительному повышению пиковой производительности. Почти то же самое касается и RT-ядер — хотя их число и не изменилось, внутренние улучшения привели к удвоению темпа поиска пересечений лучей с геометрией. Улучшенные тензорные ядра хоть и не удвоили производительность при обычных условиях, но темп таких вычислений удвоился, а также появилась возможность удвоения скорости обработки так называемых разреженных матриц.

Все остальные архитектурные особенности игровых решений Ampere, включая изменения в мультипроцессорах SM, блоках ROP, системе кэширования и текстурирования, тензорных и RT-ядрах, подробно рассмотрены в теоретическом обзоре RTX 3080. Все улучшения привели к достижению довольно высокой энергоэффективности, вся архитектура Ampere делалась с упором на это, включая доработанный техпроцесс Samsung, дизайн чипов и печатных плат, оптимизацию ПО и многое другое. Что получилось у Nvidia в результате — мы узнаем в практических частях материала.

Технологии и программная поддержка

Младшая модель GeForce RTX 3070 поддерживает все технологии, появившиеся и улучшенные в семействе Ampere. Мы еще раз отметим набор технологий RTX IO, который в будущем обеспечит быструю передачу и распаковку ресурсов на GPU, и повысит производительность системы ввода-вывода в десятки раз, по сравнению с привычными HDD и традиционными API. RTX IO в будущем обеспечит очень быструю загрузку ресурсов игры и позволит создавать более разнообразные и детализированные виртуальные миры.

RTX IO распаковывает данные при помощи потоковых процессоров GPU, это осуществляется асинхронно — при помощи высокопроизводительных вычислительных кернелов, используя механизмы прямого доступа к памяти архитектур Turing и Ampere, также помогает в процессе улучшенный набор инструкций и новая архитектура мультипроцессоров SM, позволяющая использовать расширенные асинхронные вычислительные возможности. Но без соответствующих изменений в операционной системе технологию использовать не получится. Разработчикам придется ждать, пока Microsoft реализует эти возможности в их собственном DirectStorage API.

Переходим к особенностям программной поддержки, которая всегда очень важна, ведь при любом аппаратном обеспечении его работа просто невозможна без соответствующего ПО. Так, весьма важно применение новых технологий Nvidia, появившихся в семействе Turing и имеющихся в Ampere: RTX и DLSS. Пожалуй, мы бы хотели еще более активного их внедрения в игры, но это тормозится как парком старых GPU в существующих игровых системах, так и отсутствием поддержки трассировки в консолях нынешнего поколения.

Тем не менее, Nvidia терпеливо занимается с разработчиками для внедрения их технологий в игры. И уже вышли или совсем скоро выйдут следующие проекты: Ghostrunner — с поддержкой трассированных отражений и теней, а также DLSS, инди-проект Pumpkin Jack, имеющий трассированные отражения и тени, а также улучшенное освещение и DLSS, и Xuan-Yuan Sword VII — который вот-вот выйдет и предложит трассированное глобальное освещение и технологию улучшения производительности DLSS.

Также будут обновлены в ноябре и получат поддержку технологий Nvidia еще четыре уже вышедшие игры: Edge of Eternity получит поддержку DLSS, Mortal Shell будет использовать трассировку для рендеринга теней, также в игре поддерживается и DLSS, в Mount & Blade II: Bannerlord добавится DLSS, а обновление World of Warcraft: Shadowlands принесет трассированные тени. Еще пара игр с поддержкой технологий RTX выйдут в ранний доступ или бета-тестирование: Enlisted — с трассированным глобальным освещением и DLSS, Ready or Not — с трассированными отражениями, тенями, глобальным затенением и DLSS. Эти игры станут доступны ближе к концу года.

Но самыми долгожданными являются такие хиты, как: Watch Dogs: Legion — выходящая 29 октября и предлагающая трассированные отражения и технологию DLSS, Call of Duty: Black Ops Cold War с датой выхода 13 ноября, предлагающая поддержку трассировки лучей и DLSS, ну и супермегапроект Cyberpunk 2077, выход которого назначен на 19 ноября. В самой ожидаемой игре года будет применяться трассировка лучей для рендеринга отражений, теней, глобального затенения и рассеянного освещения, также заявлена и поддержка DLSS.

Очень широкое распространение в последние месяцы получил киберспорт, чему изрядно помогла ситуация с карантинами и изоляциями, связанными с распространением коронавируса по нашей планете. Взять хотя бы автогонки — многие месяцы реальные гонки не проводились, а их заменили виртуальные, в которых участвовали гонщики различных серий, включая Формулу 1. Да и обычные пользователи не отставали — популярность сетевых сражений в этом году изрядно выросла. А рука об руку с сетевыми играми идет и стриминг и сетевое общение.

Но сначала поговорим о самом киберспорте. Вместе с Ampere компания Nvidia представила технологию Reflex, которая предназначена для того, чтобы игроки получили минимальные задержки при игре в соревновательных проектах. Чтобы ускорить реакцию ПК на действия игрока и предназначен новый набор технологий, оптимизирующих и измеряющих задержки системы. Технология Reflex Low-Latency, встроенная в популярные киберспортивные игры Apex Legends, Call of Duty: Warzone, Destiny 2, Fortnite и Valorant, значительно снижает задержки. Причем, технология не является уникальной для Ampere, а работает на всех видеокартах, начиная с серии GTX 900.

В киберспортивных состязаниях низкая задержка и лучшая отзывчивость системы приводит к лучшим результатам и победам, ведь там важна каждая миллисекунда. Более низкие системные задержки означают лучшую отзывчивость и это ощущается даже больше, чем высокая частота кадров. Последняя измеряет пропускную способность, а не задержку между действиями игрока и выводом на экран соответствующего действия.

Исследования показали, что снижение задержек приводит к улучшению точности прицеливания в играх, что вполне логично. Reflex — технология для снижения системной задержки, сочетающая оптимизации со стороны графического процессора и игр. В случаях, когда производительность ограничена графическим процессором, Reflex SDK позволяет CPU начать передачу работы по рендерингу в GPU сразу перед тем, как он завершит предыдущий кадр, что значительно сокращает, а зачастую и вовсе устраняет очередь рендеринга. Хотя это и похоже на режим сверхнизкой задержки в драйвере, он работает лучше, так как этот метод работает в самом игровом движке.

Nvidia Reflex SDK интегрируется или уже встроен во все популярные киберспортивные игры. Применение Reflex SDK также позволяет повысить частоты GPU для быстрого расчета и вывода подготовленных кадров на экран чуть раньше обычного — в некоторых случаях, когда общая производительность ограничена скоростью центрального процессора. Эта возможность аналогична ранее известной функции «Prefer Maximum Performance», доступной из панели настроек драйверов Nvidia.

Но самое заметное снижение задержек будет наблюдаться в сценариях, когда общее время рендеринга ограничено мощностью GPU, то есть в высоких разрешениях и при максимальных графических настройках, когда очереди рендеринга велики. GPU средней мощности, вроде GTX 1660 Super, получают приличное снижение задержек в Full HD-разрешении, даже по сравнению с технологией Nvidia Ultra Low Latency (NULL), а для мощных видеокарт типа RTX 3080, технология Reflex позволяет наслаждаться высоким разрешением рендеринга без соответствующих потерь в отзывчивости, которые обычно наблюдаются при росте разрешения.

Как видно по диаграмме, чем выше разрешение, тем большее снижение задержек дает применение Reflex. Правда, нужно учитывать, что более низкое разрешение в любом случае даст меньшие задержки, чем применение Reflex в высоком разрешении. Но применение этого режима позволяет в 4K-разрешении получить отзывчивость, аналогичную разрешению 2560×1440 в обычном режиме, а в 2560×1440 задержки будут аналогичны тому, что обычно получаются в Full HD. А высокое разрешение имеет свои плюсы, ведь врагов будет проще рассмотреть с большого расстояния.

Ну а технология Reflex Latency Analyzer определяет входной сигнал с мыши и измеряет время до появления результата на экране — без необходимости использования специального оборудования вроде скоростных камер, как это было необходимо ранее. Эта технология встроена в новые 360-герцовые дисплеи Nvidia G-Sync Esports, которые появятся осенью у Acer, Alienware, Asus и MSI. Она поддерживается и в периферийных устройствах производства компаний Asus, Logitech, Razer и SteelSeries и позволяет оценить реальные задержки при игре.

А теперь перейдем к просмотру и трансляции виртуальных сражений. Игровых стримеров в этом году смотрят почти вдвое более массово, чем в прошлом, а число соответствующих каналов выросло почти в полтора раза. В мире более двух десятков миллионов стримеров разной популярности, и каждый игрок может им легко стать, особенно при помощи современных программных и аппаратных средств компании Nvidia.

Для этого можно использовать программное обеспечение Nvidia Broadcast — универсальный плагин, улучшающий качество звука с микрофонов и изображения с веб-камер при помощи ускоренных на решениях GeForce RTX инструментов с применением искусственного интеллекта — таких, как шумоподавление, наложение виртуальных фонов и автокадрирование камеры. Мы уже писали ранее об этом ПО.

Broadcast поддерживается на всех решениях GeForce, Titan и Quadro RTX, и использует выделенные тензорные ядра для работы нейросетей в реальном времени. А для самого стриминга можно использовать аппаратный кодировщик видеоданных Nvidia Encoder, разгружающий CPU от этой задачи и обеспечивающий приемлемое качество записи. Все популярные приложения для стриминга поддерживают технологию и оптимизированы для графических процессоров Nvidia.

Одной из возможностей Nvidia Broadcast стало шумоподавление, помогающее избавиться от нежелательных фоновых звуков при общении по сети или записи звука. По сравнению с ранней бета-версией RTX Voice, новые аппаратные и программные оптимизации привели к снижению нагрузки на систему вдвое (тестирование на GeForce RTX 3080 показывает падение FPS лишь на 3%), а число шумовых профилей выросло втрое — благодаря ранней поддержке от бета-тестеров. Также Broadcast включает новые возможности по замене фона и автоматическому кадрированию, но они пока что находятся в бета-стадии разработки и требуют дальнейшей оптимизации.

Также видеостримингу очень поможет полная аппаратная поддержка декодирования видеоданных в формате AV1. Да, пока что это «всего лишь» декодирование, но зато оно полностью аппаратное, а значит — максимально эффективное. Все решения семейства GeForce RTX 30 имеют поддержку этого формата, который более эффективен, по сравнению с существующими вариантами: H264, H265 и VP9. Применение AV1 позволяет снизить требования к битрейту для передачи видео высокого разрешения вплоть до 50%-55% по сравнению с H.264, что делает его отличным вариантом для видеороликов на YouTube в форматах 4K, 8K и 8K HDR.

Кроме этого, Nvidia работает с производителями телевизоров. Так, совместная работа с LG позволила получить поддержку технологии G-SYNC в 8K-разрешении на соответствующих OLED-телевизорах корейской компании. И если для игры в таком разрешении вам нужна GeForce RTX 3090, то уж видеоролики смотреть можно и при помощи RTX 3070. Вообще, именно OLED-телевизоры производства LG идеально подходят для нового семейства видеокарт Nvidia, они имеют очень низкие задержки и высокую отзывчивость в игровых режимах, поддерживают адаптивную частоту обновления G-SYNC Compatible, а также 4K- и 8K-разрешение с HDR.

Поддержка разъемов HDMI 2.1 всеми видеокартами семейства Ampere позволяет подключать 8K-телевизоры всего лишь по одному кабелю, а для 4K-разрешения доступна частота обновления 120 Гц, также поддерживаемая лучшими телевизорами LG. Также очень важно, что новые видеокарты GeForce RTX 30 умеют захватывать и записывать видео в 8K-разрешении для стриминга при помощи GeForce Experience и функции Shadowplay, которая поддерживает запись видео в форматы вплоть до 8K HDR с 30 FPS.

Читайте также:  Windows 10 зарезервировано системой озу

Особенности видеокарты Nvidia GeForce RTX 3070 Founders Edition

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Если уж Founders Edition, то 12-контактный разъем питания

Объект исследования: ускоритель трехмерной графики (видеокарта) Nvidia GeForce RTX 3070 Founders Edition 8 ГБ 256-битной GDDR6

Характеристики карты

Nvidia GeForce RTX 3070 Founders Edition 8 ГБ 256-битной GDDR6
GPU GeForce RTX 3070 (GA104)
Интерфейс PCI Express x16 4.0
Частота работы GPU (ROPs), МГц 1440—1725(Boost)—1950(Max)
Частота работы памяти (физическая (эффективная)), МГц 3500 (14000)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU 46
Число операций (ALU/CUDA) в блоке 128
Суммарное количество блоков ALU/CUDA 5888
Число блоков текстурирования (BLF/TLF/ANIS) 184
Число блоков растеризации (ROP) 96
Число блоков Ray Tracing 46
Число тензорных блоков 184
Размеры, мм 240×100×35
Количество слотов в системном блоке, занимаемые видеокартой 2
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 224
Энергопотребление в режиме 2D, Вт 30
Энергопотребление в режиме «сна», Вт 11
Уровень шума в 3D (максимальная нагрузка), дБА 34,4
Уровень шума в 2D (просмотр видео), дБА 18,0
Уровень шума в 2D (в простое), дБА 18,0
Видеовыходы 1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4
Питание: 8-контактные разъемы 1 (12-контактный) c адаптером на 8-контактный разъем
Питание: 6-контактные разъемы 0
Максимальное разрешение/частота, Display Port 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI 7680×4320@60 Гц
Максимальное разрешение/частота, Dual-Link DVI 2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI 1920×1200@60 Гц (1280×1024@85 Гц)
Ожидаемая розничная стоимость карты около 50 тысяч рублей на момент подготовки обзора

Память

Карта имеет 8 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Samsung (GDDR6, K4Z80325BC-HC14) рассчитаны на условную номинальную частоту работы в 3500 (14000) МГц.

Особенности карты и сравнение с Nvidia GeForce RTX 2070 Super Founders Edition

Nvidia GeForce RTX 3070 Founders Edition 8 ГБ Nvidia GeForce RTX 2070 Super Founders Edition 8 ГБ
вид спереди
вид сзади

Прежде всего: почему мы сравниваем с GeForce RTX 2070 Super? Формально GeForce RTX 3070 является преемником как раз GeForce RTX 2070 Super (про GeForce RTX 2070 уже нет смысла вспоминать). И там, и там 8 гигабайт GDDR6, а также 256-битная шина обмена с памятью.

Мы уже отмечали, что для семейства GeForce RTX 30 инженеры Nvidia разработали кардинально новый референс-дизайн, и в данном случае мы видим развитие эталонного дизайна для продуктов, имеющих более простую компоновку, всего 8 микросхем памяти и систему питания попроще. Как и в случае с GeForce RTX 3080 и GeForce RTX 3090, в Nvidia сделали два варианта дизайна PCB: для своих карт Founders Edition и для партнеров. Относительно решения из прошлого поколения новая фирменная карта получилась очень компактной при той же шине обмена с памятью.

Суммарное количество фаз питания у GeForce RTX 3070 — 11 (это на 1 больше, чем у GeForce RTX 2070 Super). При этом распределение фаз у GeForce RTX 2070 Super — 8 фаз на ядро и 2 на микросхемы памяти, а у GeForce RTX 3070 — 9+2. Физически имеется возможность установки еще одной фазы (на ней сэкономили).

Зеленым цветом отмечена схема питания ядра, красным — памяти. Давайте разбираться, кто за что отвечает. На плате есть три ШИМ-контроллера: uP9512R (uPI Semiconductor), рассчитанный на управление максимум 8 фазами, uS5650Q и uP1666Q (той же uPI). Все они расположены на оборотной стороне PCB. Полагаем, что для управления схемой питания GPU используется uP9512R, а помогает ему uP1666Q.

Тогда как на uS5650Q возложено управление 2 фазами питания микросхем памяти.

Остался лишь вопрос: какой контроллер отвечает за мониторинг состояния платы? Обычно мы видели для этой цели второй uS5650Q, но на данной плате он лишь один. Вопрос остался без ответа.

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае мосфеты схемы питания GPU AOZ5311NGI (Alpha&Omega Semiconductor) и мосфеты схемы питания памяти SM7342EKKP (Sinopower).

Как и у предыдущих карт Founders Edition серии GeForce RTX 30, у этой карты 12-контактный коннектор питания. Кстати, можно оценить, насколько GeForce RTX 3070 меньше своего старшего собрата.

Еще в начальном видеоролике мы упомянули, что ряд производителей блоков питания, прежде всего Seasonic, объявили о выпуске отдельных кабелей («хвостов») для своих модульных БП для подключения к референс-картам серии GeForce RTX 30. А с самой картой, конечно же, поставляется переходник, позволяющий подключить 8-контактный коннектор к новому разъему.

Нагрев и охлаждение

Мы уже дважды писали, что PCB у новых карт Founders Edition стала более компактной, ведь для таких карт была задумана специальная система охлаждения.

Эта схема едина для карт всей серии, хотя в случае GeForce RTX 3070 в дизайне имеются некоторые нюансы.

Основной пластинчатый радиатор, выполненный из медного сплава, имеет тепловые трубки, подведенные к теплосъемнику на GPU. Массивная основа (рама) охлаждает также микросхемы памяти и преобразователи питания VRM. Задняя пластина участвует в охлаждении оборотной стороны PCB.

Вентиляторов здесь два (∅90 мм), в обоих используются двойные подшипники. Особенность данной СО состоит в том, что вентиляторы установлены уже не с разных сторон радиатора (см. схему выше), а с одной.

Однако изначальный замысел сохранился: правый вентилятор продувает радиатор (ту его часть, куда выведены тепловые трубки) насквозь (через решетку на оборотной стороне). Нагретый воздух остается в корпусе (при типовой установке видеокарты он выдувается вверх), и его должен подхватить вытяжной вентилятор в корпусе системного блока. Левый же вентилятор сразу выдувает горячий воздух за пределы корпуса сквозь отверстия в брекете карты.

Напомним, что обычно видеокарты останавливают свои вентиляторы в простое, при работе в 2D, если температура GPU опускается ниже примерно 60 градусов, и СО при этом становится бесшумной. В случае карты Nvidia GeForce RTX 3070 Founders Edition режим работы кулера иной: для остановки вентиляторов температура GPU должна быть ниже 50 °C, температура чипов памяти — ниже 80 °C, а энергопотребление самого GPU — ниже 30 Вт. Только при соблюдении всех трех условий вентиляторы остановятся. Ниже есть видеоролик на эту тему, где в конце вентиляторы все же останавливаются.

Мониторинг температурного режима с помощью MSI Afterburner:

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 76 градусов, что является приемлемым результатом для видеокарты такого уровня.

Мы засняли и ускорили в 30 раз 10-минутный прогрев:

Максимальный нагрев наблюдался в районе преобразователей питания.

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 36 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось, поэтому шум сохранялся на прежнем уровне.

В режиме максимальной нагрузки в 3D температура достигала 76 °C. Вентиляторы при этом раскручивались до 2060 оборотов в минуту, шум вырастал до 34,4 дБА: это отчетливо слышно, на грани громкого шума, но еще не раздражает. В видеоролике ниже видно, как растет шум (шум фиксировался пару секунд через каждые 30 секунд — правда, пришлось очень долго ждать, пока вентиляторы остановятся).

С учетом того, какие компактные размеры имеет данная карта, шум можно считать приемлемым.

Подсветка

Подсветки у карты нет в принципе.

Так что данная видеокарта может «светить» лишь отраженным светом, как Луна 🙂

Комплект поставки и упаковка

Комплект поставки, кроме традиционного руководства пользователя, включает переходник питания на новый 12-контактный разъем с 8-контактного коннектора.

Опять же, как и у GeForce RTX 3080/3090, стильная упаковка вызывает восторг. Ощущение премиального продукта создается еще при виде коробки. Распаковка и восторги — в начальном ролике 🙂

Тестирование: синтетические тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i9-9900K (Socket LGA1151v2):
    • Компьютер на базе процессора Intel Core i9-9900KS (Socket LGA1151v2):
      • процессор Intel Core i9-9900KS (разгон 5,1 ГГц по всем ядрам);
      • ЖСО Cougar Helor 240;
      • системная плата Gigabyte Z390 Aorus Xtreme на чипсете Intel Z390;
      • оперативная память Corsair UDIMM (CMT32GX4M4C3200C14) 32 ГБ (4×8) DDR4 (XMP 3200 МГц) ;
      • SSD Intel 760p NVMe 1 ТБ PCI-E;
      • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
      • блок питания Seasonic Prime 1300 W Platinum (1300 Вт);
      • корпус Thermaltake Level20 XT;
    • операционная система Windows 10 Pro 64-битная; DirectX 12 (v.2004);
    • телевизор LG 43UK6750 (43″ 4K HDR);
    • драйверы AMD версии 20.9.2;
    • драйверы Nvidia версии 456.55/456.96;
    • VSync отключен.

Тесты GeForce RTX 3070 проводились в закрытом, хорошо продуваемом корпусе.

Мы провели тестирование видеокарты GeForce RTX 3070 со стандартными частотами в нашем наборе синтетических тестов. Он продолжает постоянно меняться, добавляются новые тесты, а некоторые устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Мы полностью отказались от ранее активно использовавшихся нами тестов RightMark3D, так как они устарели слишком сильно, и на столь мощных GPU или не запускаются вообще, или упираются в различные ограничители, не загружая работой блоки графического процессора и не показывая его истинную производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы все еще оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетического теста у нас также используется и довольно популярный 3DMark Time Spy, а также некоторые другие — например, DLSS и RTX.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce RTX 3070 со стандартными параметрами (RTX 3070)
  • GeForce RTX 3090 со стандартными параметрами (RTX 3090)
  • GeForce RTX 3080 со стандартными параметрами (RTX 3080)
  • GeForce RTX 2080 Ti со стандартными параметрами (RTX 2080 Ti)
  • GeForce RTX 2070 Super со стандартными параметрами (RTX 2070 Super)
  • Radeon VII со стандартными параметрами (Radeon VII)
  • Radeon RX 5700 XT со стандартными параметрами (RX 5700 XT)

Для анализа производительности новой видеокарты GeForce RTX 3070 мы выбрали несколько видеокарт из разных поколений компании Nvidia. Для сравнения с относительно аналогичным по позиционированию решением мы взяли RTX 2070 Super, но его почти не использовали в итоге, так как сравнение с RTX 2080 Ti — самым дорогим решением предыдущего семейства Turing — еще более интересно. Также есть на диаграммах и результаты пары верхних моделей RTX 3080 и RTX 3090, чтобы определить, насколько медленнее них получился младший GPU архитектуры Ampere.

Как мы уже упоминали, соперников для GeForce RTX 3070 у компании AMD для нашего сегодняшнего сравнения просто не существует. Ждем выхода новых Radeon архитектуры RDNA2, а пока что снова сравниваем новинку Nvidia с тем, что есть — с парой видеокарт: Radeon VII присутствует в качестве самого быстрого решения, хоть уже и давно исчезнувшего из продажи, а Radeon RX 5700 XT выступает как наиболее производительный графический процессор архитектуры RDNA первого поколения.

Мы традиционно рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они все же получаются несколько заниженными для некоторых из GPU. Слегка урезанный GA104 в исполнении RTX 3070 имеет меньшее количество текстурных модулей, по сравнению с RTX 2080 Ti и RTX 3080 (3090), поэтому вполне объяснимо им уступает. Хотя отставание от Turing получилось несколько меньше, чем должно быть исходя из теоретических показателей — RTX 2080 Ti работает менее эффективно.

Сравнивать новинку с условными конкурентами компании AMD сложно, можно разве что отметить высокую скорость текстурирования у Radeon VII — так получается из-за большого количества текстурных блоков у этой модели. Посмотрим, что с количеством и возможностями TMU сделают в архитектуре RDNA2, но Radeon всегда имели сравнительно большое количество блоков текстурирования и с такими задачами обычно справляются несколько лучше видеокарт конкурента того же ценового позиционирования.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Radeon RX 5700 имеет отличные теоретические показатели, подтверждающиеся практическими результатами в этом тесте, скорость заполнения у этой модели весьма высока, она обгоняет даже RTX 3090.

Видеокарты компании Nvidia по скорости заполнения сцены почти всегда были не так хороши, но если сравнивать разные поколения, то хорошо видно, что GeForce RTX 3070 в этом тесте оказалась на треть быстрее топовой RTX 2080 Ti из семейства Turing, что также выше теоретической разницы — Ampere и в этом тесте работает эффективнее. Более низкий результат RTX 3080 объясним тем, что мы тестировали эту модель на старых драйверах, а более новая версия была оптимизирована. Что касается сравнения с RX 5700 XT, и чипам семейства Ampere нужны другие нагрузки, чтобы показать свою силу, а скорость заполнения у них достаточна для реальных применений.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель видеокарты GeForce RTX 3070 показала вполне ожидаемый результат по сравнению с RTX 3080 и RTX 3090, заметно уступив им. Что касается быстрейшей платы предыдущего поколения, то она также оказалась впереди — видимо, меньшая скорость текстурных выборок или ПСП сегодняшней новинки все же сильнее сказываются на результатах, по сравнению с остальными параметрами. Если сравнивать RTX 3070 с Radeon, то хотя графические процессоры AMD в этом тесте всегда были сильны, но у этой компании пока что просто нет GPU, схожего с GA104 по мощности.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Читайте также:  Firefox from windows to linux

Скорость рендеринга в этом тесте должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы в который раз получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они просто неверны. И модель RTX 3070 ничего не изменила, естественно, так как дело в драйверах, которые одинаковы для всех GPU.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они чуть ближе к истине, чем в прошлом подтесте этого же бенчмарка. Представленные видеокарты Nvidia и в этот раз необъяснимо медленны, и хотя лидером в нем является GeForce RTX 3090, но Radeon RX 5700 XT довольно близка к ней. Ну а RTX 3070 вполне логично уступила старшим моделям на основе архитектуры Ampere, и совсем немного опередила RTX 2080 Ti.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно ближе к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новая архитектура Ampere должна бы раскрыть свои уникальные возможности, показав результат заметно выше предыдущего поколения, но увы — видимо, тест слишком устарел и не показывает современные GPU с лучшей стороны.

Наиболее мощное решение компании Nvidia на основе архитектуры Ampere обгоняет всех остальных, да и RTX 3080 следует за ней, а представленная сегодня RTX 3070 идет за ними вместе с RTX 2080 Ti, разница между ними составляет всего 3%. Этого не хватило, чтобы обойти Radeon VII, хотя она уже очень стара и сравнивать с ней смысла особого нет, но AMD вот-вот должны анонсировать архитектуру RDNA2 и решения на ее основе, сравнение с которыми будет куда более интересным. А сейчас рассмотрим более современные тесты, использующие повышенную нагрузку на GPU.

Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.

В первом Direct3D11-тесте новая GeForce RTX 3070 ожидаемо отстала от RTX 3080, а вот RTX 2080 Ti немного отстала от новинки, что неплохо для последней. Понятно, что RTX 3090 еще дальше впереди, мы не стали сравнивать новинку с ней в этой серии тестов, как и с RX 5700 XT, оставив лишь более мощную Radeon VII. По опыту предыдущих тестов мы знаем, что GeForce в этом тесте выступают не очень хорошо, и ожидаемые вскоре новинки AMD могут выиграть соперничество в этом тесте. Хотя, судя по крайне высокой частоте кадров, вычисления в этом примере из SDK уже слишком просты для мощных видеокарт, и лучше рассматривать другие тесты.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU. С этим дела лучше всего обстоят у решений Nvidia, хотя видеокарты семейства RDNA чуть улучшили позиции конкурирующей компании. Если рассматривать RTX 3070 по сравнению с топовым решением из предыдущего поколения Turing, то разница в этот раз в пользу RTX 2080 Ti. Ну хоть Radeon VII остался далеко позади.

Ну и третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. При тестировании мы использовали настройки по умолчанию.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Новая видеокарта GeForce RTX 3070 показала равный с RTX 2080 Ti результат, что более-менее близко к теории. Единственная представленная в сравнении Radeon слишком далеко от всех GeForce. Но мы снова обращаем внимание на то, что частота кадров и тут снова слишком высока — очередная задача является слишком простой, особенно для современных GPU из топовых серий.

Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.

Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.

Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU в целочисленных вычислениях. Все решения Nvidia отлично справились с такими операциями, и новая GeForce RTX 3070 показала результат хуже RTX 3080, что понятно, но уступила и RTX 2080 Ti, что несколько странно. Впрочем, единственная Radeon VII тут в разы хуже всех GeForce — вероятнее всего, дело в недостатке программной оптимизации.

Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.

В этом тесте видеокарты Nvidia доминировали всегда, так что сегодняшний расклад сил неудивителен. Производительность в нем зависит от драйвера, командного процессора и мультипроцессоров GPU. Наш предыдущий опыт говорит также о влиянии программной оптимизации драйвера на результаты теста, и в этом смысле видеокартам AMD похвастать обычно нечем, но подождем новых решений архитектуры RDNA2. Рассматриваемая сегодня GeForce RTX 3070 справилась с задачей совсем чуть медленнее RTX 3080, но опередила топовую RTX 2080 Ti из предыдущего поколения Turing.

Последний пример с поддержкой D3D12 — известный тест nBody Gravity. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.

По количеству кадров в секунду видно, что эта вычислительная задача довольно сложна, хотя современные GPU справляются с ней заметно легче предыдущих поколений. Сегодняшняя новинка GeForce RTX 3070, основанная на лишь слегка урезанной версии графического процессора GA104, показала приличный результат, немного уступила RTX 3080, и на четверть превзошла по производительности RTX 2080 Ti. Вероятно, в этой сложной математической задаче сработал и удвоенный темп FP32-вычислений и улучшения в подсистеме кэширования. Ну а Radeon VII в этой задаче новинке не конкурент, так что ждем RDNA2.

В качестве дополнительного вычислительного теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.

Если рассматривать производительность новой модели GeForce RTX 3070 в этой задаче по сравнению с RTX 3080 и RTX 3090, то тут все понятно — новинка медленнее этих моделей ровно так, как должна. А вот сравнение с RTX 2080 Ti из прошлого поколения куда интереснее. Если в первом подтесте RTX 3070 чуть быстрее, то во втором уже уступила, хоть и также совсем немного — разница во всех случаях не достигает даже 2 FPS.

Также интересно и то, что для Ampere получает чуть большее ускорение при включении асинхронного исполнения. Если говорить о решениях AMD, то обе представленные в тестировании видеокарты Radeon отстают от всех GeForce, что неудивительно, так как одна из них очень старая, а другая — заметно более дешевая.

Специализированных тестов трассировки лучей пока что выпущено не так уж много. Одним из таких тестов производительности трассировки лучей стал бенчмарк Port Royal создателей известных тестов серии 3DMark. Полноценный бенчмарк работает на всех графических процессорах с поддержкой DXR API. Мы проверили несколько видеокарт Nvidia в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей и традиционным для растеризации методом.

Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и очень сильно загружает в том числе и мощные GPU, даже на GeForce RTX 3090 с трудом была достигнут уровень производительности 60 FPS в среднем. Но для сравнения производительности разных GPU в этой конкретной задаче тест отлично подходит.

Тест очень наглядно показывает разницу в поколениях видеокарт RTX на примере RTX 3070 и RTX 2080 Ti. Если при отрисовке отражений при помощи растеризации новинка совсем чуть-чуть быстрее, то включение трассированных отражений увеличивает разницу. В целом же, новинка показывает чуть более высокие результаты, по сравнению с RTX 2080 Ti, что соответствует нашим ожиданиям и настраивает на позитивный лад перед игровыми тестами. Также отметим, что хотя сцены 3DMark Port Royal требовательны к объему видеопамяти, но в этом разрешении рендеринга недостатка 8 ГБ у RTX 3070 не видно.

Переходим к полусинтетическим бенчмаркам, которые сделаны на игровых движках, и соответствующие проекты должны выйти в скором времени. Первым тестом стал Boundary — один из китайских игровых проектов с поддержкой RTX. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы выбрали максимально возможное.

Результат новой GeForce RTX 3070 объяснимо хуже, чем у RTX 3080 и RTX 3090. Зато новинка на 4%-6% быстрее RTX 2080 Ti из предыдущего семейства Turing, причем в Full HD они обе дают более чем 75 FPS, хотя условная предшественница новинки в виде RTX 2070 Super не обеспечила даже 60 FPS. И разница между ними в 4K оказалась вообще полуторакратной, как и обещала Nvidia. В 4K-разрешении вообще только старшие видеокарты линейки RTX 30 обеспечили приемлемую частоту кадров, хотя и ниже 60 FPS, но в реальных условиях можно использовать менее качественный вариант DLSS.

Второй полуигровой бенчмарк также основан на грядущей китайской игре — Bright Memory. Интересно, что оба теста довольно похожи по результатам и по качеству изображения, хотя по тематике они совсем разные. И все же этот бенчмарк еще чуть более требователен, особенно к производительности трассировки лучей. В нем новый графический процессор GA104 из семейства Ampere обеспечил преимущество над RTX 2080 Ti в 5%, но лишь в Full HD. А в 4K начал сказываться недостаток 8 ГБ локальной видеопамяти у новинки, но она все равно показала идентичный с RTX 2080 Ti результат. RTX 2070 Super отстала от них в этом тесте примерно на треть.

Графические процессоры семейства Ampere заметно быстрее в задачах трассировки лучей, по сравнению с аналогами из прошлого семейства Turing. Более продвинутым решениям помогают и улучшенные RT-ядра и удвоенный темп FP32-вычислений, и улучшенное кэширование — архитектура выглядит лучше сбалансированной именно для подобных задач с применением трассировки.

Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Новая модель GeForce RTX 3070 показала очень хорошие результаты в LuxMark, объяснимо отстав лишь от RTX 3080 и RTX 3090. А вот преимущество над RTX 2080 Ti составило 20%-30%! Вот такие математически-интенсивные нагрузки с большим влиянием кэширования лучше всего подходят для новой архитектуры Ampere, в этом тесте новые GPU не оставляют шансов и конкурентам и предшественникам. Но окончательные выводы мы будем делать в обзоре решений на чипах архитектуры RDNA2, хотя низкий результат Radeon RX 5700 XT (на основе RDNA1) настораживает, тот же Radeon VII тут гораздо сильнее.

Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. В прошлых тестах мы использовали разные версии бенчмарка: которая выдает результат в виде времени, затраченного на рендеринг и в виде количества миллионов просчитанных путей за секунду.

Этот тест также показывает программную трассировку лучей и новая GeForce RTX 3070 в нем оказалась медленнее лишь RTX 3080 и RTX 3090 той же архитектуры, имеющих более высокую цену. А остальные видеокарты остались позади — так, разница между RTX 3070 и RTX 2080 Ti выросла до полуторакратной! Это еще один сильный результат в сложных вычислительных тестах для архитектуры Ampere, которой лучше подходят такие задачи, с кучей FP32-вычислений, требовательных к скорости и объему кэш-памяти. Radeon RX 5700 XT тут сильно отстает, но подождем RDNA2.

Рассмотрим еще одно приложение рендеринга — OctaneRender. Это довольно популярный рендерер, который можно использовать в большинстве приложений для создания 3D-контента, а главное, что он использует возможности CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке. Приведем общее количество очков:

Новая модель GeForce RTX 3070 ожидаемо уступила старшим представителям семейства, а вот сравнение с RTX 2080 Ti из прошлого поколения получилось весьма любопытным. Наглядно видна разница между семействами RTX 30 и RTX 20. Если с использованием CUDA для рендеринга эти две модели оказались равны, то включение аппаратного ускорения RTX дало прирост на RTX 3070 куда больший. Если на Turing включение RTX дает дополнительно около 10%, то на Ampere сразу до 28%! Явно сказывается повышенная производительность RT-ядер в Ampere, а также удвоенный темп FP32-вычислений и улучшенное кэширование.

Мы решили включить в материал отдельные тесты второй версии технологии DLSS, хотя ранее уже были проведены тесты с применением DLSS в приложениях с трассировкой лучей, мы посчитали полезным сделать и отдельное тестирование в 4K-разрешении, а вот 8K-разрешение для RTX 3070 с 8 ГБ памяти не имеет смысла. Рассмотрим результаты четырех GPU в более низком разрешении, но с DLSS максимального качества:

Без включения технологии DLSS, рендеринг производится в полном 4K-разрешении, и 8 ГБ локальной видеопамяти у RTX 3070 для этого явно маловато, и она сильно отстала от RTX 3080 и RTX 3090. Сравнение с Turing интереснее, но и непонятнее. В полном 4K-разрешении RTX 3070 даже чуть быстрее RTX 2080 Ti, хотя у нее меньше видеопамяти, а вот в режиме DLSS, включение которого позволяет поднять производительность до приемлемой, сегодняшняя новинка показывает результат хуже, чем топовый графический процессор семейства Turing — отставание почти на 10% довольно существенно. Вероятно, так получается из-за того, что в 4K-разрешении основным фактором, ограничивающим производительность, является трассировка лучей, с которой Ampere справляется несколько лучше.

Тестирование: игровые тесты

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

  • Gears 5 (Xbox Game Studios/The Coalition)
  • Wolfenstein: Youngblood (Bethesda Softworks/MachineGames/Arkane Studios)
  • Death Stranding (505 Games/Kojima Productions)
  • Red Dead Redemption 2 (Rockstar)
  • Star Wars Jedi: Fallen Order (Electronic Arts/Respawn Entertainment)
  • Control (505 Games/Remedy Entertainment)
  • Deliver Us The Moon (Wired Productions/KeokeN Interactive)
  • Resident Evil 3 (Capcom/Capcom)
  • Shadow of the Tomb Raider (Eidos Montreal/Square Enix), HDR включен
  • Metro Exodus (4A Games/Deep Silver/Epic Games)

Источник

Оцените статью