Что означает приставка super в видеокарте
Новые подробности о SUPER видеокартах от NVIDIA
Уже скоро, 2 июля, компания NVIDIA обновит модельный ряд ускорителей семейства Turing и представит новинки, в названии которых будет фигурировать приставка Super. В число новинок войдут: GeForce RTX 2080 Super, RTX 2070 Super и RTX 2060 Super. При этом подробно протестированы в независимых обзорах в день анонса будут лишь RTX 2070 Super, и RTX 2060 Super, которые поступят в продажу неделей позднее — 9 июля. Видеокарта GeForce RTX 2080 Super фактически выйдет позже.
В связи с тем, что до выхода GeForce RTX 2070 Super и RTX 2060 Super остается всего несколько дней, сайт VideoCardz.com смог получить доступ к официальной справочной документации на эти модели, и благодаря этому можно подробнее рассмотреть новинки.
GeForce RTX 2070 Super окажется улучшенным вариантом обычной GeForce RTX 2070 с увеличенным числом CUDA-процессоров и разогнанными частотами ядра. В основе этой видеокарты лежит чип TU104-410, доставшийся по наследству от видеокарт GeForce RTX 2080, но подсистема видеопамяти при этом останется такой же. Тем не менее, NVIDIA утверждает, что GeForce RTX 2070 Super будет показывать лучшую производительность по сравнению с GeForce GTX 1080 Ti и окажется в среднем на 16% быстрее обычных версий GeForce RTX 2070. Правда, все имеет свое цену, и величина TDP для RTX 2070 Super установлена в 215 Вт.
GeForce RTX 2060 Super будет еще сильнее прокачана по сравнению с предшественницей. В ней будет применяться чип TU106-410, будет увеличено число CUDA-ядер и повышены частоты. NVIDIA добавит в RTX 2060 Super немного видеопамяти, суммарный объем которой составит 8 Гбайт GDDR6.
Прирост производительности GeForce RTX 2060 Super по сравнению с обычной RTX 2060 должен быть около 15%, что сделает эту видеокарту даже более шустрой, чем GeForce GTX 1080. Но опять имеем увеличение TDP до 175 Вт.
Полные характеристики новинок в сравнении с предшественницами приводятся в таблице ниже.
Окончательные характеристики GeForce RTX 2080 Super пока скрыты, но по слухам она должна стать быстрее, чем Titan Xp поколения Pascal.
Также пока неизвестна финальная информация по поводу цен новых видеокарт. А учитывая грядущий выход нового поколения видеокарт AMD, можно ждать сюрпризов и даже откровенного демпинга со стороны зеленых.
Обзор нового видеоускорителя Nvidia GeForce GTX 1660 Super: когда более быстрая память приносит огромные дивиденды
Оглавление
Справочные материалы:
Теоретическая часть: особенности архитектуры
Сегодняшним анонсом компания Nvidia продолжает череду выпуска улучшенных модификаций видеокарт семейства Turing, и анонсированные новинки не стали для нас большой неожиданностью. Ведь что обычно заставляет выпускать новые модели? Ситуация на рынке, выпуск конкурентами более удачных и выгодных решений — именно тогда производителям приходится отвечать на них улучшением характеристик своих обновленных решений.
Примерно так получилось и в этот раз. AMD вроде бы анонсировала свои графические решения семейства Radeon RX 5500, но цен они пока не указали, да и продажи еще не начались. Однако Nvidia все же решила сразу ответить сопернику, выпустив свои примерные аналоги по производительности в виде двух новых моделей видеокарт: GeForce GTX 1660 Super и GeForce GTX 1650 Super. Подробно мы в этот раз рассмотрим только первую из них — младшая выйдет на рынок лишь в конце ноября.
Как и ранее выпущенные модели с приставкой Super, модифицированные GTX 1660 и GTX 1650 имеют улучшенные характеристики производительности, хотя используют тот же чип TU116, что и остальные решения семейства GeForce GTX 1660. Nvidia утверждает, что GeForce GTX 1660 Super в полтора раза быстрее весьма удачной для своего времени GeForce GTX 1060, а GeForce GTX 1650 Super получилась аж вдвое быстрее, чем GeForce GTX 1050.
Обе новинки относятся к семейству GeForce GTX 16, которое не имеет RT-ядер и тензорных ядер. Зато эти видеокарты специально созданы для достижения максимально возможной производительности и энергоэффективности в рамках запланированного транзисторного бюджета — для современных игр без трассировки лучей. Ну и в популярных многопользовательских проектах новинки способны обеспечить игрокам приличный прирост производительности, важный для повышения результативности в сетевых сражениях.
Так что обе новые видеокарты предлагают неплохое сочетание производительности и цены и должны стать одним из наиболее выгодных вариантов для модернизации игровых ПК с устаревшими видеокартами. Большое количество игроков до сих пор играют на видеокартах старше серии GeForce GTX 10, выпущенных много лет назад, и для них новые модели подойдут как нельзя лучше.
Так как рассматриваемая сегодня видеокарта компании Nvidia основана на графическом процессоре архитектуры Turing, имеющей очень много общего с предыдущими архитектурами Pascal и Volta, то перед прочтением материала мы советуем ознакомиться с нашими предыдущими статьями:
GeForce GTX 1660 Super — это очередная улучшенная модель Nvidia, получившая приставку Super. Она немного ускорена по сравнению с «обычной» моделью с таким же индексом, но и GTX 1660 пока что остается в продаже. Семейство GeForce GTX 1660 теперь состоит из трех модификаций: новая GTX 1660 Super предлагает отличный баланс производительности и цены, тогда как GeForce GTX 1660 Ti имеет максимальную производительность, а GeForce GTX 1660 пока еще будет продаваться по меньшей цене по сравнению с новинкой — как наиболее доступный вариант GTX 1660.
В GeForce GTX 1660 Super используется все та же 192-битная шина памяти, что и у старшего варианта, но вместо дешевой GDDR5 установлена более производительная и современная GDDR6-память. Объем видеопамяти остался неизменным — 6 ГБ, и в течение актуального жизненного цикла ускорителя для видеокарты уровня GTX 1660 Super этого будет вполне достаточно для разрешения Full HD.
По потреблению энергии новинка не сильно ушла от «обычной» модели на TU116 — она потребляет 125 Вт, это чуть-чуть больше, чем GTX 1660. Как и старшая и младшая модели, основная масса видеокарт GeForce GTX 1660 Super довольствуется одним 8-контактным разъемом дополнительного питания PCI Express, а количество и тип разъемов вывода информации на дисплеи зависит исключительно от конкретной карты. Сам же GPU поддерживает все те же разъемы и стандарты DVI, HDMI, DisplayPort и VirtualLink, что и более мощные решения семейства.
Как и другие модели на TU116, видеокарта GTX 1660 Super не имеет референсного варианта, и производители видеокарт делают собственные платы на основе внутреннего эталонного дизайна. Видеокарты этой модели доступны в рознице сразу со дня анонса, партнеры компании Nvidia выпустили сразу по несколько вариантов новых видеокарт, отличающихся дизайном платы, систем питания и охлаждения, а некоторые из них имеют фабричный разгон. Выпуск варианта Founders Edition самой Nvidia в этот раз не планируется.
Архитектурные особенности
Улучшенная GeForce GTX 1660 Super по своим характеристикам очень похожа на вышедшую ранее в этом же году простую GeForce GTX 1660. Обе они основаны на идентичном чипе семейства Turing, не имеющем аппаратной поддержки трассировки лучей и тензорных ядер для ускорения задач глубинного обучения. Зато этот графический процессор является одним из самых энергоэффективных решений в своем классе, да и в целом.
Чип TU116 в составе GeForce GTX 1660 Super включает 22 мультипроцессора SM, объединенных в три кластера GPC, и всего имеет 1408 вычислительных CUDA-ядер. Также в данной версии GPU содержится 88 текстурных модулей и 48 блоков ROP. Этого должно быть вполне достаточно для того, чтобы обеспечить отличную производительность в самых современных играх при разрешении Full HD.
Чтобы повысить привлекательность GeForce GTX 1660, в Nvidia решили выпустить супер-издание этой модели, которое имеет ровно такие же характеристики по количеству функциональных блоков и рабочие частоты, а единственным изменением стала установка высокопроизводительной памяти стандарта GDDR6, работающей на эффективной частоте в 14 ГГц, в отличие от сравнительно медленной GDDR5 у обычной GTX 1660. Подсистема памяти GTX 1660 Super содержит те же шесть 32-битных контроллеров памяти (всего 192-бит), к которым подключено 6 ГБ GDDR6-памяти.
Прирост пропускной способности видеопамяти составил 75% — от 192 ГБ/с у GTX 1660 до 336 ГБ/с у новой Super-модели. Вероятно, приросты скорости будут наблюдаться не во всех играх, но в большинстве современных проектов, так как многие из них упирались именно в пропускную способность памяти. И, благодаря увеличению ПСП, GeForce GTX 1660 Super показывает рост частоты кадров до 20%, по сравнению с GeForce GTX 1660. И чем современнее игра, тем сложнее графика, а значит и преимущество у Super будет больше.
Что касается тактовых частот графического процессора, то базовая частота новинки составляет 1530 МГц, а турбо-частота — 1785 МГц, что полностью соответствует частотам обычной модели без приставки Super. Как всегда для решений Nvidia, это не максимальная частота, а средняя для нескольких игр и приложений. Реальная частота в каждом случае будет отличаться, так как она зависит как от игры, так и от условий конкретной системы (питания, температура и т. п.).
В обзоре GeForce GTX 1660 Ti мы подробно писали об изменениях в TU116 и основных его возможностях. Чип по своим возможностям полностью соответствует старшим графическим процессорам семейства TU10x, кроме поддержки аппаратной трассировки лучей и ускорения задач глубокого обучения при помощи тензорных ядер. В архитектуре Turing инженеры компании Nvidia внедрили и множество других улучшений по сравнению с предыдущей архитектурой: одновременное исполнение операций с плавающей запятой FP32 и целочисленных INT32, значительно улучшенная система кэширования данных и несколько новых технологий рендеринга: программируемый конвейер обработки геометрии, переменная частота затенения, затенение в текстурном пространстве, улучшенная поддержка технологий DirectX 12, относящихся к уровню возможностей Feature Level 12_1.
По поводу всего того, что не связано с 3D-частью, в новой модификации видеокарты нет никаких изменений. В чипе все тот же обновленный блок вывода информации, поддерживающий дисплеи с высоким разрешением, HDR и высокой частотой обновления. Все платы GeForce RTX имеют порты DisplayPort 1.4a, позволяющие вывести информацию на 8K-монитор с частотой обновления 60 Гц с поддержкой технологии VESA Display Stream Compression (DSC) 1.2, обеспечивающей высокую степень сжатия.
Также все GPU семейства Turing содержат улучшенный кодировщик видеоданных NVEnc, добавляющий поддержку сжатия данных в формате H.265 (HEVC) при разрешении 8K и 30 FPS. Был обновлен и декодер видеоданных NVDec, получивший поддержку декодирования данных в формате HEVC YUV444 10-бит/12-бит HDR при 30 FPS, в формате H.264 при 8K-разрешении и в формате VP9 с 10-бит/12-бит данными. С другими возможностями семейства Turing вы можете познакомиться в большом обзоре GeForce RTX 2080 Ti.
Программные технологии и инициативы
При анонсах решений линейки, основанных на не самых новых GPU (с архитектурной точки зрения), особое внимание всегда уделяется программной части. В частности — различным улучшениям драйверов. Nvidia тут есть чем похвалиться, их драйверы имеют оптимизации под игры прямо со дня их выхода для более чем 30 проектов, вышедших за последние полгода.
Оптимизация под игры означает тесное сотрудничество Nvidia и игровых разработчиков, устранение различных ошибок, тонкую настройку и многочисленные улучшения производительности, поиск подходящих графических настроек и поддержку некоторых новых возможностей, доступных на видеокартах GeForce. Отметим улучшенную производительность — в некоторых играх прирост FPS после оптимизации достиг 30% (если сравнивать новый драйвер нового семейства 440 с апрельской версией 425.31).
Также появились новые возможности и по функциональности: стала доступной трассировка лучей на видеокартах линейки GeForce GTX, не имеющих аппаратных блоков для ускорения трассировки, в GeForce Experience появился постфильтр увеличения резкости (аналогичный решению конкурента), а в драйверах — целочисленное масштабирование разрешения, которое важно для некоторых старых игр с поддержкой низкого разрешения экрана. Добавлена и поддержка нескольких десятков новых моделей «G-Sync Compatible» мониторов.
Отдельно выделим новую возможность по совмещению режима с очень низкими задержками вывода на экран (Nvidia Ultra Low Latency — NULL) с G-Sync. Напомним, что режим NULL обеспечивает минимальные задержки, особенно важные при сетевых многопользовательских играх, и все это — при сохранении высокого качества изображения. Из действительно нового в этот раз — теперь этот режим поддерживает и G-Sync-мониторы, то есть к низким задержкам добавляется отсутствие артефактов типа разрыва изображения.
Ведь в чем заключается проблема подобных NULL алгоритмов — они действительно снижают задержки, но при этом остаются разрывы изображения от отключенной вертикальной синхронизации, а ее включение вызовет повышение задержек. Начиная с версии драйвера, который вышел вместе с GeForce GTX 1660 Super, поддерживается одновременная работа NULL и мониторов G-Sync, сочетающих их преимущества.
На диаграмме показана усредненная задержка времени от нажатия кнопки мыши до отображения соответствующего действия на мониторе на GTX 1660 Super в играх Rainbow Six, Apex Legends, Fortnite и Overwatch. То есть небольшое увеличение задержки при включении G-Sync в дополнение к NULL гарантирует отсутствие разрывов изображения на экране. Разницы в задержке между выключенным V-Sync и включенным G-Sync практически не остается, и игрок волен выбирать, что для него лучше подходит.
Также очень полезным дополнением является то, что в GeForce Experience была добавлена поддержка фильтров формата известной утилиты ReShade, служащей для изменения визуального стиля картинки — это постфильтры, накладываемые утилитой сверху на готовое изображение, полученное от игры.
С последней версией драйверов и утилиты GeForce Experience игроки смогут использовать сотни фильтров ReShade прямо в Freestyle и Ansel, что сильно упрощает процесс для пользователя. Ведь обычно ReShade устанавливается и встраивается отдельно для каждой игры, а поддержка ReShade-фильтров в GeForce Experience позволит с легкостью использовать их в более чем 650 играх при помощи Freestyle и Ansel.
Единственное, что нужно заметить — Nvidia ограничивает использование некоторых фильтров в киберспортивных многопользовательских играх. В таких играх при помощи Freestyle можно включить 14 оригинальных фильтров и более 30 фильтров ReShade, а в остальных количество доступных фильтров ReShade вырастает до более чем 70 штук.
Пользовательские фильтры ReShade недоступны для киберспортивных игр, но их можно применять во всех остальных. Ansel со специальной поддержкой разработчика игры, позволяет использовать все фильтры ReShade, а без такой поддержки можно включить более 30 фильтров.
Неудивительно, что Nvidia также захотела обновить и собственный фильтр улучшения резкости. Это очень важно в наше время, когда к изображению применяется множество постфильтров, включая методы полноэкранного сглаживания с использованием временной компоненты, которые порой излишне замыливают картинку. И как раз фильтр повышения резкости поможет избавиться от этого «мыла». Благо в варианте Nvidia он работает во всех играх, использующих версии DirectX от 9 до 12, а поддержка Vulkan и OpenGL игр ожидается в скором будущем.
С выходом GeForce GTX 1660 Super на рынок, компания решила перенести возможность для повышения резкости изображения в играх из внешней утилиты GeForce Experience прямо в панель управления Nvidia. И теперь постфильтр включается в настройках драйвера, вместе с другими параметрами. Это тот же постфильтр, что ранее был в составе Freestyle, он имеет пару дополнительных настроек.
Также поддерживается использование постфильтра резкости в игровых профилях, и для каждого из них можно выбрать собственные значения настроек. Предлагается и масштабирование разрешения на GPU, когда изображение отрисовывается в меньшем разрешении и увеличивается до выходного. При выборе настройки «GPU Upscaling» все разрешения ниже родного для вашего монитора будут масштабироваться графическим процессором.
Интересно, что семейство Turing имеет некоторое преимущество перед Pascal и в этом деле. Новые GPU поддерживают более качественный алгоритм масштабирования, по сравнению с простым билинейным в предыдущих GPU. Кроме всего этого, была повышена производительность постфильтра увеличения резкости, и при его включении она теперь снижается еще меньше, чем ранее.
Стриминг видео высокого качества
Представленная сегодня новинка обеспечивает высокую производительность и качество изображения при потоковой передаче видеоданных — захвате экрана для трансляции в интернете. Кодировщик NVEnc (Nvidia Encoder), встроенный во все GPU семейства Turing, начиная с GTX 1650 Super, обеспечивает чуть более высокую производительность при лучшем качестве видео по сравнению с программным кодером x264 при использовании профилей Very Fast и Fast.
Решения Nvidia поддерживают кодирование видео в форматах 4K при 60 FPS для H.264 и 8K при 30 FPS для H.265, они показывают хорошие результаты при сжатии видеороликов с мелкими деталями вроде текстовой информации и детальными текстурами, которые не теряют качества в движении. Подобное качество видеосжатия можно достичь и без кодировщика в GPU, при использовании мощных многоядерных CPU, но с ними есть свои проблемы.
Использование части ресурсов CPU для кодирования видео может привести к их нехватке для игровой логики и рендеринга, что вызовет неприятные рывки частоты кадров и дискомфорт, ведь загрузка процессора при кодировании видео того же качества будет заметно более высокой. Nvidia сравнивает качество их видеокодировщика с программным кодированием на дополнительном ПК, занимающимся исключительно захватом и сжатием видеопотока с профилем x264 Medium.
Кодер NVEnc во всех чипах Turing работает на 15% эффективнее (обеспечивает меньший битрейт при том же качестве) при сжатии в формате H.264 и на 25% — для формата H.265. Для этого используются многочисленные референсные кадры, которые кодировщик использует вместо просто предыдущих кадров. Также новый кодер включает оптимизации параметров кодирования RDO (Rate Distortion Optimization), при которых используются вектора движения для минимизации искажений. RDO позволяет эффективнее сжимать видеопоток, получая повышение качества при снижении нагрузки.
Решение с двумя ПК приводит к необходимости лишних финансовых затрат и сложностей с конфигурированием и поддержкой подобных систем. Чтобы достичь такого же результата по качеству, достаточно мощностей одного GPU семейства Turing, начиная с GeForce GTX 1650 Super. Для этих аппаратных возможностей графических процессоров компании есть программная поддержка в самых популярных пакетах ПО для стриминга: Open Broadcaster Software (OBS) и XSplit.
Пакет OBS используется сейчас большинством стримеров, и Nvidia работает с разработчиками этого ПО для улучшения качества картинки. Версии OBS, начиная с 23.0, имеют поддержку Nvidia Video Codec SDK, тогда как предыдущие использовали недостаточно эффективный FFMPEG. Новый подход позволяет захватывать и кодировать кадры прямо внутри GPU, не используя оперативную память ПК в качестве посредника, что увеличивает производительность. Также Nvidia Video Codec SDK позволяет регулировать качество кодирования при помощи задания дополнительных параметров.
Предварительная оценка производительности
В линейке GTX 1660 теперь есть целых три модификации, отличающиеся как по количеству функциональных блоков, так и по их частоте и типу видеопамяти. Попробуем наглядно оценить разницу между разными моделями видеокарт на основе графического процессора TU116, добавив к ним одну из моделей прошлого поколения, схожей по рыночному позиционированию:
Видно, что если по сравнению с «обычным» GeForce GTX 1660 новый «супер» и не показывает огромного прироста (разница между ними, в основном, заключается в типе и частоте работы микросхем видеопамяти), то GTX 1060 из предыдущего поколения даже по теоретическим показателям прилично проигрывает новинке, особенно по ПСП.
Но благодаря повышенной эффективности нового TU116, по данным компании Nvidia, в играх при Full HD-разрешении GTX 1660 Super оказывается до полутора раз быстрее своего предшественника из семейства Pascal, да и над обычным вариантом GTX 1660 преимущество бывает довольно существенным — все же ПСП много значит для современных игр:
К слову, примерно то же самое касается и GTX 1650 Super, которая выйдет 22 ноября и будет отличаться GDDR6-памятью, работающей на частоте в 12 ГГц. И даже более того, ее преимущество над GTX 1050 в тех же играх зачастую достигает двукратного (по данным Nvidia, мы пока не тестировали эту модель).
И чем новее игра, тем больший прирост получают новые видеокарты семейства GTX 1600 с приставкой Super. Так, если GTX 1660 Super обгоняет GTX 1060 с 6 ГБ памяти в старых играх (The Division, Doom 4, Battlefield 1 и других) лишь на 30%-35%, то в таких проектах, как Control, Call of Duty: Modern Warfare, The Division 2 и других (см. изображение ниже) разница достигает уже 40%-50%!
В общем, новая модель GeForce GTX 1660 Super предназначена для среднего ценового сегмента и нацелена на игры в разрешении Full HD. В этом разрешении новинка должна обеспечить отличную производительность во всех современных играх при высоких или даже максимальных настройках, в том числе и с включенным полноэкранным сглаживанием. Super-модель опережает обычную GTX 1660 за счет быстрой работы с видеопамятью, а GTX 1060 из прошлого поколения заметно уступает ей по эффективности.
Особенности видеокарты Nvidia GeForce GTX 1660 Super
Объект исследования: ускоритель трехмерной графики (видеокарты) MSI GeForce GTX 1660 Super Ventus XS OC Edition 6 ГБ 192-битной GDDR6
Характеристики карты
MSI GeForce GTX 1660 Super Ventus XS OC Edition 6 ГБ 192-битной GDDR6 | |
---|---|
Параметр | GeForce GTX 1660 Super |
GPU | Nvidia TU116 |
Интерфейс | PCI Express x16 |
Частота работы GPU (ROPs), МГц | 1530—1785(Boost)—1965(Max) |
Частота работы памяти (физическая (эффективная)), МГц | 3500 (14000) |
Ширина шины обмена с памятью, бит | 192 |
Число вычислительных блоков в GPU | 22 |
Число операций (ALU) в блоке | 64 |
Суммарное количество блоков ALU | 1408 |
Число блоков текстурирования (BLF/TLF/ANIS) | 88 |
Число блоков растеризации (ROP) | 48 |
Число блоков Ray Tracing | — |
Число тензорных блоков | — |
Размеры, мм | 220×100×36 |
Количество слотов в системном блоке, занимаемые видеокартой | 2 |
Цвет текстолита | черный |
Энергопотребление пиковое в 3D, Вт | 122 |
Энергопотребление в режиме 2D, Вт | 26 |
Энергопотребление в режиме «сна», Вт | 11 |
Уровень шума в 3D (максимальная нагрузка), дБА | 34,5 |
Уровень шума в 2D (просмотр видео), дБА | 25,4 |
Уровень шума в 2D (в простое), дБА | 25,4 |
Видеовыходы | 1×HDMI 2.0b, 3×DisplayPort 1.4 |
Поддержка многопроцессорной работы | нет |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 |
Питание: 8-контактные разъемы | 1 |
Питание: 6-контактные разъемы | 0 |
Максимальное разрешение/частота, Display Port | 3840×2160@120 Гц (7680×4320@30 Гц) |
Максимальное разрешение/частота, HDMI | 3840×2160@60 Гц |
Максимальное разрешение/частота, Dual-Link DVI | 2560×1600@60 Гц (1920×1200@120 Гц) |
Максимальное разрешение/частота, Single-Link DVI | 1920×1200@60 Гц (1280×1024@85 Гц) |
Средняя цена карты на момент написания обзора | рекомендованная: 17 990 рублей |
Память
Карта имеет 6 ГБ памяти GDDR6 SDRAM, размещенной в 6 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6, MT61K256M32JE-14) рассчитаны на номинальную частоту работы в 3500 (14000) МГц. Расшифровщик кодов на упаковках FBGA находится здесь.
Особенности карты и сравнение с GeForce GTX 1660
MSI GeForce GTX 1660 Super Ventus XS OC Edition 6 ГБ | Gigabyte GeForce GTX 1660 |
---|---|
вид спереди | |
вид сзади | |
GTX 1660 Super основан на том же TU116, что и GTX 1660, поэтому мы и сравниваем плату с GTX 1660 (с картой Gigabyte, поскольку референс-образцов не было). В целом мы видим, что определенная схожесть разводки имеется, это прежде всего касается размещения микросхем памяти.
А вот конвертеры питания у карт совсем разные — впрочем, причиной является не возросшие потребности GTX 1660 Super в сравнении с GTX 1660, а просто разный подход производителей карт.
Схема питания ядра у карты MSI построена на базе 4-фазного преобразователя и управляется цифровым контроллером uP9512 производства uPI, а схема питания микросхем памяти уже имеет 2-фазную структуру, и ею управляет отдельный контроллер uP1666Q.
Набор видеовыходов стандартно-современный (3 DP и 1 HDMI). Подвод питания осуществляется через один 8-контактный разъем.
Карта поддерживает технологию Nvidia G-Sync.
Подсветки у карты нет.
Охлаждение и нагрев
Главной частью кулера карты MSI является пластинчатый радиатор из алюминиевого сплава, который зигзагом пересекает тепловая трубка. Поверх установлен кожух с двумя вентиляторами, работающими на одинаковой частоте вращения. Микросхемы памяти охлаждаются вместе с GPU, а силовые транзисторы имеют свой небольшой радиатор. С оборотной стороны карта прикрывается специальной пластиной, которая обеспечивает только жесткость и защиту печатной платы.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):
После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 67 градусов, что является хорошим результатом для видеокарт такого уровня.
Максимальный нагрев — в центральной области карты: вокруг GPU и около силовых преобразователей.
Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.
Оценка градаций уровня шума следующая:
В режиме простоя в 2D температура была не выше 32 °C, вентиляторы работали на частоте 1500 оборотов в минуту. Шум составлял 25,4 дБА.
При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы работали на тех же оборотах, шум сохранялся на уровне 25,4 дБА.
В режиме максимальной нагрузки в 3D температура достигала 67 °C. Вентиляторы при этом раскручивались до 1937 оборотов в минуту, шум вырастал до 34,5 дБА. Так что шум различим, какие-то пользователи смогут с ним мириться, а кому-то покажется шумновато.
Комплект поставки и упаковка
Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, носитель с драйверами и утилитами. Перед нами базовый комплект.
Синтетические тесты
Наш пакет синтетических тестов все еще в процессе становления, мы бы хотели добавить еще больше примеров с вычислениями (compute shaders), но с этим есть определенные сложности. В будущем мы постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — пишите их в комментариях к статье или отправьте почтой.
Из ранее активно использовавшихся нами тестов RightMark3D мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.
Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей. В качестве полусинтетического теста у нас также используется и популярный 3DMark Time Spy, помогающий определить прирост от асинхронных вычислений.
Синтетические тесты проводились на следующих видеокартах:
Для анализа производительности новой видеокарты GeForce GTX 1660 мы взяли эти решения по следующим причинам. Естественно, что в первую очередь мы сравнили анонсированную модель с GTX 1660 Ti и GTX 1660, как самыми близкими по возможностям видеокартами из того же подсемейства. Посмотрим, что дает «суперу» установка GDDR6-памяти, а также поймем, насколько GTX 1660 Ti на полноценном чипе TU116 быстрее новинки.
В качестве соперников из стана компании AMD для GeForce GTX 1660 Super в нашем сравнении выступили две видеокарты моделей Radeon RX 590 и RX 580 на архитектуре Polaris. Обе они дешевле новинки Nvidia, и значит, что это сравнение будет условным. Старшее решение архитектуры Polaris продается чуть дешевле, а младшее — значительно дешевле. Конечно, было бы куда интереснее сравнить рассматриваемую сегодня новинку с Radeon RX 5500, но у нас ее до сих пор нет.
Мы сильно сократили состав DirectX 10-тестов из RightMark3D, оставив только несколько примеров с наибольшей нагрузкой на GPU. Первая пара тестов измеряет производительность выполнения относительно простых пиксельных шейдеров с циклами при большом количестве текстурных выборок (до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Оба примера включают самозатенение и шейдерный суперсэмплинг, увеличивающий нагрузку на видеочипы.
Первый тест пиксельных шейдеров — Fur. При максимальных настройках в нем используется от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Производительность в данном тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ.
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD в лидерах еще со времен выхода первых графических процессоров архитектуры GCN. Совершенно неудивительно, что даже недорогие видеокарты архитектуры Polaris до сих пор сильно выглядят в очередном сравнении, что говорит о большей эффективности выполнения ими подобных программ.
Рассматриваемая нами сегодня видеокарта модели GeForce GTX 1660 Super показала результат на уровне GTX 1660 — просто потому, что производительностью в этом тесте не ограничена пропускной способностью памяти, а по всем остальным характеристикам эти модели абсолютно идентичны. Если сравнивать Super-карту с условными конкурентами, то она показала результат значительно хуже обеих моделей Radeon.
Следующий DX10-тест Steep Parallax Mapping также измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. При максимальных настройках он использует от 80 до 400 текстурных выборок из карты высот и несколько выборок из базовых текстур. Этот шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, в том числе и такие варианты как steep parallax mapping. Кроме того, в нашем тесте мы включили самозатенение, увеличивающее нагрузку на видеочип в два раза, и суперсэмплинг, также повышающий требования к мощности GPU.
Диаграмма очень похожа на предыдущую, разве что в этом тесте видеокарты GeForce выступили лучше относительно Radeon. Но новинка также ничуть не быстрее GTX 1660 — ПСП не влияет на производительность и в этом тесте, что неудивительно, так как он чисто шейдерный. Урезанный чип TU116 догнал разве что Radeon RX 580, а более серьезный конкурент компании AMD впереди, хотя даже RX 590 стоит дешевле, чем GTX 1660 Super. Остается надеяться, что в более сложных DirectX 11 и 12 тестах новинка Nvidia окажется сильнее.
Из пары тестов пиксельных шейдеров с минимальным количеством текстурных выборок и относительно большим количеством арифметических операций, мы выбрали более сложный, так как они уже порядком устарели и уже не измеряют чисто математическую производительность GPU. Да и за последние годы скорость выполнения именно арифметических инструкций в пиксельном шейдере не так важна, большинство вычислений перешли в compute shaders. Итак, тест шейдерных вычислений Fire — текстурная выборка в нем лишь одна, а количество инструкций типа sin и cos равно 130 штукам. Впрочем, для современных GPU это семечки.
В математическом тесте из нашего RightMark мы часто получаем результаты, довольно далекие от теории и сравнений в других аналогичных бенчмарках. Вероятно, столь мощные платы ограничивает что-то, не относящееся к скорости вычислительных блоков, так как GPU при тестировании чаще всего не загружены работой на 100%. Рассматриваемая сегодня GeForce GTX 1660 Super в этом тесте лишь чуть-чуть опережает GTX 1660, хотя и GTX 1660 Ti ушла вперед недалеко — похоже, что все они упираются во что-то неведомое, но точно не ПСП.
Условно конкурирующий с новинкой GPU компании AMD стал лучшим в сравнении — модель Radeon RX 590 снова оказалась быстрее новой видеокарты GeForce из семейства Turing, но в этот раз ее преимущество уже невелико. Но не нужно забывать, что настоящим конкурентом для новинки станет что-то из более новых моделей Radeon, которые еще не продаются, но появятся до конца года.
Переходим к тесту геометрических шейдеров. В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, но один из них (Hyperlight, демонстрирующий использование техник: instancing, stream output, buffer load, использующий динамическое создание геометрии и stream output), на всех видеокартах компании AMD не работает, поэтому мы решили оставить лишь второй — Galaxy. Техника в этом тесте аналогична point sprites из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Вычисления производятся в геометрическом шейдере.
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек. Задача для мощных современных GPU довольно простая, но разница между разными моделями видеокарт есть. Интересен результат новой GeForce GTX 1660 Super, в сложном подтесте она показала результат даже чуть выше уровня GTX 1660 Ti, а в простом проиграла даже простой GTX 1660. Похоже, что дело в разной оптимизации драйверов.
Зато новинка обошла обе пару видеокарт Radeon, особенно большой получилась разница при высокой геометрической сложности. В этом тесте разница между видеокартами на чипах Nvidia и AMD явно в пользу решений калифорнийской компании, что обусловлено отличиями в геометрических конвейерах GPU. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, так как их чипы имеют сравнительно большое количество блоков по обработке геометрии.
Ну и последним тестом из Direct3D 10 станет скорость большого количества текстурных выборок из вершинного шейдера. Из пары имеющихся у нас тестов с использованием displacement mapping на основании данных из текстур, мы выбрали тест Waves, имеющий условные переходы в шейдере и поэтому более сложный и современный. Количество билинейных текстурных выборок в данном случае составляет 24 штуки на каждую вершину.
Результаты в тесте вершинного текстурирования Waves в очередной раз оказались довольно странными. Новая GeForce GTX 1660 Super уступила не только старшей модели, но и показала скорость ниже уровня GTX 1660, чего быть не должно в принципе. Мы знаем, что графические процессоры Nvidia упираются во что-то необъяснимое в этом тесте, особенно в самых простых условиях, но производительность новой модели GPU не должна быть ниже GTX 1660. Снова что-то программное в драйверах, похоже.
Мы традиционно рассматриваем также и синтетические тесты из пакета 3DMark Vantage, ведь они иногда показывают нам то, что мы упустили в тестах собственного производства. Feature тесты из этого тестового пакета также обладают поддержкой DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новой видеокарты GeForce мы сделаем какие-то полезные выводы, ускользнувшие от нас в тестах пакета RightMark 2.0.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя у семейства Turing они получаются несколько заниженными, что мы отмечали и ранее. Сегодняшняя новинка отстает от GTX 1660 Ti почти столько же, сколько и GTX 1660, то есть все соответствует теории — ведь разница между «простым» и «супер» вариантами только в ПСП, которая не влияет на скорость текстурирования.
А вот условным конкурентам AMD с меньшей ценой представленная сегодня GeForce GTX 1660 Super уступает. Radeon RX 590 и RX 580 по скорости текстурирования очень сильны, так как они имеют большое количество блоков TMU и с этой задачей справляются явно лучше. Возможно, в реальных условиях дело обстоит несколько иначе, и мы узнаем это по результатам игровых тестов.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.
Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Сегодняшние измерения подтвердили это — новинка имеет точно такой же филлрейт, что и GTX 1660, и обе они отстают от GTX 1660 Ti, так что ПСП на результате не сказывается.
Взятые в виде конкурентов видеокарты Radeon RX 590 и RX 580 по скорости заполнения сцены явно уступают в этом тесте сегодняшней новинке, так как имеют мало блоков ROP. Новая GTX 1660 Super показала значительно большую скорость рендеринга, но сражаться ей предстоит с будущими решениями AMD, у которых этих блоков должно быть больше.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно важный тест, так как результаты в нем неплохо коррелируют с тем, что получается в игровых тестах.
Интересно, что тут важны не только математическая и текстурная производительность, но и ПСП, которая как раз и повысилась у GTX 1660 Super относительно младшей модели. И в этой «синтетике» из 3DMark Vantage новая супер-модель показала очень хороший результат между GTX 1660 Ti и вариантом на том же TU116 с GDDR5-памятью. А вот старшему из Radeon новинка уступила, так как графические процессоры AMD в этом тесте всегда были сильны.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы в который раз получаем явно некорректные результаты в этом тесте. Все видеокарты GeForce показывают очень низкую скорость, с этим тестом давно что-то не так. Это подтверждает и то, что Super-вариант оказался даже чуть быстрее GTX 1660 Ti, что невозможно, исходя из теории.
В таких условиях какое-либо сравнение с Radeon для GeForce GTX 1660 Super просто бессмысленно. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, платы Radeon именно в этом тесте по какой-то причине работают заметно лучше, и старшая модель оказалась вдвое быстрее всех видеокарт GeForce в сравнении.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они хотя бы несколько реалистичнее. Сегодняшняя новинка Nvidia снова оказалась между GTX 1660 Ti и GTX 1660, так что ПСП на результат подтеста также влияет. Сравнение новой супер-модели с представленными в этом материале видеокартами компании AMD показывают небольшое преимущество у старшей из них, которая стоит дешевле видеокарты Nvidia.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В этом математическом тесте производительность решений не совсем соответствует теории, но она ближе к пиковой производительности видеочипов в предельных задачах, и ПСП тут точно не влияет на результат. Поэтому GeForce GTX 1660 Super в этом тесте оказалась на уровне GTX 1660, строго в соответствии с теорией. В этом чисто синтетическом тесте используются только операции с плавающей запятой, и новая архитектура Turing не может использовать свои уникальные возможности и показать достойный результат.
Видеочипы компании AMD с архитектурой GCN справляются с подобными задачами лучше — они всегда хороши в тех случаях, когда выполняется интенсивная «математика» в предельных режимах. Radeon RX 590 в этом тесте стала явным победителем, да и RX 580 обошла все GeForce. Но далее мы рассмотрим более современные тесты, использующие повышенную нагрузку на GPU, и показатели всех решений Nvidia в них должны быть лучше.
Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.
Первый Direct3D11-тест тоже не особенно раскрывает возможности архитектуры Turing, и все видеокарты GeForce в нем проиграли единственному конкуренту в виде Radeon RX 590, который оказался быстрее. Сегодняшняя новинка удивительным образом опередила две предыдущие модели с индексом 1660, но дело тут явно в программной оптимизации. Впрочем, судя по очень высокой частоте кадров, вычисления в этом примере из SDK слишком простые, и мощные GPU все равно не могут показать свои способности.
Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.
Производительность рендеринга в этом тесте зависит от оптимизации драйвера и командного процессора GPU. И с этим у всех решений Nvidia все в порядке, поэтому все видеокарты GeForce с запасом опередили единственную представленную плату компании AMD. Сегодняшняя новинка совсем чуть-чуть проиграла GTX 1660 Ti на полном чипе TU116, опередив обычную GTX 1660, так что ПСП в этом тесте тоже важна.
Ну и третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно интересный. При тестировании мы использовали настройки по умолчанию.
В этом примере производительность зависит и от скорости блоков растеризации и пропускной способности памяти, и так как по этим параметрам видеокарты Nvidia выигрывают у Radeon RX 590, то они оказались впереди. Удивил результат новой модели GeForce GTX 1660 Super, которая оказалась заметно быстрее двух других видеокарт на том же GPU. Это не объяснить разницей в теоретических показателях.
Больше похоже на то, что Nvidia оптимизировала видеодрайвер, вышедший вместе с новинкой семейства Turing. Хорошо, если это скажется не только в этом синтетическом тесте, но и во всех играх, применяющих карты теней. Впрочем, частота кадров слишком высокая в любом случае и задача легка даже для GPU средней мощности.
Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.
Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.
Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU. Решения Nvidia в тесте неплохо справляются с этими операциями, а одновременное исполнение INT32- и FP32-инструкций на графических процессорах TU116 дает им дополнительное преимущество. GTX 1660 Super снова оказалась быстрее GTX 1660 Ti, что не объяснить теорией. Похоже, что новый драйвер действительно хорош! Также отметим, что новая видеоплата Nvidia оказалась заметно быстрее условного конкурента в виде Radeon RX 590.
Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.
Производительность в этом тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Все видеокарты компании Nvidia справились с задачей отлично (с учетом большого количества обрабатываемой геометрии), но анонсированная сегодня GTX 1660 Super удивила еще раз, показав скорость быстрее всех, так что вывод о важности оптимизации драйвера подтверждается. А единственная Radeon от конкурента очень сильно отстала от всех GeForce, как и все остальные карты AMD в наших предыдущих тестах — драйверы этой компании нуждаются в улучшении.
И последний пример с поддержкой D3D12 — уже известный нам nBody Gravity тест, но в другом варианте. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.
По количеству кадров в секунду видно, что вычисления в этой задаче довольно сложны. Сегодняшняя новинка GeForce GTX 1660 Super, основанная на графическом процессоре TU116, показала средний результат между старшей и младшей моделями, что объяснимо разницей в ПСП. Решение конкурирующей компании осталось позади, хотя не нужно забывать, что оно продается дешевле, а скоро у сегодняшней новинки появится настоящий соперник.
В качестве дополнительного синтетического теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Так мы поймем, изменилось ли что-то в поддержке async compute в Turing. Для верности мы протестировали видеокарты Nvidia в двух разрешениях экрана и двух графических тестах.
Сразу отметим, что прирост от включения асинхронных вычислений в Time Spy составляет порядка 5%-10%, в зависимости от режима. В новых графических процессорах Nvidia одновременное исполнение разных типов вычислений было улучшено, на одном и том же шейдерном мультипроцессоре архитектуры Turing теперь могут запускаться и графические и вычислительные шейдеры. Но бенчмарк Time Spy использует эти возможности слабо, поэтому и разница между режимами невелика.
Если рассматривать производительность GeForce GTX 1660 Super в этой задаче по сравнению с другими видеокартами этой подсерии, то новинка Nvidia удивительным образом оказалась почти на уровне GTX 1660 Ti. То есть, в этом тесте очень важна именно пропускная способность памяти, по которой обычная GTX 1660 заметно уступает моделям с GDDR6. Также вероятны программные оптимизации в новом драйвере. Свежая модель на урезанном чипе TU116 также оказалась заметно быстрее условного соперника в лице Radeon RX 590, хотя он и стоит дешевле.
Мы все еще находимся в поиске бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается уже довольно старый и не слишком хорошо оптимизированный тест трассировки лучей, но не аппаратной — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.
Новая модель GeForce GTX 1660 Super на удивление снова оказалась быстрее GTX 1660 Ti, и это снова остается списать на программные оптимизации, потому что GTX 1660 Ti по всем параметрам должен быть быстрее. Если же сравнить новинку с GTX 1660, то Super заметно опережает такой же GPU с GDDR5, что говорит о том, что для задач трассировки лучей ПСП очень важна.
Высокие результаты всех чипов семейства Turing также обусловлены и изменениями в системе кэширования, и во многом благодаря этому они в целом оказались быстрее одного из своих условных конкурентов в виде Radeon RX 590. Впрочем, подождем выхода новых решений на RDNA, чтобы сделать окончательные выводы.
Еще одним тестом вычислительной производительности графических процессоров является V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества архитектуры Turing. Учтите, что в данном тесте выдается результат в виде времени, затраченного на рендеринг, и чем он ниже — тем лучше.
Мы уже отмечали, что архитектура Turing пока что не получила преимуществ от своих архитектурных оптимизаций в тесте V-Ray, улучшенное кэширование никак не сказалось в нем. Но результаты всех плат GeForce все равно заметно выше, чем у единственной видеокарты AMD Radeon RX 590 — похоже, что этот рендерер лучше оптимизирован именно под видеокарты калифорнийской компании.
В результате, новая GeForce GTX 1660 Super опережает единственное представленное решение AMD почти вдвое. Что касается сравнения с другими платами Nvidia, то сегодняшняя новинка снова удивила, обогнав GTX 1660 Ti, хоть и совсем чуть-чуть. Впрочем, и обычная GTX 1660 отстала совсем немного — похоже, тут важнее всего кэширование данных, а в этом все три GPU близки.
Игровые тесты
Конфигурация тестового стенда
Список инструментов тестирования
Во всех играх использовалось максимальное качество графики в настройках.
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | −1,5 | +9,5 | +10,0 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +22,9 | +15,0 | +25,7 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +69,6 | +73,6 | +109,5 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +5,6 | +8,7 | −4,0 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +7,1 | +8,7 | +14,3 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +31,6 | +38,9 | +41,2 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +12,9 | +11,8 | +13,9 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +10,7 | +16,9 | +7,9 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +42,5 | +40,7 | +41,4 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +12,0 | +22,4 | +9,4 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +6,9 | +12,7 | +16,7 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +34,8 | +65,1 | +45,8 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +6,4 | +7,6 | +43,5 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +11,1 | +18,3 | +22,2 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +35,1 | +39,2 | +94,1 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +14,6 | +18,2 | +8,0 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +5,8 | +5,4 | +17,4 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +14,6 | +25,8 | +42,1 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +32,5 | +30,0 | +52,6 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +3,9 | +2,6 | +3,6 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +43,2 | +56,0 | +70,6 |
Разница в производительности, %
Исследуемая карта | в сравнении с | 1920×1200 | 2560×1440 | 3840×2160 |
---|---|---|---|---|
GeForce GTX 1660 Super | Radeon RX 590 | +12,6 | +10,3 | +10,3 |
GeForce GTX 1660 Super | GeForce GTX 1660 | +20,2 | +15,4 | +19,4 |
GeForce GTX 1660 Super | GeForce GTX 1060 6 ГБ | +40,8 | +38,9 | +53,6 |
Рейтинг iXBT.com
Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon RX 550 (то есть сочетание скорости и функций Radeon RX 550 приняты за 100%). Рейтинги ведутся по 28 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят GeForce GTX 1660 Super и его конкуренты.
Для расчета рейтинга полезности использованы розничные цены на конец октября 2019 года.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
15 | GTX 1660 Ti 6 ГБ, 1500—1965/12000 | 590 | 333 | 17 700 |
16 | GTX 1070 8 ГБ, 1507—1797/8000 | 550 | 253 | 21 700 |
17 | GTX 1660 Super 6 ГБ, 1530—1965/14000 | 540 | 318 | 17 000 |
18 | RX 590 8 ГБ, 1469—1545/8000 | 480 | 316 | 15 200 |
19 | GTX 1660 6 ГБ, 1530—1960/8000 | 480 | 338 | 14 200 |
GeForce GTX 1660 Super логично занял промежуточную позицию между GTX 1660 и GTX 1660 Ti, находясь ближе к первому и лишь чуть-чуть отставая от GTX 1070 (собственно, GTX 1070 потерял актуальность уже после выхода GTX 1660 Ti). Также мы видим, что GTX 1660 Super обошел своего конкурента из стана AMD — Radeon RX 590. Впрочем, это конкурент условный, так как средняя цена на RX 590 сейчас уже опустилась ниже 16 000 рублей. Однако другого нет: следующий за RX 590 ускоритель Radeon RX 5700 намного дороже, и он является соперником даже не GTX 1660 Ti, а RTX 2060.
Рейтинг полезности
Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
02 | GTX 1660 6 ГБ, 1530—1960/8000 | 338 | 480 | 14 200 |
03 | GTX 1660 Ti 6 ГБ, 1500—1965/12000 | 333 | 590 | 17 700 |
08 | GTX 1660 Super 6 ГБ, 1530—1965/14000 | 318 | 540 | 17 000 |
09 | RX 590 8 ГБ, 1469—1545/8000 | 316 | 480 | 15 200 |
19 | GTX 1070 8 ГБ, 1507—1797/8000 | 253 | 550 | 21 700 |
Несмотря на рекомендованную Nvidia розничную цену в 17 990 рублей, мы взяли в качестве условной цены для GTX 1660 Super 17 000, учитывая тот факт, что сейчас GTX 1660 Ti в среднем стоят 17 700 рублей (можно найти и дешевле), а также то, что выпуск GTX 1660 Super (по словам Nvidia) нацелен на замену простых GTX 1660 (их уже прекратили выпускать, дальше будут распродаваться складские остатки). Да, возможно, мы чрезмерно оптимистичны, но в любом случае в обзорах серийных видеокарт на базе GTX 1660 Super мы будем видеть реальные цены, и выводы автоматически скорректируются.
Выводы
Ранее мы писали, что выпуск в линейке видеоускорителей RTX 2xxx новых моделей с приставкой Super преследует цель улучшить соотношение производительности и цены. По идее, это должно быть справедливо и в случае GTX 16xx, однако, к сожалению, выставленные Nvidia рекомендованные цены явно не способствуют этим целям. Фактически GTX 1660 Ti уже дешевле, чем должен быть GTX 1660 Super, и это без учета аппетитов нашей алчной торговли — мы уверены, что на первом этапе в рознице GTX 1660 Super действительно будет дороже, чем GTX 1660 Ti, хотя последний быстрее. Надеемся, что рынок скорректирует эту ситуацию до нормальной.
GeForce GTX 1660 Super предназначен для тех энтузиастов ПК-игр, которые планируют играть в разрешении Full HD при использовании максимальных настроек качества. Подход Nvidia при создании GTX 1660 Super несколько отличается от виденного нами ранее в случае моделей семейства 20xx Super. Ранее при создании версий Super компания использовала полную версию тех же GPU (разблокировав еще пару мультипроцессоров SM), плюс инженеры немного повышали частоту работы GPU и видеопамяти. Здесь же (в случае GTX 1660 Super) ограничились заменой типа памяти. И огромный прирост производительности относительно простого GTX 1660 достигается исключительно за счет резкого роста ПСП (до 336 ГБ/с против 192 ГБ/с у GTX 1660). Это говорит о том, что у GTX 1660 общая производительность чрезмерно упиралась в частоту работы памяти и ее ПСП, то есть GPU зачастую работал вхолостую, ожидая относительно медленную локальную видеопамять. Наверняка про это прекрасно знали инженеры Nvidia, сознательно замедлив GTX 1660, чтобы обеспечить большой разрыв между ним и GTX 1660 Ti. Как и в случае с RTX 20xx Super, все это говорит о хорошем планировании действий Nvidia при выпуске новых продуктов, когда еще при запуске новой линейки думают о последующих «рефрешах».
Очевидно, что GTX 1660 Super прилично быстрее конкурента в лице Radeon RX 590 (в среднем на 14%), однако последний на сегодня несколько дешевле. И как показали наши расчеты, чтобы опережать конкурентов по соотношению производительности и цены, карты на основе GTX 1660 Super должны быть дешевле 17 000 рублей (на момент публикации данного материала).
Конечно, семейство GTX 16xx не поддерживает такие новые технологии семейства GeForce RTX, как трассировка лучей и «умный» DLSS на основе тензорных ядер. Однако у архитектуры Turing есть и другие улучшения по сравнению с Pascal. Инженеры Nvidia серьезно переработали мультипроцессоры для повышения количества операций, выполняемых за каждый такт, заодно повысив и общую эффективность новых GPU. Важнейшим изменением стало появление выделенных блоков для исполнения целочисленных инструкций, которыми раньше занимались те же FP32-блоки. INT32-операции теперь выполняются параллельно с FP32, что повысило эффективность исполнения сложных программ, все чаще использующих целочисленные операции, хотя вычисления с плавающей запятой и остаются главными для GPU. В Turing появилась новая возможность выполнения операций с плавающей запятой пониженной точности с удвоенным темпом.
По карте MSI, на примере которой мы изучали GTX 1660 Super, можем добавить следующее. MSI GeForce GTX 1660 Super Ventus XS OC Edition имеет эффективную, но шумноватую систему охлаждения и компактные габариты, занимая 2 слота в системном блоке (повышенный шум — расплата за размеры). Впрочем, как мы уже говорили, после массового распространения трехслотовых видеокарт понятие «стандартные габариты 3D-ускорителей», наверное, модифицировалось, и сегодня 2-слотовые видеокарты воспринимаются как изящные 🙂
Еще раз хочется поблагодарить Nvidia за выпуск программы FrameView, которая не привязана ни к каким семействам карт, работает на любых видеоускорителях и обеспечивает наглядный мониторинг.
Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту