Допустимая температура видеокарты nvidia gtx 1650

Обзор видеоускорителя Nvidia GeForce GTX 1650: Turing спускается в бюджетный сегмент

Оглавление

Справочные материалы:

Теоретическая часть: особенности архитектуры

Как быстро бежит время. Прошло уже более восьми месяцев с анонса линейки видеокарт GeForce, основанной на графических процессорах семейства Turing, и за это время было выпущено много моделей GPU. Nvidia традиционно идет от топовой модели вниз, выпуская все менее дорогие варианты, входящие в состав линеек GeForce RTX и GeForce GTX. В апреле пришло время и для самой дешевой видеокарты на основе текущей архитектуры Turing, которая получила наименование GeForce GTX 1650.

Новое решение заняло ценовую нишу $149 (на североамериканском рынке) и стало бюджетным вариантом Turing без поддержки аппаратной трассировки лучей и ускорения глубокого обучения. Оно предназначено для игры в разрешении Full HD при не самых высоких настройках графики. Напомним, что после выхода четверки мощных видеокарт линейки GeForce RTX 2000, ставших первыми решениями с аппаратным ускорением трассировки лучей, компания Nvidia выпустила и менее дорогие варианты Turing, известные под кодовыми именами TU11x, под торговой маркой GeForce GTX 1600.

Применяемые в этой линейке GPU менее сложны за счет отказа от выделенных специализированных блоков (RT и тензорных ядер) и поэтому дешевле в производстве, что отлично подходит для бюджетной серии. Сначала Nvidia выпустила пару карт GTX 1660: обычную и с приставкой Ti, обе основаны на разных версиях чипа TU116. Теперь младшая серия была расширена при помощи модели GeForce GTX 1650, получившей еще менее сложный графический процессор.

Рассматриваемая сегодня новинка основана на графическом процессоре TU117, также не имеющем RT-ядер и тензорных ядер. Зато этот GPU имеет максимально возможную энергоэффективность в рамках определенного транзисторного бюджета, что важно для современных игр без применения трассировки лучей. Благодаря архитектурным улучшениям, по производительности и энергоэффективности видеокарты семейства Turing превосходят аналогичные GPU из предыдущих семейств компании Nvidia.

Модель GeForce GTX 1650 выглядит довольно интересным решением для обновления видеоподсистемы тех игроков, кто еще не сделал апгрейд на решения линейки GeForce GTX 10 и до сих пор использует видеокарты уровня GeForce GTX 950 или ниже. Новинка предлагает таким пользователям уровень производительности примерно вдвое выше, что особенно важно для требовательных современных игр, но и в самых популярных многопользовательских проектах новый GPU способен дать приличный прирост скорости рендеринга.

Так как рассматриваемая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры Turing, имеющей много общего с предыдущими архитектурами Pascal и Volta, перед прочтением материала мы советуем ознакомиться и с другими нашими статьями:

  • [14.03.19] Nvidia GeForce GTX 1660 — Turing уже в массовом сегменте
  • [12.03.19] Nvidia GeForce GTX 1660 Ti — новая «промежуточная» линейка на Turing, но без технологий GeForce RTX
  • [19.09.18] Nvidia GeForce RTX 2080 Ti — обзор флагмана 3D-графики 2018 года
  • [14.09.18] Игровые видеокарты Nvidia GeForce RTX — первые мысли и впечатления
  • [06.06.17] Nvidia Volta — новая вычислительная архитектура
Графический ускоритель GeForce GTX 1650
Кодовое имя чипа TU117
Технология производства 12 нм FinFET
Количество транзисторов 4,7 млрд
Площадь ядра 200 мм²
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 128-битная: 4 независимых 32-битных контроллера памяти с поддержкой памяти типов GDDR5 и GDDR6
Частота графического процессора 1485 (1665) МГц
Вычислительные блоки 14 (из 16 в чипе) потоковых мультипроцессоров, включающих 896 (из 1024) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32
Блоки текстурирования 56 (из 64) блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 4 широких блока ROP (32 пикселя) с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка подключения по интерфейсам HDMI 2.0b и DisplayPort 1.4a
Спецификации референсной видеокарты GeForce GTX 1650
Частота ядра 1485 (1665) МГц
Количество универсальных процессоров 896
Количество текстурных блоков 56
Количество блоков блендинга 32
Эффективная частота памяти 8 ГГц
Тип памяти GDDR5
Шина памяти 128 бит
Объем памяти 4 ГБ
Пропускная способность памяти 128 ГБ/с
Вычислительная производительность (FP16/FP32) 6,0/3,0 терафлопс
Теоретическая максимальная скорость закраски 53 гигапикселя/с
Теоретическая скорость выборки текстур 94 гигатекселя/с
Шина PCI Express 3.0
Разъемы зависит от видеокарты
Энергопотребление до 75 Вт
Дополнительное питание нет (зависит от видеокарты)
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $149 (11 990 рублей)

Наименование видеокарты отличается от старшей модели GTX 1660 численным значением, что выглядит логично и соответствует принятой системе наименования видеокарт Nvidia. Как и другие бюджетные модели, видеокарта GTX 1650 не имеет референсного варианта, и производители видеокарт сделали собственные платы на основе внутреннего эталонного дизайна. В продажу сразу же поступило множество вариантов с различными характеристиками и системами охлаждения.

GeForce GTX 1650 заменяет в линейке модель предыдущего поколения GTX 1050, которая также была урезана аналогичным образом, но цены на Turing повысились по сравнению с Pascal и в этом случае, как и во всей новой линейке. Если GTX 1050 имел рекомендованную цену в $109, то GTX 1650 продается по цене от $149, так что он ближе к GTX 1050 Ti, который имел рекомендованную цену в $139. Впрочем, в этом поколении все цены выросли — каждая из видеокарт семейства Turing продается дороже аналогичной по позиционированию карты на чипе Pascal.

Что касается конкурента, то у AMD есть многочисленные варианты из линейки Radeon RX 500, и они имеют очень хорошее сочетание цены и производительности. Вероятно, правильнее всего будет сравнивать новинку с двумя вариантами Radeon RX 570: с 8 ГБ и 4 ГБ памяти. Младшая модель Radeon RX 570 будет выглядеть привлекательнее за счет меньшей цены, а старшая — за счет большего объема видеопамяти. Впрочем, у Turing (пусть и в урезанном виде) также есть свои преимущества.

В GeForce GTX 1650 используется проверенное сочетание 128-битной шины памяти и GDDR5-памяти. Возможные варианты объема видеопамяти понятны: 2 ГБ, 4 ГБ или 8 ГБ, и минимальный объем видеопамяти для GTX 1650 повысили до 4 ГБ, моделей с 2 ГБ быть не должно, в отличие от имеющихся подобных вариантов GTX 1050. Меньшего объема VRAM уже откровенно мало, а больший вряд ли будет полезен для этой ценовой категории, поэтому и была выбрана золотая середина — 4 ГБ.

Неудивительно, что младшая модель Turing также потребляет энергии меньше остальных видеокарт семейства. Все предыдущие решения этого позиционирования у Nvidia имели энергопотребление до 75 Вт, и GTX 1650 не выбилась из этого ограничения. Так что при референсных частотах этот GPU не требует дополнительного питания и ему хватит 75 Вт, получаемых по шине. Впрочем, партнеры компании могут решить этот вопрос альтернативным методом, установив разъем питания для большего разгона (фабричного или пользовательского) и лучшей стабильности.

Количество и тип разъемов вывода информации на дисплеи зависит исключительно от конкретной карты — кто-то из производителей ставит больше разъемов, кто-то меньше, и кто-то решит выделиться необычным набором из серой массы стандартных решений. Сам же по себе новый GPU поддерживает все те же разъемы и стандарты DVI, HDMI, DisplayPort и VirtualLink, что и более мощные решения семейства.

Архитектурные особенности

Как мы уже отмечали в обзоре GeForce GTX 1660 Ti, главное отличие TU11x от TU10x — отсутствие аппаратных блоков для ускорения трассировки лучей и тензорных ядер. Это сделано для того, чтобы недорогие графические процессоры были менее сложными и эффективнее справлялись с традиционным рендерингом. В результате, графический процессор TU117, как и TU116, получился значительно проще по количеству транзисторов и площади по сравнению с самым слабым из «полноценных» чипов семейства Turing.

По сути, это упрощенная версия TU116 с меньшим количеством исполнительных блоков, но теми же поддерживаемыми технологиями. Из TU116 как будто были удалены: треть CUDA-ядер, треть каналов памяти и блоков ROP, и все это для того, чтобы получить сравнительно простой GPU для бюджетного решения. Впрочем, эта простота относительна — с его то 200 мм² площадью и 4,7 млрд транзисторов, получился практически такой же по размеру чип, как GP106, известный нам по GeForce GTX 1060 — и он явно более высокого класса.

Для наглядности разницы между различными моделями графических процессоров предлагаем рассмотреть характеристики нескольких видеокарт Nvidia из последних поколений, близких друг к другу по цене:

GTX 1650 GTX 1660 GTX 1050 Ti GTX 1050
Кодовое имя GPU TU117 TU116 GP107 GP107
Кол-во транзисторов, млрд 4,7 6,6 3,3 3,3
Площадь кристалла, мм² 200 284 132 132
Базовая частота, МГц 1485 1530 1290 1354
Турбо-частота, МГц 1665 1785 1392 1455
CUDA-ядра, шт 896 1408 768 640
Производительность FP32, TFLOPS 3,0 5,0 2,1 1,9
Блоки ROP, шт 32 48 32 32
Блоки TMU, шт 56 88 120 80
Объем видеопамяти, ГБ 4 6 4 2
Шина памяти, бит 128 192 128 128
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, ГГц 8 8 7 7
ПСП памяти, ГБ/с 128 192 112 112
Энергопотребление TDP, Вт 75 120 75 75
Рекомендованная цена, $ 149 219 139 109

Модификация TU117 в составе GeForce GTX 1650 имеет два кластера GPC, содержащие 896 CUDA-ядер, что совсем немногим больше, чем у GeForce GTX 1050, но из-за архитектурных улучшений в Turing, производительность новинки должна быть выше даже при прочих равных. Новый чип имеет в своем составе 32 блока ROP и 128-битную шину памяти, обеспечивающую работу GDDR5-памяти на эффективной частоте в 8 ГГц. Итоговая пропускная способность памяти получается 128 ГБ/с, что лишь немногим выше аналогичного показателя для GTX 1050.

Интересно, что CUDA-ядра работают на несколько меньшей тактовой частоте, по сравнению с другими решениями семейства Turing — графический процессор GTX 1650 работает на турбо-частоте в 1665 МГц. Чисто теоретически, GTX 1650 должен обеспечить примерно две трети производительности от старшей модели в линейке Nvidia — GeForce GTX 1660, но на практике может быть даже чуть ближе к ней.

Вполне возможно, что в дальнейшем на основе TU117 будут выпущены и еще какие-то решения, но пока что речь идет исключительно о GeForce GTX 1650, модели с приставкой Ti не было выпущено. Что тем более интересно, так как в GTX 1650 применяется не полная версия чипа TU117. У этой версии выключен один кластер TPC, состоящий из пары мультипроцессоров SM по 64 CUDA-ядер. Так что у Nvidia есть еще небольшой задел для маневра — к примеру, ускоренного по тактовой частоте полноценного TU117 с большим количеством ядер в виде GTX 1650 Ti.

Если сравнивать по пиковым показателям, то GTX 1650 должна обеспечить около 60%-70% производительности GTX 1660, а по сравнению с GTX 1050 новая видеокарта быстрее решения архитектуры Pascal вообще по всем показателям, и даже GTX 1050 Ti уступает новинке. Но главное преимущество Turing заключается в архитектурных улучшениях и максимальной эффективности. В обзоре GeForce GTX 1660 Ti мы подробно писали об изменениях в TU116 и основных его возможностях, это же относится и к TU117. Эти чипы по своей функциональности соответствует старшим графическим процессорам семейства TU10x, за исключением поддержки аппаратной трассировки лучей и ускорения задач глубокого обучения при помощи тензорных ядер.

В архитектуре Turing инженеры компании Nvidia внедрили множество других улучшений по сравнению с предыдущей архитектурой: одновременное исполнение операций с плавающей запятой FP32 и целочисленных INT32, значительно улучшенная система кэширования данных и несколько новых технологий рендеринга: программируемый конвейер обработки геометрии, переменная частота затенения, затенение в текстурном пространстве, улучшенная поддержка технологий DirectX 12, относящихся к уровню возможностей Feature Level 12_1.

Архитектурой Turing поддерживаются новые технологии для увеличения производительности в играх: Variable Rate Shading (VRS) — переменная частота затенения, Texture-Space Shading — затенение в текстурном пространстве, Multi-View Rendering — отрисовка с нескольких позиций, Mesh Shading — полностью программируемый конвейер обработки геометрии. Также в графических процессорах Turing были улучшены последние слабые места архитектуры Pascal относительно конкурирующей архитектуры GCN у AMD, которые могли приводить к снижению производительности в ПК-играх на Pascal, так как их код был оптимизирован для GCN. Часть улучшений в Turing пришла из Volta, а часть — абсолютно новые архитектурные новинки, которые есть только в новейшем поколении.

В целом, младший графический процессор TU117 обеспечивает неплохой баланс производительности и энергопотребления, поддерживая почти все возможности старших чипов семейства Turing, нацеленные на повышение производительности и энергоэффективности, включая поддержку одновременного выполнения целочисленных операций и операций с плавающей точкой, унифицированную архитектуру памяти с увеличенным объемом L1-кэша.

По данным Nvidia, в Full HD-разрешении модель GeForce GTX 1650 оказалась примерно вдвое быстрее, чем GTX 950, и до 70% быстрее аналогичной модели прошлого поколения — GTX 1050. А так как новинка не требует подключения дополнительного питания, то она стала доступным и простым вариантом для модернизации графической подсистемы для владельцев подобных GPU. Кроме этого, GeForce GTX 1650 будет неплохим выбором и для новых игровых ПК начального уровня.

Такая видеокарта, не требующая дополнительного питания, отлично подойдет и для тех систем, которые ограничены по потреблению энергии, вроде домашних кинотеатров. Хотя дискретные GPU не очень часто используются в таких системах, но более мощный графический процессор с современными возможностями станет отличной заменой для решений серии GTX 1050. Единственный нюанс — хотя можно было бы предположить, что TU117 по своим видеовозможностям не будет отличаться от TU116, это не так.

Если в GTX 1660 применяется новый блок NVEnc последнего поколения (Turing), то GTX 1650 отличается блоком предыдущей версии (Volta). Применяемая в новом GPU версия примерно аналогична той, что была в Pascal и обеспечивает то же качество закодированного видео, что и GTX 1050, например. А блок NVEnc семейства Turing работает на 15% эффективнее и имеет дополнительные улучшения для снижения количества артефактов. Впрочем, возможностей NVEnc поколения Volta достаточно для бюджетных ПК, и в целом GTX 1650 является отличной картой и для HTPC, не требующей подключения дополнительного питания.

Более подробно со всеми возможностями семейства Turing вы можете ознакомиться в большом обзоре GeForce RTX 2080 Ti.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) MSI GeForce GTX 1650 Gaming X 4G 4 ГБ 128-битной GDDR5

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Читайте также:  Windows 7 при установке с флешки требует драйвер для привода

Характеристики карты

MSI GeForce GTX 1650 Gaming X 4G 4 ГБ 128-битной GDDR5
GPU GeForce GTX 1650 (TU117)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц Референс: 1485—1665(Boost)—1825(Max)
MSI : 1485—1860(Boost)—1935(Max)
Частота работы памяти (физическая (эффективная)), МГц 2000 (8000)
Ширина шины обмена с памятью, бит 128
Число вычислительных блоков в GPU 14
Число операций (ALU) в блоке 64
Суммарное количество блоков ALU (CUDA) 896
Число блоков текстурирования (BLF/TLF/ANIS) 56
Число блоков растеризации (ROP) 32
Число блоков RayTracing нет
Число тензорных блоков нет
Размеры, мм 245×110×36
Количество слотов в системном блоке, занимаемые видеокартой 2
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 74
Энергопотребление в режиме 2D, Вт 15
Энергопотребление в режиме «сна», Вт 10
Уровень шума в 3D (максимальная нагрузка), дБА 21,6
Уровень шума в 2D (просмотр видео), дБА 18,0
Уровень шума в 2D (в простое), дБА 18,0
Видеовыходы 1×HDMI 2.0b
2×DisplayPort 1.4
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 3
Питание: 8-контактные разъемы
Питание: 6-контактные разъемы 1
Максимальное разрешение/частота, Display Port 3840×2160@160 Гц (7680×4320@30 Гц)
Максимальное разрешение/частота, HDMI 3840×2160@60 Гц
Максимальное разрешение/частота, Dual-Link DVI 2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI 1920×1200@60 Гц (1280×1024@85 Гц)
Средняя цена 12 500 руб на середину мая 2019 г.

Особенности карты и сравнение с GTX 1060

MSI GeForce GTX 1650 Gaming X 4G Nvidia GeForce GTX 1060
вид спереди
вид сзади

В отличие от случая с GTX 1660, мы сравниваем новинку с GTX 1060, потому что, во-первых, у нас нет фотографий референсной карты GTX 1050 Ti (Nvidia в свое время не рассылала такие карты СМИ), а во-вторых, по производительности GTX 1650 в основном попадает в промежуток между GTX 1060 3 ГБ и GTX 1060 6 ГБ, так что сравнение в принципе логичное, хотя шины обмена с памятью у этих карт разные: у GTX 1060 — 192 бит, а в данном случае — 128 бит.

Схема питания примитивная, трехфазная (карта явно не рассчитана на ручной разгон). Подвод питания осуществляется через один 6-контактный разъем.

На момент написания материала фирменная утилита MSI Dragon Center не предлагала для данной карты вообще ничего. Частота работы GPU по умолчанию повышена на 5,8% относительно референсных значений.

Подсветка у этой карты очень скромная, не регулируется и представляет собой лишь логотип компании на торце карты.

Карта имеет урезанный набор видеовыходов: 2 DP и 1 HDMI (вместо обычных четырех).

Память

Карта имеет 4 ГБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR5) рассчитаны на номинальную частоту работы в 2000 (8000) МГц

Охлаждение и нагрев

Главной частью системы охлаждения TwinFrozr 7 является довольно большой никелированный радиатор, пронизанный двумя тепловыми трубками. Поверх установлен кожух с двумя вентиляторами Torx 3.0, работающими на одинаковой частоте вращения. Вентиляторы останавливаются в простое и просто при малой нагрузке (при температуре GPU ниже 50-52 градусов). Микросхемы памяти охлаждаются основным радиатором через толстые термопрокладки, а силовых элементов тут кот наплакал, и они вообще не охлаждаются. С оборотной стороны карта ничем не прикрыта.

Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, что является отличным результатом для видеокарты такого уровня.

Максимальный нагрев — центральная часть карты.

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума выполняется по методике, описанной здесь:

  • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
  • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
  • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
  • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D температура составляла 38 °C, вентиляторы не работали. Шум был равен фоновому (18,0 дБА).

При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы также не работали, шум сохранялся на уровне 18,0 дБА.

В режиме максимальной нагрузки в 3D температура достигала 64 °C. Вентиляторы при этом раскручивались до 1190 оборотов в минуту, шум вырастал лишь до 21,6 дБА, так что шума от данной СО практически нет.

Комплект поставки и упаковка

Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим базовый комплект.

Синтетические тесты

Обновленный пакет синтетических тестов все еще экспериментальный и продолжает изменяться. Мы бы хотели добавить еще больше примеров с вычислениями (compute shaders), но с этим есть определенные сложности. В будущем мы постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — пишите их в комментариях к статье или отправьте авторам почтой.

Из ранее активно использовавшихся нами тестов RightMark3D мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей. В качестве полусинтетического теста у нас также используется и популярный 3DMark Time Spy, помогающий определить прирост от асинхронных вычислений.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1650 со стандартными параметрами (GTX 1650)
  • GeForce GTX 1660 со стандартными параметрами (GTX 1660)
  • GeForce GTX 1660 Ti со стандартными параметрами (GTX 1660 Ti)
  • GeForce GTX 1060 со стандартными параметрами (GTX 1060)
  • Radeon RX 590 со стандартными параметрами (RX 590)
  • Radeon RX 580 со стандартными параметрами (RX 580)

Для анализа производительности новой видеокарты GeForce GTX 1650 мы использовали эти решения по разным причинам. В первую очередь, мы сравнили недавно анонсированную модель с GTX 1660 (или Ti-вариантом в случае некоторых тестов), как старшей видеокартой из того же подсемейства Turing. Также мы взяли для сравнения и одного из предшественников новинки в виде GeForce GTX 1060 — чтобы понять, насколько самый дешевый Turing медленнее самого популярного GPU из семейства Pascal.

От компании AMD в качестве соперников для GeForce GTX 1650 в нашем сравнении выступают видеокарты моделей Radeon RX 590 и RX 580, хоть и продающиеся дороже, но все же близкие по характеристикам к прямому конкуренту для новинки — RX 570. Решения архитектуры Polaris имеют отличающиеся параметры и мы далее оценим, насколько все эти видеокарты соответствуют друг другу по производительности.

Мы сильно сократили состав DirectX 10-тестов из RightMark3D, оставив только несколько примеров с наибольшей нагрузкой на GPU. Первая пара тестов измеряет производительность выполнения относительно простых пиксельных шейдеров с циклами при большом количестве текстурных выборок (до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Оба примера включают самозатенение и шейдерный суперсэмплинг, увеличивающий нагрузку на видеочипы.

Первый тест пиксельных шейдеров — Fur. При максимальных настройках в нем используется от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Производительность в данном тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ.

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD в лидерах еще со времен выхода первых графических процессоров архитектуры GCN. Совершенно неудивительно, что видеокарты архитектуры Polaris до сих пор сильно выглядят в очередном сравнении, что говорит о большей эффективности выполнения ими подобных программ.

Рассматриваемая сегодня видеокарта модели GeForce GTX 1650 выступила ожидаемо и соответственно теории, показав результат на уровне 70% от GTX 1660. Отставание от GTX 1060 почти такое же. Если сравнивать новинку с конкурентами, то она показала результат заметно хуже Radeon RX 580, да и прямой конкурент RX 570 наверняка обгонит новинку. В таких тестах семейство Turing не может показать свою силу, новым GPU нужны более сложные шейдеры и условия.

Следующий DX10-тест Steep Parallax Mapping также измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. При максимальных настройках он использует от 80 до 400 текстурных выборок из карты высот и несколько выборок из базовых текстур. Этот шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, в том числе и такие варианты как steep parallax mapping. Кроме того, в нашем тесте мы включили самозатенение, увеличивающее нагрузку на видеочип в два раза, и суперсэмплинг, также повышающий требования к мощности GPU.

Диаграмма похожа на предыдущую, разве что в этот раз видеокарты GeForce выглядят получше на фоне соперника. Новинка чуть отдалилась от GTX 1660, хотя отставание полностью соответствует теории. Урезанный новый чип TU117 показывает 66% от скорости старшей модели, а конкурент компании AMD явно быстрее. Отставание от GTX 1060 из предыдущего поколения уменьшилось, новый GPU чуть эффективнее справляется с этой задачей, но этого не хватает. В более сложных DirectX 11 и 12 тестах GTX 1650 должна лучше раскрыть свои возможности.

Из пары тестов пиксельных шейдеров с минимальным количеством текстурных выборок и относительно большим количеством арифметических операций, мы выбрали более сложный, так как они уже порядком устарели и уже не измеряют чисто математическую производительность GPU. Да и за последние годы скорость выполнения именно арифметических инструкций в пиксельном шейдере не так важна, большинство вычислений перешли в compute shaders. Итак, тест шейдерных вычислений Fire — текстурная выборка в нем лишь одна, а количество инструкций типа sin и cos равно 130 штукам. Впрочем, для современных GPU это семечки.

В математическом тесте из нашего RightMark мы часто получаем результаты, довольно далекие от теории и сравнений в других аналогичных бенчмарках. Вероятно, столь мощные платы ограничивает что-то, не относящееся к скорости вычислительных блоков, так как GPU при тестировании чаще всего не загружены работой на 100%. Рассматриваемая сегодня GeForce GTX 1650 в этом тесте отстала от всех, и это полностью соответствует теории — ее производительность оказалась на уровне 70% от GTX 1660.

Более мощный GPU конкурирующей компании где-то между GTX 1660 и GTX 1650, так что RX 570 должен быть куда ближе к рассматриваемой сегодня видеокарте из семейства Turing. Скорее всего, преимущество у Radeon останется, но оно (в удобном для AMD тесте) будет довольно небольшим.

Переходим к тесту геометрических шейдеров. В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, но один из них (Hyperlight, демонстрирующий использование техник: instancing, stream output, buffer load, использующий динамическое создание геометрии и stream output), на всех видеокартах компании AMD не работает, поэтому мы решили оставить лишь второй — Galaxy. Техника в этом тесте аналогична point sprites из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Вычисления производятся в геометрическом шейдере.

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек. Задача для мощных современных GPU довольно простая, но разница между разными моделями видеокарт есть. Новая GeForce GTX 1650 в этом тесте показала результат почти на уровне Radeon RX 580, чуть проиграв в легких условиях. Разница между ней и GTX 1660 снова соответствует теории — 30%-32%.

В этом тесте разница между видеокартами на чипах Nvidia и AMD явно в пользу решений калифорнийской компании, что обусловлено отличиями в геометрических конвейерах GPU. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, но не топовые видеочипы Nvidia имеют не так уж много блоков по обработке геометрии, и пусть Radeon RX 570 будет медленнее новинки, разница между ними окажется невеликой.

Последним тестом из Direct3D 10 станет скорость большого количества текстурных выборок из вершинного шейдера. Из пары имеющихся у нас тестов с использованием displacement mapping на основании данных из текстур, мы выбрали тест Waves, имеющий условные переходы в шейдере и поэтому более сложный и современный. Количество билинейных текстурных выборок в данном случае составляет 24 штуки на каждую вершину.

В тесте вершинного текстурирования Waves результаты привычно довольно странные. Новая GeForce GTX 1650 снова показывает скорость хуже всех, отставая от GTX 1660 ровно на теоретически 30%. Производительность новой модели GPU соответствует ожидаемому уровню, но Radeon RX 580 оказалась чуть быстрее. Впрочем, отставание в сложных условиях говорит о том, что младшая модель на чипе Polaris, с которой конкурирует рассматриваемая видеокарта Nvidia, вполне может немного уступить ей.

Мы традиционно рассматриваем также и синтетические тесты из пакета 3DMark Vantage, ведь они иногда показывают нам то, что мы упустили в тестах собственного производства. Feature тесты из этого тестового пакета также обладают поддержкой DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новой видеокарты GeForce мы сделаем какие-то полезные выводы, ускользнувшие от нас в тестах пакета RightMark 2.0.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Читайте также:  Где находится светодиод на материнской плате

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя у семейства Turing они получаются несколько заниженными, что мы отмечали ранее. Сегодняшняя новинка отстает от GTX 1660 примерно столько, сколько и должна проигрывать по теории — около 35%. По сравнению с GTX 1060 самый слабый из графических процессоров Turing показывает также ожидаемый результат. Карта семейства Pascal расположилась между парой Turing.

Сравнение скорости текстурирования рассматриваемой сегодня видеоплаты компании Nvidia с конкурирующими видеокартами AMD показало, что модель GeForce GTX 1650 прилично уступает видеокарте Radeon RX 580 по скорости текстурирования, так как все Radeon имеют большое количество блоков TMU и с этой задачей они справляются явно лучше.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Новинка снова показала соответствующий теории результат на уровне 70% от GTX 1660. Тут все ожидаемо, в том числе и близость по скорости к GTX 1060.

Конкурирующие видеокарты по скорости заполнения сцены обычно не так хороши, но Radeon RX 580 в этом тесте оказалась явно быстрее сегодняшней новинки. Похоже, что и Radeon RX 570 будет близка к ней и покажет большую скорость рендеринга, по сравнению с представленной в апреле видеокартой Nvidia.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно важный тест, так как результаты в нем неплохо коррелируют с тем, что получается в игровых тестах.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce GTX 1650 снова показала 100% ожидаемый результат, проиграв всем соперникам. Графические процессоры AMD в этом тесте всегда были сильны, и новинка явно слабее Radeon RX 580 (да и RX 570 наверняка). GTX 1650 показала 2/3 от скорости GTX 1660, да и GTX 1060 где-то далеко впереди. Скорее всего, примерно это же мы увидим и в играх.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы в который раз получаем явно некорректные результаты в этом тесте. Очередная новая видеокарта GeForce показала очень низкую скорость хуже уровня решений предшествующего поколения. Да и вообще — все карты Nvidia тут очень близки, чего быть не должно.

В таких условиях и сравнение с Radeon для GeForce GTX 1650 не имеет смысла. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, платы Radeon в этом тесте по какой-то причине работают заметно лучше, и модель RX 580 чуть ли не вдвое обгоняет пару видеокарт GeForce из семейства Turing, представленных в сегодняшнем сравнении. Результаты явно некорректные.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

И во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты. Но они хотя бы выше, чем в прошлом подтесте этого же бенчмарка. Новинка Nvidia оказалась медленнее всех, уступив и более высокому по позиционированию представителю архитектуры Pascal в виде GTX 1060, и старшей модели Turing (тут разница меньше теоретической — около 25%). Сравнение новой модели GeForce с представленной в материале видеокартой компании AMD также показало отставание — пусть и от средней модели на чипе Polaris, но ведь и Radeon RX 570 тоже будет впереди.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она явно ближе к пиковой производительности видеочипов в предельных задачах. В этом тесте используются операции с плавающей запятой, и новая архитектура Turing не может использовать свои уникальные возможности и показать результат заметно выше аналогичных представителей из семейства Pascal. GeForce GTX 1650 в этом тесте оказалась слабейшей, как и должно быть, и отставание от GTX 1660 близко к теории — 35%.

Видеочипы компании AMD с архитектурой GCN справляются с подобными задачами чуть лучше — они всегда хороши в тех случаях, когда выполняется интенсивная «математика» в предельных режимах. Radeon RX 580 в этом тесте стала явным победителем, и уже тем более обошла GTX 1650. Нет никаких сомнений в том, что и RX 570 будет гораздо сильнее в этом тесте. Что-то пока не очень хорошо для GTX 1650 получается в целом. Но далее мы рассмотрим более современные тесты, использующие повышенную нагрузку на GPU, и показатели Turing в них должны быть лучше.

Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.

Первый Direct3D11-тест не раскрывает новых возможностей архитектуры Turing, все видеокарты GeForce проиграли единственному конкуренту в виде Radeon RX 590, который оказался быстрее всех. Сегодняшняя новинка сильно отстает и от аналогичного решения из семейства Pascal и от старшей GTX 1660 и это уже не соответствует теории. Впрочем, судя по очень высокой частоте кадров, вычисления в этом примере из SDK слишком простые, и мощные GPU не могут показать свои способности.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Производительность рендеринга в этом тесте зависит от оптимизации драйвера и командного процессора GPU. И с этим у всех решений Nvidia все в порядке, как мы знаем по опыту предыдущих сравнений. Поэтому все видеокарты GeForce опередили единственную представленную плату компании AMD. Если сравнить рассматриваемую сегодня плату с GTX 1060 из прошлого поколения, то в этот раз GTX 1650 оказалась близка к ней, а вот GTX 1660 далеко впереди.

Ну и третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно интересный. При тестировании мы использовали настройки по умолчанию.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Новая видеокарта GeForce GTX 1650 сильно отстала ото всех (нужно помнить, что все остальные карты в сравнении — более высокого уровня и цены), показав чуть меньше производительности, чем от нее ожидалось, исходя из теоретической разницы между картами семейства Turing. Впрочем, частота кадров тут снова слишком высокая в любом случае и задача слишком проста даже для бюджетных GPU.

Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.

Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.

Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU. Решения Nvidia неплохо справляются с этими операциями, но с результатом TU117 явно что-то не так — преимущество старшей платы GTX 1660 значительно больше теоретической разницы по производительности всех исполнительных блоков. Новая плата тут оказалась медленнее всех, включая (весьма условного) конкурента в виде Radeon RX 590.

Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.

Производительность в этом тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Все видеокарты компании Nvidia справились с задачей отлично (с учетом большого количества обрабатываемой геометрии) и примерно одинаково, что говорит скорее об упоре в возможности именно программной части (оптимизации драйвера), поэтому и сравнивать GeForce друг с другом бессмысленно. А вот Radeon RX 590 очень сильно отстала от них, как и все остальные Radeon в наших предыдущих тестах. И дело тут в недостатке программной оптимизации — драйверы компании AMD справляются с работой неидеально.

И последний пример с поддержкой D3D12 — уже известный нам nBody Gravity тест, но в другом варианте. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.

По количеству кадров в секунду видно, что эта вычислительная задача довольно сложна. Сегодняшняя новинка GeForce GTX 1650, основанная на младшем графическом процессоре архитектуры Turing, снова проиграла, но это объяснимо более высоким уровнем остальных GPU. Она отстала от старшей сестры GTX 1660 примерно так, как и должно быть из теоретической разницы в производительности основных исполнительных блоков GPU. Единственная видеокарта конкурирующей компании, представленная в нашем сравнении, быстрее, но RX 570 уже вряд ли будет впереди.

В качестве дополнительного синтетического теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Так мы поймем, изменилось ли что-то в поддержке async compute в Turing. Для верности мы протестировали видеокарты Nvidia в двух разрешениях экрана и двух графических тестах.

По представленным диаграммам видно, что прирост от включения асинхронных вычислений в Time Spy не слишком сильно изменился между двумя поколениями GPU компании Nvidia. Для Pascal это 3%-7%, а для Turing уже 5%-10% (в зависимости от режима). В новых графических процессорах одновременное исполнение разных типов вычислений было улучшено, на одном и том же шейдерном мультипроцессоре архитектуры Turing теперь могут запускаться и графические и вычислительные шейдеры. Но бенчмарк Time Spy использует такие возможности слабо, поэтому и разница невелика.

Если рассматривать производительность GeForce GTX 1650 в этой задаче по сравнению со старшей моделью Nvidia на основе урезанной версии TU116, то получается, что новинка отстает от GTX 1660 соответственно разнице в теоретических показателях. Анонсированная недавно модель на урезанном чипе TU117 показала неплохой результат даже на фоне видеокарты Radeon RX 590, которая сильнее ее прямого конкурента, что настраивает на сдержанный оптимизм перед игровыми тестами, так как результаты в Time Spy обычно неплохо коррелируют с игровыми.

Мы все еще ищем бенчмарки, использующие OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается уже довольно старый и не слишком хорошо оптимизированный тест трассировки лучей, но не аппаратной — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Новая модель GeForce GTX 1650 оказалась медленнее GTX 1660 той же графической архитектуры примерно на ту разницу, что и должна быть в теории. А вот если сравнить новинку с GTX 1060 из предыдущего семейства Pascal, то она заметно ближе к GPU прошлого поколения благодаря изменениям в системе кэширования в чипах семейства Turing. Кэши стали больше и быстрее, и во многом благодаря этому GTX 1650 смотрится неплохо. Впрочем, условный конкурент в виде Radeon RX 590 еще быстрее, но решения AMD всегда сильных в подобных задачах.

Еще одним тестом вычислительной производительности графических процессоров является V-Ray Benchmark — тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества архитектуры Turing. В прошлых тестах мы использовали версию, которая выдает результат в виде времени, затраченного на рендеринг, а теперь он сменился на количество миллионов просчитанных путей за секунду.

Читайте также:  Блок питания для видеокарты gtx 570

Прямого сравнения с конкурентом и GTX 1660 мы не сделаем, так как были протестированы другие видеокарты. Зато сравним скорость с GTX 1660 Ti на полном TU116 и полноценным Turing-решением в виде RTX 2060. Мы отмечали, что архитектура Turing не получила преимуществ от своих архитектурных оптимизаций в тесте V-Ray, но в этот раз у нас все GPU этого семейства. Единственное, что хорошо видно — результаты GeForce RTX заметно выше, и это при том, что технология RTX пока что не используется в этом тесте.

К слову, по прошлым тестам мы уже знаем, что этот рендерер лучше оптимизирован именно под видеокарты калифорнийской компании, и все Radeon от них отстают. Новая GeForce GTX 1650 отстает от GTX 1660 Ti примерно соответственно теории, а что касается сравнения с GeForce RTX 2060, то эта модель оказалась еще быстрее, и весьма прилично.

Последним тестом нашего материала стал еще один бенчмарк, измеряющий производительность рендеринга при трассировке лучей — OctaneBench 2019. Его отличие и преимущество в том, что он уже умеет использовать технологию аппаратного ускорения трассировки лучей Nvidia RTX, хоть и доступен пока только в виде бета-версии. Посмотрим, что дает эта поддержка:

Сразу же бросается в глаза очень сильный результат GeForce RTX 2060. Если при отключенной технологии RTX эта видеокарта хоть и быстрее GTX 1660 Ti, но явно не в разы, то аппаратное ускорение трассировки лучей меняет все — скорость рендеринга возрастает сразу в несколько раз. Наглядно разницу можно оценить по тому факту, что рассматриваемая сегодня новинка GTX 1650 оказалась чуть ли не вдесятеро медленнее RTX 2060 в этом бенчмарке.

При сравнении младших графических процессоров Turing: TU117 и TU116, у которых нет поддержки аппаратного ускорения трассировки лучей, отметим некоторое несоответствие результатов теоретической разнице между GTX 1650 и GTX 1660 Ti. Более мощная модель в этом тесте выступила быстрее младшей более чем вдвое. Похоже, что слабые GPU очень сильно теряют производительность в таких сложных задачах.

Выводы по теоретической части и синтетическим тестам

Видеокарта модели GeForce GTX 1650, основанная на урезанной версии графического процессора TU117 архитектуры Turing, занимает на рынке игровых видеокарт свое место под GeForce GTX 1660. Увы, в наших синтетических тестах попадались и не самые приятные результаты, особенно в старых приложениях, где у всех новых GPU дела обстоят зачастую не очень хорошо. В более новых тестах влияние архитектурных улучшений в Turing заметно чаще, и новинка в играх должна быть явно быстрее GTX 1050 и 1050 Ti из предыдущего семейства Pascal, а вот бороться с конкурентом будет не так просто.

Nvidia говорит о новой модели как о хорошем варианте для апгрейда с решений уровня GeForce GTX 950 или аналогичных по мощности GPU конкурента. По данным компании, GTX 1650 дает более чем вдвое большую производительность, по сравнению с GTX 950 — аналогичной по позиционированию видеокартой, вышедшей два поколения назад. Немаловажным преимуществом новинки станет наличие 4 ГБ видеопамяти, по сравнению с 2 ГБ у GTX 950 и GTX 1050, чего сейчас уже откровенно мало. Конечно, все это не позволит выставить высокие и максимальные настройки даже в Full HD-разрешении во всех играх, но некоторые нетребовательные проекты вполне дадут такую возможность — вроде Dota 2 и аналогичных игр. Более же требовательные и современные игры вынудят снизить настройки даже в 1920×1080, чтобы получить приемлемую плавность.

Судя по всему, Nvidia держит в рукаве еще одну потенциально возможную видеокарту на основе чипа TU117. Часто они запускали сразу два варианта бюджетных решений (как GTX 1050 и GTX 1050 Ti), на основе полного GPU и урезанного, но в этот раз более мощной видеокарты пока нет. Так что вполне можно ожидать Ti-варианта на полном TU117, если в компании посчитают это нужным. Но так как в GTX 1650 урезано малое количество исполнительных блоков, то, скорее всего, теоретический более мощный вариант будет работать на большей частоте и может быть даже будет иметь GDDR6-память, так как из имеющейся 128-битной шины особо ничего уже не выжмешь. Естественно, при цене GTX 1650 в $149, старший вариант будут продавать ближе к $200, заполнив еще одно пространство в линейке.

Хотя урезанные по возможностям чипы Turing в виде TU116 и TU117 весьма эффективны именно в текущих играх без использования трассировки лучей, младший чип слишком сильно урезан, чтобы всегда успешно конкурировать с Radeon RX 570, имеющем близкую цену. Многочисленные варианты на основе Polaris из линейки Radeon RX 500 действительно очень сильны. Соперники стараются выставить против GTX 1650 старший вариант Radeon RX 570 с 8 ГБ памяти, и против новинки он выглядит весьма сильно, не говоря уже о наличии вдвое большего объема видеопамяти. А если сравнивать 4-гигабайтные варианты, то RX 570 все равно может выглядеть привлекательнее за счет цены.

Nvidia смогла повысить производительность новых GPU при том же энергопотреблении, и TU117 намного эффективнее справляется с современными играми по сравнению с аналогичными чипами архитектуры Pascal и уж тем более любыми из Radeon. Решения AMD просто не могут конкурировать с новинками семейства Turing по энергоэффективности, и RX 570 потребляет чуть ли не вдвое больше энергии при близкой производительности, но они сейчас привлекательнее по цене при том, что по скорости близки. Так что, если рассматривать сравнение исключительно по соотношению цены и производительности, то Radeon RX 570 является сильным соперником для GTX 1650, с учетом несколько завышенной цены последней. Все решат игровые тесты, к которым мы и переходим.

Игровые тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i9-9900K (Socket LGA1151v2):
    • процессор Intel Core i9-9900K (разгон 5,0 ГГц по всем ядрам);
    • СО NZXT Kurhen C720;
    • системная плата Gigabyte Z390 Aorus Xtreme на чипсете Intel Z390;
    • оперативная память 16 ГБ (2×8 ГБ) DDR4 Gigabyte UDIMM 3200 МГц (AR32C16S8K2SU416R);
    • SSD Intel 760p NVMe 1 ТБ PCI-E;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
    • блок питания Corsair AX1600i (1600 Вт);
    • корпус Thermaltake Versa J24;
  • операционная система Windows 10 Pro 64-битная; DirectX 12 (v.1809);
  • телевизор LG 43UK6750 (43″ 4K HDR);
  • драйверы AMD версии 19.4.1;
  • драйверы Nvidia версии 425.31/430.39;
  • VSync отключен.

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

  • Wolfenstein II: The New Colossus (Bethesda Softworks/MachineGames)
  • Tom Clancy’s The Division 2 (Massive Entertainment/Ubisoft)
  • Devil May Cry 5 (Capcom/Capcom)
  • Battlefield V (EA Digital Illusions CE/Electronic Arts)
  • Far Cry 5 (Ubisoft/Ubisoft)
  • Shadow of the Tomb Raider (Eidos Montreal/Square Enix) — HDR включен
  • Metro Exodus (4A Games/Deep Silver/Epic Games)
  • Strange Brigade (Rebellion Developments/Rebellion Developments)

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −7,9 −5,9 −23,8
GeForce GTX 1650 GeForce GTX 1060 3 ГБ +7,7 +9,1 +60,0
GeForce GTX 1650 GeForce GTX 1050 Ti +133,3 +182,4 +100,0
GeForce GTX 1650 Radeon RX 570 4 ГБ −24,7 −12,7 +14,3

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −7,4 −8,6 −11,8
GeForce GTX 1650 GeForce GTX 1060 3 ГБ +6,4 +6,7 +7,1
GeForce GTX 1650 GeForce GTX 1050 Ti +31,6 +39,1 +66,7
GeForce GTX 1650 Radeon RX 570 4 ГБ −5,7 −8,6 −16,7

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −6,6 −5,8 −14,3
GeForce GTX 1650 GeForce GTX 1060 3 ГБ +4,4 +4,3 +14,3
GeForce GTX 1650 GeForce GTX 1050 Ti +91,9 +133,3 +71,4
GeForce GTX 1650 Radeon RX 570 4 ГБ −6,6 −9,3 −7,7

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −21,5 −21,4 −13,0
GeForce GTX 1650 GeForce GTX 1060 3 ГБ −5,6 +26,9 +33,3
GeForce GTX 1650 GeForce GTX 1050 Ti +54,5 +153,8 +150,0
GeForce GTX 1650 Radeon RX 570 4 ГБ −20,3 −26,7 −13,0

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −5,7 −10,4 −11,8
GeForce GTX 1650 GeForce GTX 1060 3 ГБ +3,1 +4,9 +7,1
GeForce GTX 1650 GeForce GTX 1050 Ti +53,5 +43,3 +50,0
GeForce GTX 1650 Radeon RX 570 4 ГБ +4,8 0,0 +36,4

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −11,4 −13,3 −21,1
GeForce GTX 1650 GeForce GTX 1060 3 ГБ −4,9 +4,0 +15,4
GeForce GTX 1650 GeForce GTX 1050 Ti +39,3 +44,4 +114,3
GeForce GTX 1650 Radeon RX 570 4 ГБ +14,7 +13,0 +15,4

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −32,4 −32,0 −47,1
GeForce GTX 1650 GeForce GTX 1060 3 ГБ −11,5 −10,5 −10,0
GeForce GTX 1650 GeForce GTX 1050 Ti +35,3 +112,5 +80,0
GeForce GTX 1650 Radeon RX 570 4 ГБ −4,2 +21,4 +12,5

Разница в производительности, %

Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
GeForce GTX 1650 GeForce GTX 1060 6 ГБ −13,9 −15,7 −10,7
GeForce GTX 1650 GeForce GTX 1060 3 ГБ 0,0 +4,9 +8,7
GeForce GTX 1650 GeForce GTX 1050 Ti +47,6 +43,3 +56,3
GeForce GTX 1650 Radeon RX 570 4 ГБ −17,3 −15,7 −7,4

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon RX 550 (то есть сочетание скорости и функций Radeon RX 550 приняты за 100%). Рейтинги ведутся по 23 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят GeForce GTX 1650 и его конкуренты.

Для расчета рейтинга полезности использованы розничные цены на начало мая 2019 года.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
15 GTX 1060 6 ГБ, 1507—1860/8000 350 219 16 000
16 RX 570 4 ГБ, 1168—1244/7000 310 292 10 600
17 MSI GTX 1650 Gaming X, 1485—1935/8000 310 246 12 600
18 GTX 1650 4 ГБ, 1485—1825/8000 300 240 12 500
19 GTX 1060 3 ГБ, 1507—1860/8000 280 215 13 000

Новый ускоритель GTX 1650 опередил конкурента в лице GTX 1060 3 ГБ (поэтому сравнивать его с GTX 1050 Ti нет никакого смысла), однако отстал от своего прямого соперника Radeon RX 570 4 ГБ. При этом повышенные частоты карты MSI как раз помогают ей догнать RX 570.

Если ранее при изучении GTX 1660 мы вели разговор о нацеленности этого ускорителя на самое популярное на сегодня разрешение в мире игр — Full HD, при высоких настройках графики в играх, то GTX 1650 такие условия уже не потянет. Придется выбирать: или оставлять Full HD, но понижать настройки графики до среднего уровня (а иногда и до низкого), или понижать разрешение до 1680×1050 или еще ниже, оставляя настройки графики высокими.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
04 RX 570 4 ГБ, 1168—1244/7000 292 310 10 600
08 MSI GTX 1650 Gaming X, 1485—1935/8000 246 310 12 600
10 GTX 1650 4 ГБ, 1485—1825/8000 240 300 12 500
14 GTX 1060 6 ГБ, 1507—1860/8000 219 350 16 000
15 GTX 1060 3 ГБ, 1507—1860/8000 215 280 13 000

На момент подготовки материала карты на GTX 1650 уже появились в продаже со средней ценой в 12 500 рублей, которая и была взята для определения рейтинга. При таком раскладе Radeon RX 570 смотрится выигрышнее, однако будем следить за реальными ценами, картина может поменяться. Очевидно, что оба варианта GTX 1060 в таком сравнении проигрывают, им пора уходить на пенсию.

Выводы

Nvidia GeForce GTX 1650 продолжил (и, возможно, завершил) выведение архитектуры Turing в более низкий сегмент рынка игровых видеоускорителей. Будучи заметно быстрее, чем GeForce GTX 1060 3 ГБ, и выигрывая у GeForce GTX 1060 6 ГБ по соотношению цены и возможностей, GeForce GTX 1650 призван заменить GeForce GTX 1060 в сегменте игровых видеокарт с ценой 10—13 тысяч рублей. Однако в этом сегменте на сегодня лучшим по соотношению цены и производительности является Radeon RX 570 4 ГБ, который дешевле, а скорость у него чуть выше. Мы надеемся, что вскоре GeForce GTX 1650 также подешевеет, и тогда конкуренция усилится, что на руку потребителю. Все предпосылки к этому есть: GeForce GTX 1650 «простой как валенок» в плане себестоимости производства, его нынешняя цена явно чрезмерно завышена.

У конкретного протестированного нами видеоускорителя MSI GeForce GTX 1650 Gaming X 4G (4 ГБ) следует выделить отличную систему охлаждения, которая без проблем справляется с рассеиванием тепла от GPU и при этом работает практически бесшумно. Также надо отметить относительно компактные размеры карты, ее двухслотовую ширину. Наличие всего 3 видеовыходов (вместо стандартных четырех), на наш взгляд, минусом не является: сейчас непросто найти пользователя, имеющего одновременно хотя бы три монитора на столе, а про четыре мы вообще молчим.

Итог: GeForce GTX 1650 не поддерживает такие новые технологии, как трассировка лучей и «умный» DLSS на основе тензорных ядер, однако улучшенная архитектура Turing и в этом случае показала себя прекрасно. Еще раз напомним, что Turing отличается не только трассировкой лучей и тензорными ядрами — в этой архитектуре есть и другие улучшения по сравнению с предыдущим семейством Pascal. В ней были серьезно переработаны мультипроцессоры для повышения количества операций, выполняемых за такт, что дало возможность повысить общую эффективность новых GPU. Важным изменением стало появление выделенных блоков для исполнения целочисленных инструкций — INT32-операции теперь выполняются параллельно с FP32, что повысило эффективность исполнения сложных программ, все чаще использующих целочисленные операции. Также в Turing появилась и новая возможность выполнения операций с плавающей запятой пониженной точности FP16 с удвоенным темпом относительно FP32.

Ждем снижения цен до адекватного уровня — тогда GeForce GTX 1650 наряду со своими старшими собратьями GTX 1660/1660 Ti наверняка смогут претендовать даже на лидерство в Рейтинге полезности, как это удавалось в свое время их предшественникам.

За прекрасную систему охлаждения карта MSI GeForce GTX 1650 Gaming X 4G (4 ГБ) получила награду «Оригинальный дизайн»:

Благодарим компанию MSI Russia
и лично Валерию Корнееву

за предоставленную на тестирование видеокарту

Для тестового стенда:
материнская плата Z390 Aorus Xtreme и комплект RGB-памяти предоставлены компанией Gigabyte
блок питания Corsair AX1600i (1600W) предоставлен компанией Corsair

Источник

Smartadm.ru
Adblock
detector