Выбираем gtx 1070. Знакомимся с графическим адаптером

Обзор GeForce GTX 1070 | Знакомимся с графическим адаптером

Примерно неделю назад мы опубликовали обзор самого быстрого в мире графического адаптера для настольных системы Nvidia GeForce GTX 1080 с микроархитектурой Pascal. Реакция на него была неоднозначной. Компьютерная графика – довольно спорная тема, и как это часто бывает, одна половина людей осталась довольна, вторая половина посетовала на отсутствие прогресса. Но с тестами не поспоришь. GeForce GTX 1080 обходит GeForce GTX Titan X и Radeon R9 Fury X по всем параметрам. И есть высокий шанс, что 1080-я сохранит лидирующую позицию в 2016 году, пока AMD готовит свою архитектуру Polaris к запуску в более массовом сегменте рынка.

Тем не менее, Nvidia решила повысить на $100 стоимость референсной модели, которая теперь называется Founders Edition. Многие читатели Tom’s Hardware отказываются платить больше рекомендованной цены (MSRP) за базовый дизайн, который стал популярен благодаря радиальным вентиляторам и кожуху с окном, особенно на фоне ограниченного разгона, связанного с отсутствием теплового запаса у системы охлаждения.

Новая модель GeForce GTX 1070 также вызовет немало споров, поскольку стоимость версии Founders Edition по данным компании составит $449. Тем временем партнеры Nvidia готовят свои собственные версии карт, рекомендованная цена которых будет начинаться с $379. Однако их появления в продаже не стоит ожидать раньше 10 июня, так что пока неизвестно, сохраняться ли цены на предлагаемом уровне, либо высокий спрос поднимет их в первый же день. Такова особенность «бумажных» анонсов.

Но мы хотя бы можем быть уверенны, что производительность GeForce GTX 1070 не изменится. Карта в нашей лаборатории ничем не отличается от тех, что появятся через несколько недель. И, признаться, она нас впечатлила.

Архитектура Pascal в подробностях

Мы подробно разобрались в особенностях новой микроархитектуры Nvidia Pascal в первой части нашего обзора Nvidia GeForce GTX 1080 . Если вы еще не читали, рекомендуем все же прочесть, поскольку в GP104 реализовано много нового и интересного помимо того, что указано в спецификациях.

Встречайте GeForce GTX 1070

Вы сразу заметите, что GeForce GTX 1070 выглядит точно также как GTX 1080. Эта модель многое позаимствовала у старшего брата.

Начнем с графического процессора GP104. В GeForce GTX 1080 используется полноценный GP104 с 20 потоковыми мультипроцессорами (SM), разнесенными по четырем кластерам обработки графики (GPC). GeForce GTX 1070 также использует четыре GPC, но теряет пять SM. В итоге мы имеем 15 SM (или 1920 ядер CUDA против 2560 ядер у старшей модели) и 120 блоков текстурирования (против 160). Кроме того Nvidia снижает базовую тактовую частоту графического процессора до 1506 МГц, а максимальную частоту GPU Boost до 1683 МГц (в GTX 1080 - 1607 МГц и 1733 МГц соответственно).

Nvidia не тронула бэк-энд чипа, сохранив восемь 32-разрядных контроллеров памяти, имеющих по восемь ROP и 256 Кбайт кэша L2. Всего получается 64 блоков растеризации и 2 Мбайт кэша второго уровня. Но изменения коснулись видеопамяти. GeForce GTX 1080 оснащается 8 Гбайт памяти GDDR5X со скоростью передачи данных 10 Гбит/с, а GeForce GTX 1070 получает 8 Гбайт памяти GDDR5 от Samsung со скоростью 8 Гбит/с. Следовательно, максимальная пропускная способность памяти достигает 256 Гбайт/с, что на 14% выше, чем у GeForce GTX 980. Фактически у GeForce GTX 980 Ti и Titan X есть преимущество по пропускной способности по сравнению с GeForce GTX 1070 благодаря 384-битной шине (как у некоторых карт AMD, оснащенных шинами шириной 384 и 512 бит). Однако Nvidia утверждает, что улучшенная дельта-компрессия цвета, которую мы обсуждали в обзоре GTX 1080, повышает эффективность использования канала, сокращая объем выборки информации из памяти на 20%.

GPU GeForce GTX 1070 (GP104) GeForce GTX 970 (GM204) GeForce GTX 1080 (GP104) GeForce GTX 980 (GM204)
SM 15 13 20 16
Количество ядер CUDA 1920 1664 2560 2048
Базовая частота GPU, МГц 1506 1050 1607 1126
Частота GPU в режиме Boost, МГц 1683 1178 1733 1216
Скорость вычислений, GFLOPs (при базовой частоте) 5783 3494 8228 4612
Количество блоков текстурирования 120 104 160 128
Скороть заполнения текселей, Гтекс/с 201,9 122,5 277,3 155,6
Скорость передачи данных памяти, Гбит/с 8 7 10 7
Пропускная способность памяти, Гбайт/с 256 196 и 28 320 224
Количество блоков растеризации 64 56 64 64
Объем кэша L2, Мбайт 2 1,75 2 2
Тепловой пакет, Вт 150 145 180 165
Количество транзисторов 7,2 млрд. 5,2 млрд. 7,2 млрд. 5,2 млрд.
Площадь кристалла, мм2 314 398 314 398
Техпроцесс, нм 16 28 16 28

Кроме названия модели, вытравленного на корпусе, GeForce GTX 1070 Founders Edition внешне ничем не отличатся от GTX 1080, и это хорошо. Со времен GTX 690 промышленный дизайн Nvidia повлиял на наши ожидания относительно высокопроизводительных видеокарт. И хотя некоторые люди предпочитают более сдержанные формы прошлых поколений, новые системы охлаждения имеют высокую эффективность и приемлемые акустические характеристики. Мы ожидаем, что партнеры Nvidia предложат варианты кулеров с еще более высокой отдачей. Однако альтернативные версии обычно выводят ненужное тепло обратно в корпус компьютера. Некоторые энтузиасты с этим смирились и проектируют свои ПК соответствующим образом. Однако владельцам игровых систем малого форм-фактора приходится быть более избирательными. Центробежный вентилятор проталкивает нагретый воздух через алюминиевые ребра радиатора и выводят его через вентиляционную решетку на панели ввода-вывода карты.

Под оболочкой различия между 1070-й и 1080-й становятся более очевидными. GTX 1080 использует испарительную камеру, а GeForce GTX 1070 алюминиевый радиатор с тремя встроенными тепловыми трубками из меди. Это наверняка одна из мер снижения затрат, связанная с пониженным до 150 Вт тепловым пакетом карты. Графическому адаптеру с такой потребляемой мощностью не нужна такая мощная система охлаждения как у текущего флагмана, даже если она поможет преодолеть некоторые температурные ограничения, которые мы наблюдали во время тестирования 1080-й.

На PCB младшей карты Nvidia установлена схема из четырех полевых транзисторов, вместо пятифазной схемы электропитания GTX 1080. Сравните наполненность печатной платы у GeForce GTX 1070 и GTX 1080 на представленных ниже фотографиях.

Панель ввода-вывода GeForce GTX 1070 также имеет три полноразмерных разъема DisplayPort 1.3/1.4, один выход HDMI 2.0b и двухканальный разъем DVI. Сверху карты имеются два коннектора SLI, которые поддерживают новые мостики Nvidia c высокой пропускной способностью данных. В плане поддержки SLI ничего не изменилось: максимум два GPU, хотя компания, судя по всему, предложит владельцам GTX 1070 доступ к ключу разблокировки, как для 1080-й модели, который позволит создавать системы из трех и четырех карт. Помимо слота PCIe x16 вспомогательное питание для GeForce GTX 1070 также подводится через один восьмиконтактный разъем.

Обзор GeForce GTX 1070 | Методика тестирования

Все тесты, которые мы использовали для обзора GeForce GTX 1080 , актуальны и сейчас, поскольку это было всего несколько недель назад. Аппаратная и программная конфигурация осталась без изменений, как и тестовый пакет, за одним исключением. Мы заново перетестировали все карты в Witcher 3, подняв значение внутреннего ограничителя выше 60 FPS. Многие геймеры стабилизируют частоту кадров в игре Witcher, используя лимит 60 FPS, но нам интересно узнать максимальную скорость топовых видеокарт в этой игре в разрешении 2560x1440 точек.

Так же мы хотели добавить тесты Otoy OctaneBench, но помешала проблема отсутствия поддержки видеокарт GeForce GTX 1080 и GeForce GTX 1070 в демо-версии OctaneRender. Nvidia подтверждает, что иногда возникает необходимость в общении с разработчиками, прежде чем приложение сможет распознать еще невыпущенные продукты. В данном случае Otoy придется обновить ПО для совместимости с GPU на базе Pascal.

Из обзора Nvidia GeForce GTX 1080 Pascal:

"Вместо Core i7-5930K (Haswell-E) с частотой 3,5 ГГц мы используем процессор Core-i7-6700K 4 ГГц на архитектуре Skylake, который обладает более современной логикой работы IPC и дополнительными 500 МГц к базовой тактовой частоте, что позволяет избежать возможных узких мест. Естественно, процессор с интерфейсом LGA 1151 потребовал новой системной платы. Для всех игровых тестов мы использовали модель MSI Z170A Gaming M7, в которую также установили набор памяти G.Skill F4-3000C15Q-16GRR, состоящий из четырех модулей DDR4-3000 по 4 Гбайт. Накопитель Crucial MX200SSD мы не меняли, как и процессорный кулер Noctua NH-12S и блок питания be quiet! Dark Power Pro 10 850W.

Мы отказались от Windows 8.1 в пользу Windows 10 Professional. Перед тестами мы установили чистую версию ОС. Также мы подобрали новый комплект популярных игр класса AAA в разных жанрах, часть из которых используют DirectX 12.

"Видеокарты на базе архитектуры Maxwell используют самый последний на момент тестирования драйвер версии GeForce Game Ready Driver 365.10. Для Nvidia GeForce GTX 1080 Pascal мы были вынуждены использовать пресс-версию 368.13. Все три карты AMD используют Radeon Software Crimson Edition 16.5.2 Hotfix, выпущенный 10 мая этого года.

Версия драйвера 368.13 не поддерживает GeForce GTX 1070, но Nvidia на днях опубликовала обновление 368.19.

"Наш комплект сравнительных тестов тоже претерпел изменения. Мы оставили часть старых игр, в частности Battlefield 4, Grand Theft Auto V и Witcher 3, но добавили ряд новых: Hitman, Project CARS, Rise of the Tomb Raider, The Division и Ashes of the Singularity.

Диаграммы в игре Ashes показывают производительность с DirectX 12, здесь использовался встроенный инструмент тестирования и записи результатов. Hitman и Tomb Raider представляют DirectX 11. Однако у нас есть показатели этих игр с DirectX 12. О них мы выскажемся в соответствующей части нашего обзора (в большинстве случаев производительность с DirectX 12 падает). Все остальные тесты также работали с DirectX, а показатели снимались с помощью FRAPS."

Игра Настройки
Ashes of the Singularity DirectX 12, вариант настройки Extreme, встроенный бенчмарк
Battlefield 4 DirectX 11, вариант настройки качества Ultra, тест Tom’s Hardware (Tashgar jeep ride), 100 секунд записи в Fraps
Grand Theft Auto V DirectX 11, настройки качества Very High, 4x MSAA, встроенный бенчмарк (тест номер пять), 110 секунд записи в Fraps
Hitman DirectX 11, уровень детализации Ultra, FXAA, высокое качество текстур, встроенный бенчмарк, 100 секунд записи в Fraps
Project CARS DirectX 11, настройки качества Ultra, высоки уровен сглаживания, высокое разрешение текстур, Nurburgring Sprint, 100 секунд записи в Fraps
Rise of the Tomb Raider DirectX 11, пользователькие настройки качества, настройки качества Very High, встроенный бенчмарк, 80 секунд записи в Fraps
The Division DirectX 11, пользователькие настройки качества, настройки качества Ultra, временное полноэрканное сглаживание (TSSAA), встроенный бенчмарк, 90 секунд записи в Fraps
The Witcher 3 DirectX 11, настройки качествса Highest, HairWorks откл., тест Tom’s Hardware, 100 секунд записи в Fraps

Неимоверный ажиотаж вокруг появления первой видеокарты GeForce GTX 1080 на новом графическом процессоре GP104 16-нм архитектуры Pascal компании NVIDIA ещё не успел стихнуть, а нынешний лидер 3D-графики уже выпускает следующую модель видеокарты - GeForce GTX 1070 .

Она основана на том же чипе GP104, правда в несколько урезанном архитектурно виде, имеет чуть более низкие частоты графического процессора и обычную память GDDR5. Но благодаря более низкой стоимости и прогнозируемо высокому оверклокерскому потенциалу, именно GeForce GTX 1070 может стать наиболее популярной видеокартой среди любителей игр. Впрочем, обо всём по порядку.

Т ехнические характеристики видеокарты и рекомендованная стоимость

Технические характеристики и стоимость видеокарты NVIDIA GeForce GTX 1070 приведены в таблице в сравнении с эталонными версиями NVIDIA GeForce GTX 1080, GeForce GTX 980 Ti, GeForce GTX 980 и GeForce GTX 970. Отличия GTX 1070 от GTX 1080 выделены полужирным шрифтом.

Наименование технических характеристик NVIDIA GeForce GTX 1080 NVIDIA
GeForce GTX 1070
NVIDIA
GeForce GTX 980 Ti
NVIDIA
GeForce GTX
980
NVIDIA
GeForce GTX
970
Графический процессор GP104-A1
Pascal
(TSMC)
GP104-A1
Pascal
(TSMC)
GM200-A1
Maxwell 2.0
(TSMC)
GM204-A1
Maxwell 2.0
(TSMC)
GM204-A1
Maxwell 2.0
(TSMC)
Техпроцесс, нм 16 16 28 28 28
Площадь кристалла, мм 2 314 314 601 398 398
Число транзисторов, млн 7200 7200 8000 5200 5200
Частота графического процессора, МГц 3D 1607
(1734 - boost)
1506
(1683 - boost)
1000
(1076 - boost)
1126
(1216 - boost)
1050
(1178 - boost)
2D 139 139 135 135 135
Число унифицированных шейдерных процессоров, шт. 2560 1920 2816 2048 1664
Число текстурных блоков, шт. 160 120 176 128 104
Число блоков растровых операций (ROPs), шт. 64 64 96 64 64
Теоретическая максимальная скорость закраски, Гпикс./с 102,8 96,4 96,0 72,1 67,2
Теоретическая максимальная скорость выборки текстур, Гтекс./с 257,1 241,0 176,0 144,1 109,2
Поддержка версии Pixel Shaders / Vertex Shaders 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0
Тип поддерживаемой памяти GDDR5X GDDR5 GDDR5 GDDR5 GDDR5
Разрядность шины обмена с памятью, бит 256 256 384 256 256
Эффективная частота работы видеопамяти, МГц 3D 10 000 8 012 7 012 7 012 7 012
2D 810 810 648 648 648
Объем памяти, Гбайт 8 8 6 4 4
Полоса пропускания видеопамяти, Гбайт/с 320,3 256,3 336,6 224,4 224,4
Пиковая потребляемая мощность в 3D-режиме работы, Вт 3D 180 150 250 165 145
2D н/д н/д н/д н/д н/д
Требования к мощности блока питания, Вт 500 500 600 500 500
Размеры видеокарты, мм (Д × В × Т) 268 × 102 × 37 268 × 102 × 37 267 × 100 × 39 267 × 100 × 39 267 × 100 × 39
Интерфейс PCI-Express x16 (v3.0) PCI-Express x16 (v3.0) PCI-Express x16 (v3.0) PCI-Express x16 (v3.0) PCI-Express x16 (v3.0)
Выходы DVI-D
(Dual-Link),
1 HDMI v2.0b,
3 DisplayPort v1.4
DVI-D
(Dual-Link),
1 HDMI v2.0b,
3 DisplayPort v1.4
DVI-I
(Dual-Link),
1 HDMI v2.0,
3 DisplayPort v1.2
DVI-I
(Dual-Link),
1 HDMI v2.0,
3 DisplayPort v1.2
DVI-I
(Dual-Link),
1 HDMI v2.0,
3 DisplayPort v1.2
Рекомендованная стоимость, долларов США 599-699 379-449 649 499 329

Кратко резюмируя приведённые выше характеристики, отметим, что в графическом процессоре новой GeForce GTX 1070 аппаратно отключён один Graphics Processing Cluster, содержащий пять мультипроцессоров Streaming Multiprocessor, каждый из которых состоит из 128 CUDA-ядер. Таким образом, владельцы видеокарты GeForce GTX 1070 недосчитаются 640 шейдерных процессоров (то есть их на 25 % меньше, чем в GPU GTX 1080, построенной на том же чипе GP104). Второе по значимости изменение — другой тип памяти: новинка оснащена памятью типа GDDR5, а не новой GDDR5X, да и частота вместе с пропускной способностью у нее на 20 % ниже. Рекомендованная стоимость GeForce GTX 1070 для России составляет 35 тысяч рублей (GeForce GTX 1080 - 55 тысяч рублей).

⇡ Дизайн и особенности печатной платы

Образцы для прессы (в весьма ограниченном количестве, кстати) были предоставлены на тестирование в небольшой коробке, выполненной из плотного картона и оформленной в характерном для NVIDIA стиле.

В самом центре коробки находится отсек под видеокарту, где она и зафиксирована в дополнительной мягкой оболочке.

Нужно ли говорить, что в плане дизайна эталонная NVIDIA GeForce GTX 1070 является копией GeForce GTX 1080 и во многом напоминает GeForce GTX 980 Ti или GTX 980? Вот как выглядит новинка.

Длина референсного образца GeForce GTX 1070 составляет 268 мм, высота - 102 мм, а толщина - 37 мм. Весит данный экземпляр 1022 грамма.

GTX 1070 от GTX 1080 отличают хромированные символы модели видеокарты в передней части кожуха.

Панель с выходами видеокарты сделана так, чтобы на ней можно было разместить максимально большую сетку для беспрепятственного выброса нагретого воздуха за пределы корпуса системного блока. Тем не менее здесь удалось установить один DVI-D (напомним, что поддержки аналогового видеосигнала теперь нет), один HDMI версии 2.0b и три DisplayPort версии 1.4 для одновременного подключения четырёх мониторов.

Если посмотреть на видеокарту с противоположного торца, то видны рёбра радиатора системы охлаждения.

NVIDIA GeForce GTX 1070, так же как и GTX 1080, оснащается одним восьмиконтактным разъёмом для подключения дополнительного питания, однако заявленный уровень энергопотребления эталонных версий этой модели видеокарты ниже — он составляет 150 ватт, а не 180, как у GTX 1080. Мощность блока питания для системы с одной GeForce GTX 1070 должна начинаться от 500 ватт.

На своих обычных местах остались и разъёмы для создания мультипроцессорных конфигураций, однако для поддержки 4К-разрешений и выше потребуются новые двойные мосты SLI, о которых компания NVIDIA рассказывала в пресс-релизах.

Печатная плата видеокарты выполнена на основе платы GeForce GTX 1080, но получила на одну фазу питания графического процессора меньше.

Таким образом, питание на эталонных GeForce GTX 1070 реализовано по схеме 4+1.

Площадь кристалла графического процессора GP104 составляет скромные 314 мм 2 . Кристалл не имеет защитной рамки, так что при снятии штатной или установке альтернативных систем охлаждения стоит быть предельно осторожным. Говоря языком математики, именно графический процессор видеокарты является главным отличием от GTX 1080, вернее - его конфигурация. Вместо 2560 унифицированных шейдерных процессоров GPU GeForce GTX 1070 содержит 1920, что на 25 % меньше, чем у GTX 1080, но одновременно на 13 % больше, чем у предшественника в лице GeForce GTX 970. При этом блоков текстурирования у GeForce GTX 1070 осталось только 120, а ROP - 64. Разумеется, все архитектурные новшества GP104, о которых рассказывал мой коллега в обзоре старшей видеокарты, в GeForce GTX 1070 также присутствуют.

Благодаря новому, 16-нм техпроцессу, GeForce GTX 1070 получила очень высокие частоты графического процессора. И пусть они немного ниже, чем у флагманской на данный момент GeForce GTX 1080 (а именно на 6,3 % по базовой частоте), в сравнении с аналогичным показателем GeForce GTX 970 прирост частоты колоссален. Если у эталонных GeForce GTX 970 базовая частота графического процессора составляла 1050 МГц, то у новой GeForce GTX 1070 она равна 1506 МГц, то есть на 43,4 % выше! Более того, в форсированном режиме частота может автоматически увеличиваться до 1683 МГц, а, по данным мониторинга, при увеличенных до максимума пределах питания (112 %) и температуры (92 градуса Цельсия) частота графического процессора повышалась до 1886 МГц, то есть практически то той же отметки, что и на эталонной GeForce GTX 1080. Впечатляет, не правда ли? Добавим, что при переходе в 2D-режим частота процессора падает до 139 МГц одновременно со снижением напряжения с 1,062 В до 0,625 В.

Ещё одним отличием GeForce GTX 1070 от GeForce GTX 1080 является видеопамять. Вероятно, чтобы сделать GTX 1070 более доступной по стоимости, NVIDIA решила не наделять данную модель новым типом высокоскоростной памяти GDDR5X, а оснастила видеокарту привычной GDDR5 объёмом 8 Гбайт. В эталонных версиях GeForce GTX 1070 используются FCFBGA-микросхемы Samsung с маркировкой K4G80325FB-HC25 .

Теоретическая эффективная частота таких чипов составляет 8000 МГц, поэтому даже на сравнительно узкой 256-битной шине память способна обеспечить пропускную способность 256,3 Гбайт/с. Это на 8,8 % больше, чем у эталонных GeForce GTX 970 (224,4 Гбайт/с), и на 20 % меньше, чем у GeForce GTX 1080 (320,3 Гбайт/с). Напомним, что в видеокартах с архитектурой графических процессоров «Паскаль» используются новые алгоритмы сжатия данных, которые способны дополнительно сэкономить до 20 % полосы пропускания, поэтому фактическая разница в пропускной способности памяти GeForce GTX 1070 и GeForce GTX 970 должна быть выше. Добавим, что в 2D-режиме частота памяти снижается до 810 эффективных мегагерц.

Последняя доступная на момент подготовки статьи версия GPU-Z уже частично знакома с характеристиками только что вышедшей видеокарты.

В то же время считывать BIOS и отображать ASIC GPU GeForce GTX 1070 она пока не способна.

Cистемы охлаждения - эффективность и уровень шума

Система охлаждения эталонной версии видеокарты NVIDIA GeForce GTX 1070 является точной копией кулера GeForce GTX 1080 (неожиданно, правда?), и при этом она претерпела минимальные изменения в сравнении с кулерами референсных версий GeForce GTX 980 Ti или GTX 980.

Это по-прежнему кулер с массивным радиатором графического процессора, радиальным вентилятором, прокачивающим воздух через этот радиатор, небольшим радиатором в задней части платы и стальной основой, отвечающей за охлаждение чипов памяти и элементов силовых цепей.

В основании радиатора графического процессора находится отдельная испарительная камера, контактирующая только с графическим процессором через термопасту серого цвета.

С торца кулера, через который выбрасывается нагретый воздух, видны рёбра и плоская тепловая трубка, дополнительно снимающая тепловую нагрузку с видеокарты.

Скорость вращения вентилятора регулируется автоматически ШИМ-методом в диапазоне от 1000 до 4100 об/мин (по данным мониторинга).

Для проверки температурного режима работы видеокарты NVIDIA GeForce GTX 1070 в качестве нагрузки мы использовали пять циклов теста весьма ресурсоёмкой игры Aliens vs. Predator (2010) при максимальном качестве графики в разрешении 2560 × 1440 пикселей с анизотропной фильтрацией уровня 16х и активацией MSAA-сглаживания степени 4x.

Как видим, пиковая температура ядра в таком режиме работы видеокарты по ходу тестирования достигла 85 градусов Цельсия, то есть той же отметки, что и на эталонной GeForce GTX 1080. Однако разница всё-таки есть, и заключается она в скорости вращения вентилятора кулера, которая на GeForce GTX 1070 увеличилась до 2460 об/мин, тогда как у GeForce GTX 1080 повышалась до 2700 об/мин. Иначе говоря, референсная GeForce GTX 1070 в 3D-режиме работает немного тише GeForce GTX 1080 (но вовсе не тихо и даже не комфортно). Кроме температурного режима работы видеокарты, на графике мониторинга выделим частоту работы графического процессора, которая в начале тестирования на условно «холодной» видеокарте в 3D-режиме достигала 1886 МГц, а затем постепенно снизилась до 1797 МГц. Логично, что чем эффективнее будет охлаждаться GeForce GTX 1070, тем на более высокой частоте сможет работать её графический процессор.

Наглядно демонстрирует последнее утверждение следующее тестирование температурного режима NVIDIA GeForce GTX 1070 при максимально возможной скорости вентилятора кулера.

Оверклокерский потенциал (блицтест)

Поскольку на тесты GeForce GTX 1070 нам было отведено всего двое суток, то детальное и всестороннее изучение оверклокерского потенциала этой модели видеокарты провести было попросту невозможно. Поэтому в сегодняшней статье пришлось ограничиться лишь кратким блицтестированием разгона GTX 1070, а в последующих материалах эта тема будет изучена в полном объёме.

Итак, для проверки оверклокерского потенциала NVIDIA GeForce GTX 1070 мы увеличили предел по питанию на максимально возможные 112 %, температурный предел - до 92 градусов Цельсия, а также не стали полагаться на автоматическую регулировку скорости вентиляторов, зафиксировав её на 85 % мощности, или примерно 3400 об/мин. Напряжение на графическом процессоре не изменялось. С такими настройками к базовой частоте GPU без потери стабильности и появления дефектов изображения удалось добавить 165 МГц, или 11 %, а частоту памяти увеличить на 1240 МГц, или 15,5%.

Nvidia GeForce GTX 1070 8 ГБ 256-битной GDDR5 PCI-E
Параметр Значение Номинальное значение (референс)
GPU GeForce GTX 1070 (GP104) (P/N 900-1G411-2520-000 L)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1507-1797 1507-1797
Частота работы памяти (физическая (эффективная)), МГц 2000 (8000) 2000 (8000)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU 15
Число операций (ALU) в блоке 128
Суммарное количество блоков ALU 1920
Число блоков текстурирования (BLF/TLF/ANIS) 120
Число блоков растеризации (ROP) 64
Размеры, мм 270×100×35 270×100×35
Количество слотов в системном блоке, занимаемые видеокартой 2 2
Цвет текстолита черный черный
Энергопотребление Пиковое в 3D, Вт 151 151
В режиме 2D, Вт 42 42
В режиме «сна», Вт 21 21
Уровень шума В режиме 2D, дБА 20,5 20,5
В режиме 2D (просмотр видео), дБА 20,5 20,5
В режиме максимального 3D, дБА 25,5 25,5
Выходные гнезда 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работы SLI
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Дополнительное питание: количество 8-контактных разъемов 1 1
Дополнительное питание: количество 6-контактных разъемов Нет Нет
Максимальное разрешение 2D Display Port 4096×2160
HDMI 4096×2160
Dual-Link DVI 2560×1600
Single-Link DVI 1920×1200
Максимальное разрешение 3D Display Port 4096×2160
HDMI 4096×2160
Dual-Link DVI 2560×1600
Single-Link DVI 1920×1200

Комплектация локальной памятью

Карта имеет 8 ГБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой сторонe PCB.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу NVIDIA. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: NVIDIA и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании NVIDIA — Realistic Water Terrain , также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1070 GTX 1070 )
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080 )
  • GeForce GTX 970 со стандартными параметрами (сокращенно GTX 970 )
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X )
  • Radeon R9 390X со стандартными параметрами (сокращенно R9 390X )

Для проведения анализа производительности новой модели видеокарты GeForce GTX 1070 в синтетических тестах, мы выбрали эти решения по следующим причинам. GeForce GTX 970 является прямым предшественником новинки, основанном на аналогичном по сложности урезанном графическом процессоре из предыдущего поколения Maxwell. Видеокарта GeForce GTX 1080 взята как решение уже нынешнего поколения с максимальной производительностью, основанное на полноценном чипе GP104 — это сравнение покажет, насколько GTX 1070 медленнее GTX 1080.

От конкурирующей компании AMD для нашего сравнения мы снова выбрали две видеокарты разных поколений и семейств. Младшая из видеоплат Radeon R9 390X хоть и основана на довольно старом графическом процессоре Hawaii, но она до сих пор составляет неплохую конкуренцию во многих синтетических тестах. А заодно является самым близким по цене соперником для новинки. Также мы взяли Radeon R9 Fury X — в качестве самого производительного решения от AMD.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

От DirectX 9 тестов мы давно отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют еще со времени выпуска первых видеочипов на базе архитектуры GCN. И именно платы Radeon до сих пор являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ. Вывод подтверждается и сегодняшним сравнением — выпущенная сегодня видеокарта NVIDIA проиграла решениям конкурента, включая своего прямого соперника Radeon R9 390X, основанного на устаревшем графическом процессоре Hawaii.

В первом Direct3D 10 тесте новая видеоплата модели GeForce GTX 1070 до 20% уступила топовой модели нового поколения в виде GTX 1080, что соответствует теории. Удивительно, но вот свою предшественницу на чипе GM204 она обогнала совсем немного. Похоже, что видеокарты NVIDIA в этом тесте во что-то упираются. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста традиционно получились более интересными. Новая видеокарта модели GeForce GTX 1070 опережает аналогичную по позиционированию модель из прошлого поколения GTX 970 чуть ли не вдвое, что уже ближе к той разнице, что мы от неё ожидали, да и к теоретическим показателям. Сегодняшняя новинка уступила старшей модификации GTX 1080 чуть больше 20%, что также полностью соответствует теоретическим данным. Отставание от конкурентов в виде Radeon R9 Fury X и R9 390X серьёзно сократилось, хотя даже младшую модель Radeon новинка обойти так и не смогла.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом очень похожа на предыдущую (также без включения суперсэмплинга), и в этом тесте новая модель видеокарты GeForce GTX 1070 оказалась лишь немного быстрее GTX 970, и уступила почти 20% старшей GeForce GTX 1080, что близко к теории. Если же сравнивать новинку с видеокартами AMD, то и в этом случае новинка заметно уступает обеим платам Radeon. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Такие условия полностью изменили соотношение сил в сравнении. Хотя графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работали эффективнее конкурирующих плат GeForce, но именно новые модели GeForce GTX 1080 и GTX 1070, основанные на первом чипе архитектуры Pascal смогли наконец-то поспорить с ними. Старшая плата показала результат на уровне Radeon R9 Fury X во всех условиях, а рассматриваемая сегодня GTX 1070 оказалась почти точно на уровне R9 390X. По сравнению с другими GeForce, новинка показала скорость ощутимо быстрее GeForce GTX 970 из предыдущего семейства и уступила старшей GTX 1080 примерно 18-23%, что близко к теории.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае нашего теста Mineral, все видеокарты сравнения показали слишком близкие результаты, разница между которыми незначительна — похоже, что тест не отражает реальной разницы в производительности.

Увы, но в этом тесте именно GeForce GTX 1070 оказалась худшей в нашем сравнении, проиграв вообще всем — и платам от компании AMD и своей предшественнице на базе чипа архитектуры Maxwell, и GTX 1080, что хотя бы логично. Так что можно не принимать эти результаты всерьёз, они явно аномальны. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вот во втором математическом тесте из нашего RigthMark мы видим что-то хотя бы отдалённо похожее на реальное положение дел, и результаты видеокарт относительно друг друга близки к истинным. Так, новая модель GeForce GTX 1070 в этот раз уже опережает GTX 970, хотя и совсем незначительно. Разница должна быть большей. Старшей модели GTX 1080 новинка уступила порядка 19%, что примерно соответствует теоретическим пиковым параметрам.

Если сравнивать новую видеокарты на GPU архитектуры Pascal с Radeon, то обе видеокарты на чипах компании AMD показали лучшие результаты, хотя разница между GeForce GTX 1070 и Radeon R9 390X невелика, так как графический процессор Hawaii хоть и старый, но до сих пор весьма силён в математических тестах.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт от NVIDIA и AMD в этот раз явно в пользу решений первой. Скорее всего, это обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon. И в данном случае хорошо заметно, что топовые видеочипы NVIDIA выигрывают с заметным преимуществом, имея большее количество блоков по обработке геометрии.

Новая модель GeForce GTX 1070 уступила старшей модификации лишь 11-15%, а плата прошлого поколения в лице GTX 970 так и вовсе осталась далеко позади (хотя даже её производительность лучше, чем у Radeon). Видеокарты на чипах AMD показывают очень низкие результаты в этом тесте, Radeon R9 390X стала худшим решением сравнения, да и Fury X проиграла всем видеокартам NVIDIA, не говоря уже о GTX 1070. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно для плат AMD и для решений NVIDIA. И это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1070 и в этом подтесте показала отличный результат, обогнав видеокарты, кроме одной — GTX 1080 на основе такого же чипа, но не урезанного, где-то на 10-13% быстрее. А вот отставание Radeon в сложных условиях доходит до двукратного.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт NVIDIA:

На этой диаграмме мы видим примерно то же самое, что и в тесте Galaxy, хотя есть и некоторые отличия. Вторая модель видеоплаты на базе чипа GP104 оказалась заметно быстрее прошлого решения GeForce GTX 970 в сложных условиях, и уступила старшей плате нынешнего поколения 13-17%, что близко к теории. Возможно, в более сложном режиме тестирования что-то изменится:

В таких условиях результаты видеокарт компании NVIDIA серьезно изменились, но результаты довольно странные — GTX 970 стала лучшей в самых простых условиях, хотя в остальных режимах выигрывает уже нынешняя топовая карта GTX 1080. Ну а новая GTX 1070 проигрывает ей снова всё те же 14-17% в этом подтесте. Так что на фоне GeForce GTX 1080 в тестах геометрических шейдеров младшая модель показала себя неплохо.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат NVIDIA, которые в простых режимах не сильно быстрее себя же в более тяжёлом. Новая видеокарта GeForce GTX 1070 в этом тесте показывает скорость явно очень низкую — этот тест не очень хорошо исполняется вообще на всех платах GeForce, которые оказались примерно на одном уровне, но именно новинка стала худшей по непонятным причинам.

Ну а лидером в этом тесте традиционно является уже очень старая плата компании AMD на базе видеочипа Hawaii — в этот раз она оказалась сильнее всех плат от NVIDIA и Radeon R9 Fury X. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме несколько изменилась, и решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Впрочем, в самом легком они всё равно продолжают лидировать. Новая модель GeForce GTX 1070 в сложных условиях показала скорость, близкую к GTX 970, но всё же уступает ей. Старшей видеокарте на GP104 новинка проиграла ожидаемые 17-21%. Если сравнивать её результаты с Radeon, то она выиграла у обеих плат AMD в самом сложном режиме, проиграв в более лёгких.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» во многом похожи на то, что мы видели на предыдущих диаграммах — решения NVIDIA всё так же упираются во что-то в лёгких режимах. Скоростные показатели всех GeForce в этом тесте уступают производительности решений конкурента, вот и новая модель GeForce GTX 1070 показывает скорость ниже их уровня. Если сравнивать три рассмотренные в сравнении GeForce, то в тяжелых режимах GTX 1070 обгоняет GTX 970, хотя в лёгком уступает. Отставание от старшей GTX 1080 чуть меньше ожидаемого. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты NVIDIA пострадали несколько больше. Но в выводах ничего не меняется, по сути, разве что можно отметить куда более серьёзное отставание GTX 970 от новой модели GeForce GTX 1070. Рассматриваемая сегодня плата лишь на 6-14% медленнее старшего решения на том же чипе нового семейства. Впрочем, если сравнивать их с Radeon, оба решения уступают конкурирующим, особенно самой старой модели R9 390X.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1070 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и NVIDIA в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 970 и GTX 1070 оказалась более чем полуторакратной в пользу новой модели видеокарты на основе архитектуры Pascal, что близко к теоретической разнице. От GTX 1080 новинка отстала на четверть, что также было ожидаемо.

Что касается сравнения скорости текстурирования новой видеоплаты от NVIDIA с имеющимися на рынке решениями конкурента, то новинка показала почти точно такой же результат, что и Radeon R9 390X, хотя обе они уступили текущей видеокарте верхнего ценового диапазона R9 Fury X, имеющей очень большое количество блоков текстурирования.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce опередила свою предшественницу снова более чем в полтора раза, уступив старшей модели GTX 1080 те же 25%. Всё это вполне объяснимо теорией.

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1070 с результатами решений компании AMD в этом же тесте, то рассматриваемая сегодня плата показала более чем вдвое большую скорость заполнения сцены по сравнению с Radeon R9 390X, и уступила 14% текущему топовому решению в виде Radeon R9 Fury X. У лучших видеокарт AMD и NVIDIA сейчас достаточно большое количество блоков ROP, есть также весьма эффективные оптимизации для сжатия данных.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата GeForce GTX 1070 показала хороший результат, оказавшись более чем в полтора раза быстрее аналогичной по позиционированию модели предыдущего поколения GTX 970. Старшая модель текущего поколения, конечно же, оказалась быстрее — снова где-то на четверть, как и должно быть по теории. GeForce GTX 1070 в этом тесте показала результат получше, чем Radeon R9 390X, но примерно столько же уступила Radeon R9 Fury X.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов NVIDIA должны проявляться, но увы — в очередной раз отмечаем странные результаты плат GeForce. В этом тесте новая видеокарта NVIDIA показала низкую скорость, уступив в нем не только топовому решению на таком же чипе, но и своей прямой предшественнице GTX 970.

Понятно, что в таких условиях сравнение с платами Radeon в этом тесте для новинки будет печальным. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма и весьма эффективно, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении. Непонятно, чем ограничена скорость решений NVIDIA, показавших очень близкие результаты.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация серьёзно изменилась. В этот раз новая GeForce GTX 1070 уже показывает очень высокий результат, обогнав обе платы соперника и решение на чипе архитектуры Maxwell. Новая плата GeForce GTX 1070 в этот раз уступила только лидеру сравнения в виде GTX 1080, её отставание от старшей модели составило всего лишь около 15%. Сравнение новинки от NVIDIA с конкурирующими видеокартами компании AMD в этот раз позитивное — вторая плата семейства Pascal показала результат лучше обеих видеокарт Radeon.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

Вот теперь мы видим математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новые модели видеокарт от компании NVIDIA, основанные на первом игровом чипе Pascal, тоже показали высокую скорость. Если топовая GTX 1080 почти достала Radeon R9 Fury X, то младшая GTX 1070 обогнала Radeon R9 390X, в свою очередь. И это — очень хороший результат, подтверждающий успешность архитектуры Pascal с точки зрения вычислений.

Если же сравнивать скорость плат GeForce друг с другом, то предыдущая модель компании из семейства GeForce GTX 900 в этом тесте почти в полтора раза уступила сегодняшней новинке, а отставание GeForce GTX 1070 от GTX 1080 составило привычные чуть более, чем 25%. Так что тесты пакета 3DMark Vantage подтверждают, что GTX 1070 будет отставать от GTX 1080 в играх где-то на 20-25% в среднем.

Direct3D 11: Вычислительные шейдеры и производительность тесселяции

Как обычно, для тестов нового решения компании NVIDIA в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы хотели воспользоваться примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, NVIDIA и AMD. Но увы, все наши привычные тесты, использующие вычислительные шейдеры и тесселяцию, на тестовой системе с DirectX 12 под управлением операционной системы Windows 10 работают некорректно. Они толком не работают ни в оконном режиме, ни в полноэкранном. И разрешение менять не дают, аварийно завершая работу.

Если на системе с GeForce GTX 1080 в прошлый раз запустить пару из них всё же удалось, то в этот раз заставить их работать не получилось вовсе. Времени на исправление ошибок и введение новой методики для тестирования не было, и сегодня нам придётся обойтись вовсе без тестов вычислительных шейдеров и тесселяции. Для будущих же материалов планируется разработать новую методику с актуальными тестами DirectX 11/12 и OpenCL — к слову, в комментариях к статье на нашем форуме мы принимаем пожелания наших читателей по их набору.

Судя по результатам синтетических тестов новой видеокарты NVIDIA GeForce GTX 1070, основанной на урезанной версии нового графического процессора GP104, а также результатам других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем такой вывод, что рассматриваемая сегодня видеокарта станет отличным приобретением — одним из наиболее производительных решений на рынке, уступающим старшей модели GTX 1080 всего лишь около 20-25%.

Новая видеокарта от компании NVIDIA показала неплохие результаты в наших синтетических тестах, во многих из них опередив конкурирующие решения. Впрочем, в других тестах были и проигрыши, по сравнению с имеющимися на рынке платами Radeon в частности, но на результаты в реальных играх они практически не повлияют, ведь далеко не каждый синтетический тест можно перенести на игры. Решения компании AMD традиционно отличаются весьма эффективным исполнением простых и интенсивных вычислительных задач, а графические процессоры NVIDIA отыгрываются в геометрических тестах с применением тесселяции и тестах с более сложными вычислениями.

И в реальных игровых приложениях новая модель GeForce GTX 1070 должна показать в играх скорость до 25% хуже, чем у GTX 1080, судя по опыту, и это — чуть выше уровня GeForce GTX 980 Ti по нашим предварительным оценкам. Ну и Radeon R9 Fury X в среднем должен остаться позади, не говоря уже о Radeon R9 390X. В следующей части нашего материала мы рассмотрим производительность новинки по сравнению с конкурентами в играх, протестировав GeForce GTX 1070 в наборе актуальных игровых приложений.

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

На полках российских магазинов появились в достаточном количестве новые флагманские видеокарты от NVIDIA, выполненные на архитектуре Pascal. С приобретением никаких проблем нет, за исключением, конечно же, необходимости наличия в кармане суммы, достаточной для покупки новинок. Верхние строчки модельной линейки, построенной на чипе GP104, заняли видеокарты NVIDIA GeForce GTX 1070 и GeForce GTX 1080. Обе предлагают заметный рост быстродействия относительно 900 серии, на обеих заявлена улучшенная поддержка VR и 4K. Чему отдать выбор? Стоит ли переплачивать за флагмана или хватит мощности GTX 1070? Насколько велика разница?

Такие вопросы мы поставили себе перед подготовкой этого обзора. В качестве подопытных выбраны две видеокарты от одного производителя и в рамках одной серии. Это Palit GeForce GTX 1070 GameRock Premium Edition (обзор) и Palit GeForce GTX 1080 GameRock Premium Edition (обзор) . Обе видеокарты идут с заводским разгоном и оригинальной системой охлаждения. Ниже в таблице приведены цены на российском рынке, разница практически в 20000 рублей.

Обзор GeForce GTX 1070 и GTX 1080

Отличия заключаются в количестве активных блоков GPC (3 против 4), количестве потоковых процессоров (1920 против 2560), количестве текстурных блоков (120 против 160). Установлены разные типы памяти GDDR5 у GTX 1070 и новая GDDR5X у GTX 1080, пропускная способность которой составляет 256 ГБ/с против 320 ГБ/с. На разных частотах функционирует и графическое ядро, и память.

Тестовый стенд собран на базе процессора Intel Core i7 6700K (разогнан до 4700 МГц), материнской платы ASUS MAXIMUS VII Ranger и 32 Гбайт оперативной памяти Kingston HyperX Fury DDR4. Этого хватает с запасом для раскрытия всего потенциала обеих видеокарточек. Данные снимаются с помощью внешней системы с картой захвата.

Сравнение GTX 1070 и GTX 1080

Данные по играм снимаются в разрешении Full HD, схожие настройки для каждой из игр с ультра текстурами и максимальным сглаживанием. Для наглядного сравнения приводим видео ролики, предлагаем наглядно сравнить изображение в играх и проследить динамического изменение FPS. Энергопотребление

Замеры ведутся по максимальному энергопотреблению во время нагрузки синтетическим тестом системы. Приводятся данные в максимальной нагрузке. Температура

Шум

3DMark11

3DMark Fire Strike Extreme

3DMark Fire Strike Ultra

3DMark Time Spy

Все замеры в играх проводятся в Full HD разрешении с ультра настройками графики. DirectX 12: Ashes of the Singularity

Ashes of the Singularity - стратегия от студии Stardock разрабатываемая специально для DirectX 12 и 64-битных систем. Crysis 3

FarCry 4

Tom Clancy The Division

Tomb Raider

Batman: Arkham Knight

Middle-earth: Shadow of Mordor

Hitman Absolution

Doom

FallOut 4 Ultra HD

Doom Ultra HD

Tom Clancy The Division Ultra HD

Total War Warhammer Ultra HD

Palit GeForce GTX 1070 GameRock Premium Edition обзор

Palit GeForce GTX 1080 GameRock Premium Edition обзор


Комментарии:

2016-07-19 02:20:25 Guest :

Сегодня тысячи россиян озабочены вопросом выбора недорогих беспроводных наушников в стиле Apple AirPods. ...

Сегодня мы поговорим о новом планшете Lenovo Tab V7, который недавно представила компания. Устройство инт...

На просторах интернета появились изображения нового смартфона Samsung Galaxy A40, который вроде как компа...

После удачного старта GeForce GTX 1080 компания Nvidia преподнесла второй сюрприз для любителей игр, анонсировав преемника GeForce GTX 970 в виде видеокарты GeForce GTX 1070. Естественно, существенно уменьшив стоимость новинки – до $379 для моделей партнеров и $449 за версию референсного дизайна.

Основное нововведение в GeForce GTX 1070 то же, что и в GeForce GTX 1080 – это техпроцесс изготовления 16 нм. Благодаря ему в графический процессор средних размеров (314 мм 2) поместилось 7.2 млрд транзисторов, что позволяет говорить о том, что GP104 по сложности замещает GM204, но по возможностям превосходит его.

Новые возможности

В рамках 16 нм техпроцесса Nvidia удалось значительно повысить рабочие частоты видеоядра, и теперь в режиме GPU Boost достигается невероятное значение – 1.7-1.8 ГГц. Порадует энтузиастов и разгон.

Сделаем небольшую ремарку, объясняющую причины невысокого роста производительности при разгоне. Дело в том, что даже штатный режим GPU Boost постоянно удерживает высокую частоту GPU, поэтому разгон в относительной величине измеряется скромными +150-200 МГц. При этом рассчитывать на легкие 2.0 ГГц в случае GeForce GTX 1070 не приходится. Разработчики компании приложили максимум усилий, чтобы младшая модель ни при каких условиях не догнала бы старшую.

Отсюда и изначально низкий уровень TDP, и скромный запас по максимальному энергопотреблению. Остается надеяться на появление модифицированной версии BIOS, открывающей доступ к повышенному лимиту. Пока же путем правки и записи расширенного TDP сместить лимит не удалось никому. По моим наблюдениям графический процессор должен отлично масштабироваться с поднятием напряжения, достигая частот 2.3-2.4 ГГц на воздухе, но тогда энергопотребление видеокарты будет уже не таким впечатляющим и легко перешагнет 200 Вт.

По сравнению с GeForce GTX 1080 новая модель лишилась памяти GDDR5X, оставшись на старой GDDR5. Кроме того, из-за множества физических оптимизаций Nvidia легко отрезала излишек цены и отправила новинку в сегмент среднего класса.

Конечно, все ранее описанные для GeForce GTX 1080 нововведения в полной мере подходят и для GeForce GTX 1070. Мы лишь повторим, что компания действительно верит в будущее 3D реальности, поэтому многие нововведения направлены на поддержку выходящих вскоре решений. Основные улучшения внутри видеоядра направлены на оптимизацию работы с 3D очками и рассказывать об этом можно бесконечно. Остановимся на главном.

Во-первых, это однопроходное стереоизображение для VR. Благодаря технологии уменьшается работа GPU «по геометрии», чем существенно повышается производительность без падения качества. Во-вторых, драйвер и видеокарта учитывают геометрические особенности линз в 3D очках и используют специальные алгоритмы расчета.

Упомянем и новый режим Sli с двойными мостиками. Изначально многие обозреватели неправильно трактовали заявление Nvidia о новом соединении. GeForce GTX 1080 все еще можно объединять в 3- или 4-Way конфигурации, но акцент постепенно смещается в сторону 2-Way. Обусловлено это достаточной производительностью GP104.

Даже одна видеокарта превосходит GeForce GTX Titan X, а пары хватит для 100 кадров в секунду и 4К разрешения в любой игре. Старые мостики Sli можно использовать по-прежнему, но с новыми доступны большие разрешения.

И раз уж речь зашла о графическом процессоре, рассмотрим его подробнее. По сути перед нами решение среднего класса, а пока не представлены более дорогие и производительные модели, Nvidia GeForce GTX 1080 и GeForce GTX 1070 будут считаться самыми быстрыми видеокартами.

В полном GP104 каждый SM работает в паре с движком Polimorph. Но для соответствия современным запросам в него поставили новый блок Multi-Projection. У GeForce GTX 1070 отключили один блок, оставив 15 потоковых мультипроцессоров вместо 20.

Пара из SM и движка Polimorph образуют блок TPC.

В GP104 содержится четыре GPC, каждый из которых состоит из пяти TPC и суммарно восьми сегментов контроллера памяти на весь чип. Каждый TPC состоит из SM и Polimorph. Каждый SM содержит 128 ядер Cuda и кэш-память размером 256 Кбайт, 96 Кбайт общей памяти и 48 Кбайт L1 кэша, а также восемь текстурных блоков.

Любой SM может работать с очередью, состоящей до 32 команд. На внешнем крае остались восемь 32-битных контроллеров видеопамяти.

Поддержка DX12 выразилась в новом режиме работы планировщика заданий, который прямо связан с тем, что видеоядро Pascal обладает динамическим распределением. И чтобы оно не простаивало в моменты, когда обработка графических данных закончена, планировщик подкидывает ядрам вычислительную задачу. Таким образом сокращается время бездействия графического процессора, причем существенно.

Технические характеристики

Наименование Radeon
R9 Fury X
GeForce
GTX 1070
GeForce
GTX 980
GeForce
GTX 1080
GeForce
GTX 980 Ti
Кодовое имя Fiji GP104 GM204 GP104 GM200
Версия GCN 1.2 Pascal Maxwell 2.x Pascal Maxwell 2.x
Техпроцесс, нм 28 16 28 16 28
Размер ядра/ядер, мм 2 596 314 398 314 601
Количество транзисторов, млн 8900 7200 5200 7200 8000
Частота ядра, МГц 1506 1126 1607 1000
Частота ядра (Turbo), МГц 1050 1683 1216 1734 1075
Число шейдеров (PS), шт. 4096 1920 2048 2560 2816
Число текстурных блоков (TMU), шт. 256 120 128 160 176
Число блоков растеризации (ROP), шт. 64 64 64 64 96
Максимальная скорость закраски, Гпикс/с 67.2 96.4 72 102.8 96.2
Максимальная скорость выборки текстур, Гтекс/с 269 180.7 144.1 257.1 176
Тип памяти HBM GDDR5 GDDR5 GDDR5X GDDR5
Эффективная частота памяти, МГц 500 2000 1750 2500 1750
Объем памяти, Гбайт 4 8 4 8 6
Шина памяти, бит 4096 256 256 256 384
Пропускная способность памяти, Гбайт/с 512 256.3 224.3 320.3 336.5
Питание, разъемы Pin 8 + 8 8 6 + 6 8 6 + 8
Потребляемая мощность (2D / 3D), Ватт -/275 -/150 -/165 -/180 -/250
CrossFire/Sli V V V V V
Цена при анонсе, $ 649 415 500 650 650
Заменяемая модель Radeon
R9 295X
GeForce
GTX 970(80)
GeForce
GTX 780 Ti
GeForce
GTX 980(Ti)
GeForce
GTX
Titan Black