Выход в свет нашей первой статьи по настольным процессорам семейства Broadwell кроме всего прочего вызвал и пару справедливых замечаний, касающихся тестирования графического ядра в игровых приложениях. Действительно: тесты-то есть, но для сравнения взят только GPU HD Graphics 4600, с которым и так все понятно. А вот как успехи нового «графического топа» Intel выглядят на фоне процессоров AMD или недорогих дискретных видеокарт - с практической точки зрения вопрос более важный. Тем более, что процессоры C-серии дороже аналогичных Haswell долларов этак на 100, а этого вполне достаточно для приобретения Radeon R7 250X или чего-то близкого, то есть не совсем уж медленного решения.
Вот сегодня мы все вопросы и снимем.
Процессор | Intel Core i5–4690K | Intel Core i5–5675C | Intel Core i7–4770K | Intel Core i7–5775C |
Название ядра | Haswell | Broadwell | Haswell | Broadwell |
Технология пр-ва | 22 нм | 14 нм | 22 нм | 14 нм |
Частота ядра, ГГц | 3,5/3,9 | 3,⅓,6 | 3,5/3,9 | 3,3/3,7 |
Кол-во ядер/потоков | 4/4 | 4/4 | 4/8 | 4/8 |
Кэш L1 (сумм.), I/D, КБ | 128/128 | 128/128 | 128/128 | 128/128 |
Кэш L2, КБ | 4×256 | 4×256 | 4×256 | 4×256 |
Кэш L3 (L4), МиБ | 6 | 4 (128) | 8 | 6 (128) |
Оперативная память | 2×DDR3–1600 | 2×DDR3–1600 | 2×DDR3–1600 | 2×DDR3–1600 |
TDP, Вт | 88 | 65 | 84 | 65 |
Графика | HDG 4600 | IPG 6200 | HDG 4600 | IPG 6200 |
Кол-во EU | 20 | 48 | 20 | 48 |
Частота std/max, МГц | 350/1200 | 300/1100 | 350/1250 | 300/1150 |
Цена | Н/Д (0) | Н/Д (0) | $432(70) | Н/Д (0) |
Процессоров Intel будет две пары - чтобы четко понять, где у Core i7 есть преференции перед Core i5, а где одна суета сует и томление духа . Сравнение будет идти в игровых приложениях, разумеется, и с дискретной видеокартой. Этот вопрос мы, впрочем, уже исследовали, но там i5 и i7 были разночастотными, а сегодня мы их по этому параметру уравняли. В принципе, можно было бы и Broadwell той же частоты взять, но он такой есть только в виде Xeon, т. е. не сказать чтоб массовое решение. Так что тут прямых пересечений не будет - просто обе сокетные модели бытового назначения.
Процессор | AMD A10–6800K | AMD A10–7850K |
Название ядра | Richland | Kaveri |
Технология пр-ва | 32 нм | 28 нм |
Частота ядра std/max, ГГц | 4,¼,4 | 3,7/4,0 |
Кол-во ядер (модулей)/потоков вычисления | 2/4 | 2/4 |
Кэш L1 (сумм.), I/D, КБ | 128/64 | 192/64 |
Кэш L2, КБ | 2×2048 | 2×2048 |
Кэш L3, МиБ | - | - |
Оперативная память | 2×DDR3–2133 | 2×DDR3–2133 |
TDP, Вт | 100 | 95 |
Графика | Radeon HD 8670D | Radeon R7 |
Кол-во ГП | 384 | 512 |
Частота std/max, МГц | 844 | 720 |
Цена | $132(48) | $143(46) |
Процессоров AMD мы решили взять два - чтоб не скучно было. К тому же тут тоже интересно оценить прогресс графики, и не стоит забывать о том, что и у A10–6800K есть брат-близнец в виде Athlon X4 760K. А какой из «Атлонов» выбрать при использовании дискретной видеокарты (760К или 860К) - вопрос интересный с практической точки зрения. Тем более, 760К заработает и на плате с «обычным» FM2. Может быть такое, что пользователя перестал удовлетворять какой-нибудь старенький A6–5400K, и он решил сменить процессор и добавить дискретную видеокарту? Вполне может. Вот и посмотрим, есть ли при таком раскладе смысл менять системную плату.
Что касается прочих условий тестирования, то они были равными, но не одинаковыми: частота работы оперативной памяти была максимальной поддерживаемой по спецификациям, а они немножко отличаются. А вот ее объем (8 ГБ) и системный накопитель (Toshiba THNSNH256GMCT емкостью 256 ГБ) были одинаковыми для всех испытуемых. Все тесты проводились и при использовании встроенного видеоядра (которое есть у всех шести процессоров), и совместно с дискретным Radeon R7 250X.
Поскольку нами уже было установлено, что на программы из набора iXBT Application Benchmark 2015 конкретная видеокарта влияет очень слабо, мы ограничились игровой методикой iXBT Game Benchmark 2015. Все результаты были получены в разрешении 1920×1080 (Full HD) при минимальных настройках качества и в 1366×768 при максимальных настройках. Почему такой выбор? Максимальные настройки при FHD-разрешении «не по зубам» не только интегрированным видеоадаптерам, но и многим недорогим дискретным решениям. Но повысить качество хочется многим - пусть даже ценой снижения разрешения. Тем более, что снижение не всегда такое уж радикальное - на руках у пользователей все еще встречаются и старые мониторы вплоть до поддерживающих максимум 1280×1024 точки. Поэтому почему бы и не проверить «низкие» режимы. К тому же, при настройках на максимальное качество удельная доля нагрузки на GPU увеличивается, а нам сегодня как раз интересны GPU. И пусть даже они не справятся с работой - получится стресс-тест, хорошо демонстрирующий собственно возможности графики.
Как видим, HD Graphics в Haswell с этой задачей не справляется, на обоих А10 уже поиграть можно, но на грани, а Broadwell с Iris Pro сомнений не оставляет. Но если говорить об использовании дискретной видеокарты, то тут все процессоры равны. Цена же Athlon X4 в разы ниже, чем у любого Core i7. Такое же положение дел будет и в других играх с невысокими требованиями к производительности процессора, но высокими - к графике.
Но WoT, впрочем, прямая противоположность сформулированному выше - здесь графика нужна постольку-поскольку. Лишь бы не мешала. HD Graphics 4600 очевидно мало. Остальных - достаточно настолько, что при добавлении дискретной видеокарты производительность не увеличивается, а может даже снизиться.
Еще одна процессорозависимая игра, которой достаточно и HDG 4600 для выбранного режима. Впрочем, более быстрая графика даже при слабой процессорной части позволяет добиться более высоких результатов. А дискретный видеоадаптер показывает, что кэш четвертого уровня в ряде случаев действительно делает Broadwell-С куда более быстрым решением, нежели Haswell. Практической пользы, впрочем, от этого немного - 200 или 300 кадров это уже неважно. Тут, очевидно, надо качество повышать, чем мы чуть позже и займемся.
Игра тяжелая для всех систем, но в первую очередь - видеокарты. Как видим, только интегрированная графика Broadwell, причем в старшей модификации (GT3e) вообще позволяет играть в таком режиме: Haswell GT2 традиционно отстает вдвое, а лучшие IGP AMD - в полтора раза. Однако при использовании недорогой дискретной видеокарты все внезапно становятся равными: и дешевые Athlon (а отключение графической части в А10 именно так преобразует процессоры), и дорогие Core i7.
В предыдущей версии Metro расклад подобный. Правда тут уже А10 подбираются к порогу играбельности, но без натяжек пригодны только Broadwell-С и им подобные. Дискретка (даже такая относительно слабая, как 250Х) от производительности процессоров зато уже зависит. Другой вопрос, что «атлонов» по-прежнему хватит, а десятью кадрами в секунду можно и пренебречь.
В очередной уже раз Hitman похож на Metro 2033 с небольшими вариациями. Например, здесь очень по-разному ведут себя два А10 разных поколений даже при использовании дискретки, т.е. оптимизации в Kaveri - не пустой звук. Однако как не оптимизируй, а Core i5 намного быстрее. Что же касается интегрированных решений, то тут снова без натяжек пригодны только Broadwell-С - на остальных придется снижать разрешение.
Очень тяжелая игра с которой не может справиться даже Iris Pro! Впрочем, как видим, здесь и 250Х хватает без особого запаса - в паре с медленными процессорами так и вовсе на пороге играбельности.
Как мы уже не раз говорили, в минимальном режиме Tomb Raider прекрасно работает на всем (или почти на всем). Впрочем, новые Broadwell тут все равно есть за что похвалить, поскольку не так уж сильно отстают от бюджетной, но дискретной видеокарты:)
В этой игре без дискретки никуда. Причем, что любопытно, Iris Pro 6200 как обычно вдвое быстрее, чем HDG 4600, но вот решения AMD обгоняет уже незначительно. Судя по всему, основная нагрузка на шейдерные и прочие блоки, а их при помощи eDRAM не ускоришь. Посмотрим - как это проявится при увеличении качества.
Новых А10 более-менее хватает, Broadwell-С достаточно без натяжки, Haswell тут ловить нечего (если не считать R-серию, также снабженную видеоядром GT3e). Но…, но дешевле будет поставить дискретную видеокарту.
Итак, что мы имеем в режиме минимального качества? Broadwell-С справляются почти со всеми играми нашего набора, кроме одной. Производительность Broadwell GT3e примерно вдвое выше, чем у Haswell GT2, да и интегрированную графику AMD эти решения обходят раза в полтора. Но лучше, конечно, при возможности использовать дискретную видеокарту - это даже дешевле может выйти. И всегда уж как минимум не медленнее.
Дискретная видеокарта играть позволяет даже при использовании недорогого процессора, интегрированная графика все еще непригодна. Никакая.
С большим трудом и напрягаясь Core i5–5675C выбрался за 30 FPS. Более дешевая связка из Athlon X4 760K или 860К и R7 250X не напрягаясь набирает почти 40. Комментарии излишни.
Вот здесь Iris Pro 6200 выглядит очень хорошо. Пусть дискретная видеокарта и чуть быстрее, но незначительно. Хуже то, что ее использование не всегда возможно, так что появление мощного интегрированного видео - большое благо для тех, кто находится в таких условиях.
Недостаточно и младших дискретных карт - значит об интегрированных решениях можно забыть на практике. С точки зрения теории же любопытно то, что здесь они достаточно близки друг к другу, что немудрено: когда основная нагрузка ложится на сам GPU, никакие ухищрения в плане работы памяти уже не помогают.
Все еще более выражено чем в предыдущем случае. Любопытно разве что то, что HDG 4600 быстрее, нежели Radeon HD 8670D. Однако практически значимым это не является.
Опять не справляется даже дискретная карта, а ее отрыв от интегрированных решений увеличивается до трех-пяти раз. При минимальном же качестве, напомним, было иногда и меньше двух. Т.е. чем выше требования к GPU, тем больше разница между интегрированными и дискретными вариантами последних. Что более чем ожидаемо, но не всеми учитывается.
При наличии дискретной видеокарты играть можно, а вот интегрированной совсем не хватает, причем любой. Аналогичная картина была и на минимальных настройках FHD, только тут она стала еще нагляднее. Но ничего удивительного - вообще для этой игры желательны карты уровня минимум Radeon R7 265 и выше. И таких игр не так уж мало.
Если при минимальных настройках эта игра очень щадяща к видеосистеме, то увеличение качества может «поставить на колени» и куда более мощные решения, чем нами сегодня рассматриваются. Т.е. пространство для маневра здесь огромное, но удачно им воспользоваться могут только владельцы дискретных видеокарт.
Аналогичным образом ведет себя и Sleeping Dogs, только вот преимущества дискретного решения еще более зримы. А вот бенефиции от eDRAM еще заметнее улетучиваются, поскольку до скорости текстурирования дело даже не доходит: пока еще слишком слабы сами графические процессоры. Но слабы по-разному, так что интегрированный Radeo R7 может даже обогнать Iris Pro. На практике, впрочем, это не имеет значения, поскольку оба все равно слишком медленные.
И еще один подобный случай подтверждает высказанную выше гипотезу:)
В общем и целом, как видим, попытки использования режимов с высоким качеством картинки (пусть даже со снижением разрешения) только лишь н
прочитано 54005 раз
Производительность нового гибридного процессора A10-7850K сравнивалась со скоростью работы его прямого конкурента — Core i5-4440, интеловского предложения аналогичной стоимости, построенного на базе новейшего дизайна Haswell. Попутно по скорости работы флагманской модели Kaveri мы сравнивали и со старшей модификацией Richland, A10-6800K. Также в число результатов тестов добавлены показатели производительности рассмотренного нами ранее A8-7600: этот процессор по сравнению с A10-7850K имеет более низкую тактовую частоту и снабжён урезанным графическим ядром, построенным на базе 384 шейдерных процессоров.
В результате набор тестового оборудования приобрёл следующий вид:
Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Enterprise x64 с использованием следующего комплекта драйверов:
В первую очередь мы тестируем процессоры в платформах с установленной производительной дискретной видеокартой. Такая конфигурация позволяет сравнивать x86-производительность различных архитектур и даёт информацию о том, насколько те или иные CPU подходят для работы в составе производительных систем, где внешние видеокарты верхнего ценового диапазона устанавливаются в обязательном порядке. В этом случае графическое ядро процессоров задействовать невозможно, и оно деактивируется.
Следует подчеркнуть, что в контексте изучения A10-7850K такое тестирование имеет прямой практический смысл. AMD отказалась от дальнейшего развития своих процессоров серии FX, поэтому роль CPU для систем с дискретной графикой постепенно перейдёт к Kaveri или к их последователям.
Futuremark PCMark 8 2.0
По традиции в первую очередь для измерения производительности мы пользуемся интегральным тестом PCMark 8 2.0, который моделирует различные варианты типовой нагрузки на систему. Рассматриваются три сценария: Home — обычное домашнее использование ПК, Creative — использование ПК для развлечений и для работы с мультимедийным контентом и Work — использование ПК для типичной офисной работы.
Если вы читали наш предыдущий материал о процессорах Kaveri, то приведённые результаты не станут для вас неожиданностью. Да, вычислительная производительность ядер Steamroller невысока, поэтому четырёхъядерный Kaveri сильно отстаёт от младшего четырёхъядерного Haswell. Это было вполне ожидаемо, поэтому гораздо более сильное удивление способен вызвать тот факт, что A10-7850K отстаёт не только от Haswell, но и от A10-6800K поколения Richland. Очевидно, микроархитектурных улучшений Steamroller категорически не хватает для того, чтобы скомпенсировать понизившуюся тактовую частоту этого процессора. В результате старая модель APU оказывается быстрее новой на 3-4 процента.
Забавно, что, оправдывая достаточно большую установленную на A10-7850K цену, сама AMD ссылается на высокие показатели этого процессора именно в PCMark 8. Дело в том, что AMD имеет в виду результаты со включённым OpenCL-ускорением, но в случае использования дискретной видеокарты им воспользоваться невозможно, что и приводит к той печальной картине, которая отображена на приведённых диаграммах.
Производительность в приложениях
В Adobe Photoshop CC проводится тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений с цифровой камеры.
В Autodesk 3ds max 2014 мы тестируем скорость финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920x1080 с применением рендерера mental ray одного кадра стандартной сцены Space_Flyby из тестового пакета SPEC.
В Мaxon Cinebench R15 проводится измерение быстродействия фотореалистичного трёхмерного рендеринга в анимационном пакете CINEMA 4D. Применяемая в бенчмарке сцена содержит порядка 2 тысяч объектов и состоит из 300 тысяч полигонов.
Тестирование скорости архивации измеряется в WinRAR 5.0. Здесь тестируется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. При этом используется максимальная степень компрессии.
Для тестирования скорости транскодирования видео в формат H.264/AVC мы пользуемся широко распространённым кодеком x264 версии r2358. Для оценки производительности используется исходный 1080p@50fps AVC-видеофайл из бенчмарка x246 FHD Benchmark 1.0.1, имеющий битрейт около 30 Мбит/с.
Отставание A10-7850K от похожего по стоимости Core i5-4440 составляет от 30 до 70 процентов. Иными словами, выбор процессоров семейства Kaveri для использования в составе систем с дискретной видеокартой смысла не имеет вообще. Даже более дешёвый A10-6800K, относящийся к прошлому поколению APU, зачастую способен предложить более высокую скалярную вычислительную производительность.
Производительность в играх
Тестирование в играх мы провели с использованием Full HD-разрешения и высоких настроек качества. Наша высокопроизводительная дискретная видеокарта GeForce GTX 780 Ti позволяет увидеть существенные различия в процессорной скорости даже в этом случае. Используемые настройки:
Полученные в игровых тестах результаты ещё раз подтверждают всё сказанное выше. Вычислительная производительность A10-7850K не лучше, чем у A10-6800K. Процессор поколения Richland, хоть и основывается на микроархитектуре Piledriver, а не Steamroller, имеет на 10 процентов более высокую тактовую частоту и более агрессивную технологию турбо. Этого вполне хватает, чтобы обеспечить большее количество кадров в секунду в играх при использовании дискретной видеокарты.
Поэтому нет ничего удивительного и в том, что A10-7850K не сравним по игровому быстродействию с Core i5-4440. Интеловский четырёхъядерник выдаёт куда более высокие показатели производительности в играх, так что для производительных геймерских систем платформа Socket FM2+ совершенно не подходит. Впрочем, это вряд ли стало для кого-то неожиданностью: с невысокой игровой производительностью процессоров AMD мы сталкиваемся каждый раз, когда речь заходит о носителях микроархитектуры Bulldozer или её последователей.
Steamroller против Piledriver
Полученные в вычислительных тестах результаты заставляют задаться вопросом, насколько же в действительности микроархитектура Steamroller прогрессивнее своей предшественницы. AMD утверждала, что рост производительности при постоянной тактовой частоте составит 15-20 процентов. Но практические результаты явно говорят о том, что внедрённые усовершенствования зачастую не компенсируют 10-процентное снижение тактовой частоты. Поэтому мы решили посмотреть, насколько Kaveri будет быстрее Richland, при условии их тактования на одинаковой частоте.
В следующей таблице приводятся результаты тестов, проведённых с процессорами A10-7850K и A10-6800K, частота которых была принудительно установлена на отметке 4,0 ГГц.
Kaveri 4,0 ГГц | Richland 4,0 ГГц | Преимущество Steamroller | |
---|---|---|---|
PCMark 8 2.0, Home | 2937 | 2873 | +2,2 % |
PCMark 8 2.0, Work | 2825 | 2796 | +1,0 % |
PCMark 8 2.0, Creative | 2990 | 2894 | +3,3 % |
WinRAR 5.0, секунды | 204,8 | 197,3 | -3,7 % |
Photoshop CC, секунды | 150,3 | 157,5 | +4,8 % |
3ds max 2014, секунды | 248 | 339 | +36,7 % |
x264 (r2358), fps | 15,1 | 12,92 | +16,9 % |
Cinebench R15 | 336,8 | 310,8 | +8,4 % |
Metro: Last Light, 1920x1080 SSAA HQ | 45,8 | 43,1 | +6,3 % |
Civilization V, 1920x1080 4xAA HQ | 56,3 | 53,7 | +4,8 % |
F1 2013, 1920x1080 4xAA UHQ | 72,5 | 75,8 | -4,4 % |
Batman: Arkham Origins, 1920x1080 4xAA UHQ | 75 | 71,1 | +5,5 % |
Соотношение между производительностью Steamroller и Piledriver оказывается очень неоднородным. В лучшем случае преимущество новой микроархитектуры превышает 35 процентов, а в худшем — она проигрывает до 4 процентов. Среднее же значение превосходства Kaveri над Richland в производительности на одинаковой тактовой частоте составляет около 7 процентов.
Характер полученных результатов позволяет сделать однозначный вывод, что в первую очередь превосходство Steamroller над Piledriver выявляется на многопоточных алгоритмах, задействующих целочисленные инструкции. Иными словами, выполненное в Steamroller разделение общего на двухъядерный модуль декодера инструкций вместе с другими оптимизациями позволило поднять эффективность работы целочисленных исполнительных устройств. Поэтому задачи вроде трёхмерного рендеринга или перекодирования видео получили очень заметный прирост в скорости выполнения. В том же случае, когда приложения активно используют всё ещё разделяемый блок операций с вещественными числами или SIMD-инструкции, прирост производительности оказывается заметно меньше.
Наблюдающееся же в отдельных случаях падение производительности, похоже, связано с ухудшением скоростных характеристик контроллера памяти, который у Kaveri создаёт бо льшую латентность при обращениях, чем у Richland.
Kaveri 4,0 ГГц |
Richland 4,0 ГГц |
Причины этого эффекта, вероятно, состоят в том, что контроллер памяти Kaveri на уровне архитектуры спроектирован универсальным и, помимо двух DDR3-каналов, имеет два дополнительных канала с поддержкой GDDR5-памяти. У имеющихся на данный момент моделей процессоров эта функциональность заблокирована, но её потенциальное наличие, как показывают тесты, несколько тормозит работу всей подсистемы памяти.
Игровая производительность
То, что традиционная вычислительная производительность A10-7850K не столь высока, как того хотелось бы, ещё ничего не значит. Просто не надо рассматривать этот процессор в качестве возможной основы системы, оснащённой дискретной видеокартой, — он для этого совершенно не годится. Его сильная сторона в другом: Kaveri может позволить обойтись вообще без какой-либо видеокарты. Встроенное в него графическое ядро семейства Radeon R7 нацеливается на то, чтобы предложить достойную для игровых систем производительность.
Говоря о возможностях встроенной в A10-7850K графики, AMD подчёркивает, что она быстрее, чем графические карты, установленные в 35 процентов игровых компьютеров (по данным Steam).
Благодаря этому данный гибридный процессор может обеспечить достаточно высокий уровень графической производительности (больше 30 кадров в секунду в Full HD-разрешении) не только в большинстве сетевых игр, но и в популярных однопользовательских играх.
Однако начать тестирование графической производительности видеоядра процессора A10-7850K мы решили с традиционного бенчмарка 3DMark Professional Edition 1.2. Результаты этого гибридного процессора сопоставлялись с показателями не только интегрированной графики A10-6800K, A8-7600 и Core i5-4440, но и дискретных видеоускорителей Radeon HD 7750 и Radeon R7 250.
Превосходство графического ядра A10-7850K над всеми остальными вариантами интегрированной графики очевидно. Благодаря новой архитектуре GCN 1.1 и увеличенному до 512 числу шейдерных процессоров рассматриваемый APU заметно превосходит по скорости как старший Richland, так и Haswell. Фактически A10-7850K на данный момент действительно предлагает самую производительную интегрированную графику для настольных компьютеров.
Однако, несмотря на это, A10-7850K всё-таки не дотягивает по своему результату до показателей графических карт Radeon HD 7750 и Radeon R7 250. Проблема встроенной в APU графики известна давно: недостаточно высокая пропускная способность подсистемы памяти ограничивает её производительность. Поэтому A10-7850K не только заметно отстаёт от Radeon HD 7750 с 512 шейдерными процессорами, но и проигрывает даже Radeon R7 250, у которого число шейдерных процессоров ограничено 384. Дискретные видеокарты оснащаются GDDR5 с пропускной способностью свыше 70 Гбайт/с, используемая же в платформе Socket FM2+ двухканальная память DDR3-2133 может предложить полосу пропускания лишь на уровне 34 Гбайт/с.
Впрочем, давайте посмотрим, что происходит в реальных играх.
В многопользовательском шутере Battlefield 4 интегрированная графика процессора A10-7850K, как и обещала AMD, оказывается способной обеспечить в Full HD-разрешении комфортное количество кадров в секунду даже при средних настройках качества. Превосходство над старшим Richland составляет 16-18 процентов, а над Haswell — достигает 70 процентов. Однако любителям поиграть при высоком качестве изображения всё-таки придётся снизить разрешение где-то до уровня 720p. К сожалению, графика A10-7850K не может предложить сравнимый с показателями Radeon HD 7750 и Radeon R7 250 уровень быстродействия: эти видеокарты быстрее на 35-40 процентов.
Популярный шутер Crysis 3 отличается высокими требованиями к производительности графического ускорителя, и здесь мы сталкиваемся с тем, что A10-7850K не может выдать приемлемую производительность в Full HD даже при минимальном качестве изображения. Очевидно, обладателям игровых систем на базе A10-7850K придётся в некоторых случаях разрешение снижать. Например, в том же Crysis 3 30 кадров в секунду при среднем качестве изображения можно получить лишь в разрешении 720p. Надо заметить, что видеокарты Radeon HD 7750 и Radeon R7 250 от такой проблемы избавлены.
Гоночный симулятор F1 2013 не отличается высокими требованиями к производительности графической подсистемы, поэтому, имея платформу на базе A10-7850K, в Full HD в него можно играть даже с высоким качеством изображения. Преимущество старшего Kaveri перед Richland здесь составляет 25-30 процентов.
Ещё одна требовательная к мощности графики игра, помимо Crysis 3, — это шутер Metro: Last Light. Обладая конфигурацией на базе A10-7850K без дискретного видеоускорителя, комфортно поиграть в него в Full HD-разрешении не удастся даже при минимальных настройках, а при среднем качестве разрешение придётся понижать до 720p. Стодолларовые дискретные видеокарты Radeon HD 7750 и Radeon R7 250 предлагают на 30-40 процентов более высокую производительность и неплохо справляются с отображением Metro: Last Light в недоступном для A10-7850K разрешении 1920x1080. Иными словами, говорить о Kaveri как о процессоре, встроенный графический движок которого способен обеспечить возможность установки Full HD-разрешения в любых играх, совершенно неправомерно.
В приключенческом боевике от третьего лица Tomb Raider производительность графической составляющей A10-7850K находится на неплохом уровне. В разрешении 1920x1080 возможна установка среднего качества изображения, при этом превосходство над Richland составляет 7-15 процентов. Графическое ядро GT2 процессора Haswell отстаёт от графики A10-7850K на внушительные 50-75 процентов, делая любые десктопные интеловские предложения плохим вариантом для использования в игровых системах, опирающихся на встроенные в CPU графические ядра.
Кстати, хочется обратить внимание на один любопытный момент: A10-7850K демонстрирует лишь слегка более высокое быстродействие, чем A8-7600, несмотря на то, что количество шейдерных процессоров в старшем APU на треть больше. Это — ещё одна иллюстрация к тому, что производительность интегрированных ядер AMD упёрлась совсем не в их графические ресурсы, а в пропускную способность памяти. Поэтому то, что Radeon HD 7750 и Radeon R7 250, оснащённые 128-битной GDDR5-памятью, выдают на 35-40 процентов более высокий FPS, удивлять не должно.
AMD отдельно напирает на то, что интегрированные системы, построенные на её процессорах, могут стать хорошим выбором для поклонников сетевых Free-to-play- игр. Наши тесты в многопользовательском боевом авиационном аркадном симуляторе War Thunder это всецело подтверждают. Обладатели конфигураций с процессором A10-7850K смогут комфортно играть в эту игру в Full HD-разрешении при выборе высокого качества изображения. Выгодно смотрятся тут и другие процессоры AMD. Интеловский же Haswell с графическим ядром GT2 подобный уровень производительности обеспечить не в состоянии.
В то же время самая популярная многопользовательская игра World of Tanks предъявляет к производительности графической подсистемы более высокие требования. Для получения комфортной частоты кадров в разрешении 1920x1080 обладателям A10-7850K в ней придётся снизить качество до среднего. И кстати, старший Kaveri тут не обеспечивает заметных преимуществ по сравнению с Richland — вероятно, причина кроется в высокой процессорозависимости данной игры. Впрочем, как бы то ни было, гибридный процессор A10-7850K — вполне достойный выбор для системы преданного поклонника танков. Однако дискретные графические карты с ценой порядка 100 долларов и здесь, как и в других случаях, позволяют получить на 30-35 процентов более высокую производительность.
То, что внешние видеокарты с аналогичной A10-7850K конфигурацией графического ядра обладают заметно более высоким быстродействием, а также то, что разница в практической скорости графики у A10-7850K и A8-7600 достигает лишь 5-10 процентов, явно указывает на главное узкое место в графической производительности — скорость подсистемы памяти. Совершенно очевидно, что для повышения производительности работы встроенной в Kaveri графики нужна более быстрая память. AMD планировала наделить Kaveri поддержкой более скоростных, чем DDR3, типов SDRAM, но что-то пошло не так, и финальные версии десктопных процессоров, хотя и перешли на новую платформу Socket FM2+, оказались совместимы лишь с традиционной DDR3 SDRAM.
Это значит, что нарастить скорость подсистемы памяти в Kaveri можно лишь использованием более скоростных модулей DDR3. Формально эти процессоры поддерживают модули с частотой до DDR3-2133, и именно с такой памятью мы и проводили тесты. Однако, как показала практика, в системы с A10-7850K можно устанавливать и DDR3-2400. О том, какой прирост производительности можно получить в этом случае, мы и поговорим ниже. А заодно посмотрим, насколько потеряет в своей скорости A10-7850K, если систему с ним комплектовать не DDR3-2133, а более медленными модулями.
Приведённые диаграммы вряд ли нуждаются в подробных комментариях. Они очень наглядно указывают на то, насколько важна для Kaveri быстрая память. Переход с DDR3-2133 на DDR3-2400 позволяет получить заметный прирост быстродействия — порядка 5 процентов. Если же в системе с A10-7850K использовать не DDR3-2133, а, например, ширпотребную DDR3-1600, то потери в игровом быстродействии будут доходить до 20 процентов. Иными словами, собирая недорогую геймерскую систему с A10-7850K, экономить на памяти явно не следует.
Как и графические карты поколения Volcanic Islands, процессоры Kaveri, основанные на той же архитектуре GCN, обладают поддержкой нового графического программного интерфейса Mantle. Это название давно будоражит умы обладателей новых видеокарт AMD, так как внедрение данного интерфейса обещает достаточно серьёзное увеличение производительности в играх. Аналогично дело обстоит и с Kaveri: внедрение Mantle может стать ещё одним способом более полного раскрытия потенциала встроенного графического ядра. Будучи хорошо осведомлённым об аппаратных тонкостях APU, Mantle предлагает специально оптимизированную прослойку между игровым движком и аппаратными ресурсами вычислительных и графических ядер. Подобный низкоуровневый программный интерфейс давно используется в игровых консолях, и там он показывает очень хорошие результаты. Поэтому широкое внедрение Mantle в современных играх способно поднять привлекательность Kaveri для экономных геймеров.
Для систем, построенных на базе процессоров Kaveri, Mantle не только реализует разнообразные низкоуровневые оптимизации, но и осуществляет более равномерное распределение нагрузки, создаваемой графическим драйвером, по x86-ядрам процессора. Однако следует иметь в виду, что в наибольшей степени Mantle эффективен тогда, когда игровая производительность упирается в скорость вычислительных ресурсов процессора, а в конфигурациях, использующих интегрированные видеоядра, ситуация обычно обратна: узким местом выступают мощности GPU и пропускная способность шины памяти. Тем не менее в момент представления Kaveri AMD говорила о возможном росте производительности, который можно получить за счёт фирменного API, — этот рост в реальных играх якобы достигает 45-процентной величины.
На данный момент у AMD уже готов бета-драйвер версии 14.1, поддерживающий Mantle, и существует игра — Battlefield 4, способная использовать этот программный интерфейс. Естественно, мы протестировали, как включение Mantle сказывается на частоте кадров в том случае, когда для запуска Battlefield 4 используется геймерская система с интегрированной графикой, построенная на базе процессора A10-7850K.
Никакими 45 процентами прироста тут и не пахнет. Увеличение количества кадров в секунду в Battlefield 4 в системе, основанной на A10-7850K, не превышает единиц процентов. Как известно, максимальный прирост активация Mantle даёт в системах со слабым процессором и мощной графической картой, а в случае с A10-7850K соотношение производительности вычислительных ядер и GPU — обратное.
В то же время от включения Mantle в системе на базе A10-7850K есть и заметный негативный эффект. Просто смотреть надо не на средний, а на минимальный FPS.
Минимальный FPS при задействовании Mantle по сравнению с DirectX заметно падает, то есть фирменный программный интерфейс AMD ухудшает плавность игры без каких-либо к тому предпосылок. Возможно, проблема кроется в том, что на данный момент драйвер Mantle находится в бета-стадии. Хочется верить, что AMD ещё внесёт в него какие-то изменения, которые смогут исправить низкий минимальный FPS и дополнительно поднимут скорость работы Battlefiled 4 через Mantle в системах, построенных на APU компании.
Каждый раз, когда дело касается тестирования встроенной процессорной графики, компания AMD предъявляет свой уникальный козырь — технологию Dual Graphics. Эта продвигаемая со времён Llano технология позволяет формировать ассиметричные CrossFire-конфигурации с участием встроенного в процессор графического ядра. Не обошла она стороной и Kaveri. Интегрированное видеоядро процессора A10-7850K, относящееся к серии Radeon R7, может быть «спарено» с любой дискретной видеокартой того же семейства Radeon R7, установленной в слот PCI Express. Ранее считалось, что на архитектуру таких видеокарт накладываются определённые ограничения, но на самом деле никаких рамок нет: вместе с A10-7850K в режиме Dual Graphics может работать любая графическая карта Radeon R7 с архитектурой GCN.
Причём с выпуском Kaveri и выходом драйвера Catalyst 14-й версии AMD наконец-то удалось решить давнюю проблему с тиарингом (разрывами кадров) выводимого изображения, которая напрямую затрагивала Dual Graphics-конфигурации. Теперь технология Dual Graphics работает значительно лучше и не вызывает никаких неприятных артефактов, поэтому её вполне можно рассматривать в качестве одного из путей увеличения графической производительности.
Для ознакомления с работой Dual Graphics в системе на базе Kaveri мы протестировали производительность комбинации A10-7850K и графической карты Radeon R7 250 с GDDR5-памятью.
Максимальный прирост быстродействия технология Dual Graphics обещает в том случае, если производительность процессорной графики и дискретной видеокарты примерно одинакова. Поэтому самой выгодной парой для A10-7850K AMD называет Radeon R7 240. Radeon R7 250 же дороже и быстрее, поэтому встроенная в процессор графика помогает ему не слишком сильно: увеличение производительности по сравнению с одиночной видеокартой составляет от 35 до 45 процентов.
При этом технология Dual Graphics так и не лишилась своих ограничений, которые во многих случаях ставят её полезность под вопрос. Как можно видеть по результатам, положительный эффект она даёт далеко не всегда. Существует огромное число игр, которые не только не получают прирост от Dual Graphics, но и, напротив, начинают выдавать меньшую частоту кадров. Связано это как с отсутствием необходимых оптимизаций драйвера, так и с тем, что в ряде случаев Dual Graphics вообще не включается на программном уровне. Например, эта технология может ускорять исключительно игры, работающие через DirectX 10/11, но не DirectX 9. Иными словами, масштабируемость, которую может предложить Dual Graphics, совершенно не впечатляет.
Наряду с игровыми приложениями графическое ядро процессоров Kaveri могут использовать для ускорения вычислений и обычные приложения общего назначения. Как уже говорилось, с выходом Kaveri компания AMD внедряет архитектуру HSA, делающую шейдерные кластеры графического ядра самостоятельными структурными единицами и упрощающую тем самым программирование и использование для вычислений параллельных шейдерных процессоров. Однако внедрение HSA и заточенного под эту архитектуру фреймворка OpenCL 2.0 — дело отдалённого будущего, пока же AMD даже не может предложить необходимого для включения данной технологии драйвера. Зато поддержка OpenCL 1.1 в Kaveri, как и в других разновидностях современных процессоров с интегрированной графикой, превосходно работает, и поддерживающие OpenCL приложения могут переносить часть своей вычислительной работы на шейдерные конвейеры через этот программный интерфейс.
База программных продуктов, способных задействовать гетерогенные возможности гибридных процессоров, неуклонно растёт и сегодня включает внушительное число популярных программ.
Предстоящее внедрение HSA должно расширить этот список, тем не менее стоит заметить, что ускорить за счёт использования параллельных процессоров графического ядра можно всё-таки не любые алгоритмы. В качестве применений, где использование гибридных возможностей APU может иметь практический смысл, AMD называет задачи распознавания образов, анализ биометрических параметров, системы дополненной реальности, задачи кодирования, редактирования и перекодирования аудио и видео, а также поиск и индексирование мультимедийных данных.
В идеале, мы бы не хотели прибегать к отдельным тестам производительности в задачах, использующих OpenCL. Было бы гораздо лучше, если бы поддержка гетерогенных процессоров появилась в общеупотребительных приложениях, в том числе и тех, которые мы используем для обычного тестирования. Однако такого пока нет: гибридные вычисления внедрены далеко не везде, причём в подавляющем числе случаев OpenCL-ускорение применяется лишь для реализации каких-то конкретных функций, и, чтобы его увидеть, необходимо придумывать специальные тесты. Поэтому исследование гетерогенной производительности и стало отдельной и независимой частью нашего материала.
Первым и наиболее известным тестом OpenCL-производительности выступает бенчмарк Luxmark 2.0, который построен на базе рендера LuxRender, использующего физическую модель распространения света. Для оценки гетерогенной производительности процессоров мы используем сцену средней сложности Sala, а её рендеринг выполняем с задействованием как графических, так и x86-ядер.
Как нетрудно заметить, подключение к работе вычислительных ресурсов графических ядер приводит к серьёзному увеличению производительности, но качественно меняет не слишком многое. Процессоры Intel, как и APU компании AMD, вполне способны предложить похожую функциональность: их современные модификации поддерживают OpenCL 1.1 полноценно и без каких-либо ограничений. Поэтому при использовании мощности графического ядра старший Kaveri сохраняет своё отставание от четырёхъядерного Haswell. Оно здесь не столь катастрофично, как в задачах, опирающихся лишь на x86-ядра, но тем не менее A10-7850K полноценным конкурентом для Core i5-4440 не выглядит.
Ещё один тест, активно задействующий ресурсы графических ядер, это SVPMark 3. Он измеряет производительность системы при работе с пакетом SmoothVideo Project, направленным на повышение плавности воспроизведения видео путём добавления в видеоряд новых кадров, которые содержат промежуточные положения объектов.
На диаграмме можно увидеть производительность процессоров как без задействования ресурсов их графических ядер, так и после включения GPU-ускорения. Достаточно любопытно, что заметное ускорение при этом получает не только Kaveri, но и Haswell. Так, задействование OpenCL поднимает производительность A10-7850K на 48 процентов, а Core i5-4440 ускоряется на 33 процента. Если же учесть, что Core i5 может предложить четыре x86-ядра с более высокой удельной производительностью, в конечном итоге гетерогенное быстродействие A10-7850K и Core i5-4440 устанавливается примерно на одинаковом уровне.
Одним из самых значительных достижений концепции APU, свидетельствующих о её принятии рынком программного обеспечения, стало появление поддержки OpenCL в популярном архиваторе WinZIP. Поэтому измерение скорости архивации в WinZIP 18 мы обойти стороной не могли. В целях тестирования сжатию подвергалась папка с распакованным дистрибутивом Adobe Photoshop CC.
WinZIP хорошо иллюстрирует тезис о том, что ускорению за счёт переноса нагрузки на графические ядра можно подвергнуть далеко не все алгоритмы. Хотя формально WinZIP имеет поддержку OpenCL, в реальности параллельные графические ядра подключаются к работе лишь при сжатии файлов объёмом более 8 Мбайт. Более того, особого выигрыша в скорости от этого нет, поэтому разница в производительности гибридных процессоров со включённым и отключённым OpenCL минимальна. Соответственно, более высокое быстродействие здесь во всех случаях показывает интеловский четырёхъядерный Haswell.
Формальная поддержка OpenCL появилась и в популярном графическом редакторе Adobe Photoshop CC. Правда, на самом деле гетерогенные возможности APU используются лишь в работе нескольких фильтров. В частности, AMD рекомендует измерять производительность при выполнении операции Smart Sharpen, что мы и проделали с 24-мегапиксельным изображением.
Прирост скорости работы фильтра Smart Sharpen, который можно получить при вовлечении в работу графической части современных процессоров, впечатляет. Данная операция начинает выполняться в системе с A10-7850K на 90 процентов быстрее, а в системе с Core i5-4440 — быстрее на 45 процентов. Иными словами, на примере фильтра Smart Sharpen мы можем увидеть хорошую вычислительную производительность графического ядра Kaveri, но она всё равно не позволяет A10-7850K опередить похожий по стоимости четырёхъядерный Haswell. И кстати, даже со включённым OpenCL-ускорением старший Richland превосходит A10-7850K за счёт более высокой тактовой частоты своих вычислительных и графических ядер.
Может быть перенесена на GPU и часть операций по транскодированию видео высокого разрешения. Для проверки того, какой прирост в скорости можно получить в этом случае, мы воспользовались поддерживающей OpenCL утилитой MediaCoder 0.8.28. Оценка производительности проводится с использованием исходного 1080p@50fps файла в AVC-формате из бенчмарка x246 FHD Benchmark 1.0.1, имеющего битрейт около 30 Мбит/с.
Здесь производительность Kaveri за счёт задействования для вычислений графического ядра удаётся увеличить совсем незначительно. Зато интеловский Core i5-4440, обладающий поддержкой специальной технологии для перекодирования видео Quick Sync, при включении вычислительных ресурсов графического ядра наращивает свою скорость в разы. На самом деле и в процессорах AMD есть похожая технология для аппаратного кодирования видеоконтента — VCE. Однако по какой-то причине ни одна из распространённых утилит для перекодирования видео этот движок не поддерживает. Будем надеяться, что с внедрением в Kaveri новой и более гибкой версии этого движка VCE 2 ситуация наконец сможет поменяться.
Ещё один пример популярного приложения, поддерживающего OpenCL, — это профессиональная программа для редактирования и монтажа видео Sony Vegas Pro 12. При выполнении в ней рендеринга видео нагрузка может распределяться по разнородным ресурсам гибридных процессоров.
Вовлечение в вычислительную работу графического ядра процессоров Kaveri позволяет получить очень весомый прирост в скорости рендеринга видео. Однако это всё равно не позволяет старшему APU компании AMD догнать конкурирующий Core i5-4440. Современные интеловские процессоры располагают гораздо более производительными x86-ядрами, поэтому даже при активации OpenCL A10-7850K серьёзно не дотягивает до скорости Haswell. Кроме того, интеловские процессоры тоже поддерживают OpenCL и ускоряются при подключении к вычислительной работе ресурсов графического ядра. Прирост скорости при этом не такой впечатляющий, как у APU компании AMD, тем не менее списывать его со счетов явно не стоит.
По просьбе AMD мы включили в эту часть тестирования и Futuremark PCMark 8 2.0. Данный бенчмарк при моделировании обычной пользовательской активности в общеупотребительных задачах может задействовать OpenCL-ускорение. И тогда мы можем получить представление о той производительности, которую будут показывать гибридные процессоры в идеальном случае, когда эффективную поддержку гетерогенных вычислений получат все распространённые приложения.
Понятно, почему AMD использует результаты PCMark 8 2.0 во всех своих маркетинговых материалах. Благодаря своему сильному графическому ядру A10-7850K побеждает во всех трёх сценариях: Home, Creative и Work. Это явно указывает на то, что при условии грамотной гетерогенной оптимизации приложений процессоры Kaveri могут оказаться гораздо лучше интеловских CPU. Иными словами, развиваемая AMD концепция APU действительно имеет большой потенциал, полноценно раскрыть который и должно помочь внедрение технологии HSA.
Энергопотребление — это ещё один традиционно больной вопрос для процессоров AMD. По крайней мере для их производительных модификаций, которые не имеют искусственно заниженных частот для удовлетворения требованиям экономичных тепловых пакетов. С выпуском процессоров Kaveri AMD рассчитывала немного поправить сложившуюся ситуацию и даже немного уменьшила расчётные показатели тепловыделения для старших моделей линейки A10. Помочь улучшению энергетических характеристик должен был не только новый 28-нм техпроцесс, но и снизившиеся тактовые частоты. Иными словами, удельная производительность в пересчёте на каждый затраченный ватт должна была возрасти.
Как же обстоит дело на практике? На следующих ниже диаграммах приводится полное потребление систем (без монитора), использующих встроенную процессорную графику, измеренное на выходе из розетки, в которую подключен блок питания тестовой платформы. Все имеющиеся в процессорах энергосберегающие технологии активированы. Нагрузка на процессорные ядра создаётся 64-битной версией утилиты LinX 0.6.5 с поддержкой набора инструкций AVX, а графические ядра нагружаются утилитой Furmark 1.12.
Потребление современных процессоров в состоянии простоя близко к нулю, так что показатели, приведённые на графике выше, касаются скорее платформ в целом, нежели исследуемых APU. Поэтому не удивительно, что, вне зависимости от того, какой процессор установлен в платформе Socket FM2+ , потребление получается примерно одинаковым. Система же на базе Haswell потребляет меньше — сказываются энергосберегающие технологии, которыми располагают современные наборы логики Intel.
При полной нагрузке на x86-ядра неожиданно выясняется, что A10-7850K стал даже более прожорливым, чем предыдущий флагман поколения Richland, A10-6800K. Потребление нового процессора выше на 9 Вт — даже несмотря на то, что его рабочие частоты заметно меньше. Соответственно, ни о каком соперничестве в экономичности с интеловскими четырёхъядерниками речь вести невозможно.
При графической нагрузке ситуация несколько отличается. Графическое ядро процессоров Kaveri обладает заметно лучшей экономичностью, чем графика Richland. Однако необходимо упомянуть один нюанс: Kaveri умеют динамически управлять частотой своего графического ядра, и при высокой нагрузке она автоматически снижается. По всей видимости, в данном случае мы как раз и столкнулись с пределом по потреблению, поскольку во время тестирования A10-7850K и A8-7600 частота их GPU периодически снижалась со штатных 720 МГц до 650 МГц, а временами — даже до 550 МГц.
Невысокое потребление демонстрируют Kaveri и при параллельной нагрузке на все ядра одновременно. Однако в данном тесте мы столкнулись с интеллектуальным управлением частотой не только GPU, но и вычислительных ядер. Как оказалось, при высокой графической нагрузке Kaveri не только сбрасывают частоту своего GPU, но и ограничивают частоту процессорных ядер 3-гигагерцовой величиной. В результате при одновременной высокой нагрузке на все ресурсы гибридного процессора его потребление оказывается не слишком большим, но это, естественно, сказывается и на производительности.
Старшая модель Kaveri, A10-7850K, формально относится к числу оверклокерских моделей, обладающих разблокированными множителями, — на это недвусмысленно указывает литера K в конце модельного номера. Но в данном случае это скорее дань традиции, нежели реальная сильная сторона новинок. Новый, применяемый для изготовления Kaveri, 28-нм SHP (Super High Performance) техпроцесс совершенно не способствует появлению у этих APU нераскрытого частотного потенциала. И даже с теоретических позиций новые гибридные процессоры должны гнаться ещё хуже, чем их предшественники, тоже не отличавшиеся хорошими возможностями разгона.
Это подтвердилось и на практике. Максимальной частотой, при которой A10-7850K, с одной стороны, сохранял стабильность, а с другой — не снижал свою скорость из-за превышения предельной температуры, оказалась 4,4 ГГц. Напряжение питания на процессоре при этом пришлось поднять до 1,375 В.
Следует подчеркнуть, что разгон A10-7850K — не такая уж и тривиальная процедура из-за интеллектуальных алгоритмов динамического управления частотой в зависимости от температурного режима и нагрузки. Увеличение процессорного множителя выше номинала на первый взгляд проходит очень легко и редко когда вызывает проблемы со стабильностью. Но при тестировании под нагрузкой нередко выясняется, что процессор для сохранения своей работоспособности самовольно сбрасывает частоту отдельных ядер существенно ниже заданных в BIOS материнской платы значений. К сожалению, эта интеллектуальность никак не отключается, поэтому при рассмотрении оверклокерских результатов, помимо всего прочего, требуется уделять отдельное внимание проверке реальных частот всех четырёх процессорных ядер. Такое самопроизвольное «торможение» процессора, к сожалению, не даёт возможности существенно поднимать его напряжение питания.
Попутно с традиционной процессорной частью можно разогнать и встроенное в APU графическое ядро. С увеличением напряжения на северном мосту процессора до 1,375 В, стабильности GPU нам удалось добиться при повышении его частоты в BIOS материнской платы до 960 МГц.
Впрочем, на самом деле, разгон графики в A10-7850K имеет мало практического смысла. Во-первых, отнюдь не частота ограничивает производительность GPU, а пропускная способность шины памяти. Во-вторых, при повышении частоты GPU вновь приходится сталкиваться со слишком интеллектуальным автономным управлением частотой. Увеличение частоты графического ядра приводит к тому, что в реальности при 3D-нагрузке она начинает систематически сбрасываться до более низких значений, и наблюдаемая на практике игровая производительность практически не возрастает.
Иными словами, AMD старалась сделать из Kaveri процессоры с предсказуемым энергопотреблением и тепловыделением, а это потребовало внедрения технологий управления реальной частотой, которые плохо уживаются с оверклокингом. Это значит, что Kaveri для экспериментов по разгону подходит неважно.
В целом Kaveri оказался очень неоднозначным продуктом, и мнения о нём могут кардинально различаться в зависимости от того, под каким углом смотреть на новинку. Об этом мы уже говорили, когда рассматривали модификацию A8-7600, это же должны повторить и сейчас, по итогам знакомства с A10-7850K.
Новый процессор безумно интересен тем, что он развивает концепцию гетерогенных вычислений и внедряет технологию HSA, которая позволяет разработчикам программных продуктов легко перейти к написанию алгоритмов, исполняющихся на вычислительных кластерах графического ядра. Кажется, ещё немного — и AMD добьётся того, что новые приложения будут работать на её процессорах не хуже, чем на CPU компании Intel. Для этого у Kaveri есть все необходимые ресурсы и, самое главное, огромная теоретическая вычислительная мощность, кроющаяся в графическом ядре.
Однако не всё так просто. Пока существует не так много даже простых оптимизированных под OpenCL приложений, а эффективность имеющихся реализаций гетерогенных вычислений оставляет желать лучшего. К тому же на параллельные вычислители графического ядра могут быть перенесены далеко не любые алгоритмы. В результате, подчёркивая, что в теории системы на базе Kaveri могут быть очень продуктивны, мы вынуждены констатировать реальное и заметное отставание рассмотренной нами старшей модели A10 от конкурирующего четырёхъядерного Core i5 в подавляющем большинстве счётных задач. Причём такая ситуация наблюдается сейчас не только в приложениях, исполняемых исключительно на x86-ядрах, но и там, где поддержка OpenCL уже реализована.
Другое дело — игры. Здесь у AMD всё совсем хорошо, даже несмотря на то, что скорость встроенного в A10-7850K GPU категорически упёрлась в пропускную способность шины памяти. Несмотря на это, конфигурации, построенные на этом процессоре и использующие возможности интегрированного графического ядра, с полным правом могут считаться полноценными игровыми системами начального уровня. Большинство современных игр может исполняться на A10-7850K в Full HD-разрешении, а многие из них, например популярные сетевые проекты, при этом вполне сносно работают даже с выбором среднего или высокого качества изображения. Десктопные Haswell подобную игровую производительность не могут предложить в принципе, по крайне мере до тех пор, пока Intel не решится перенести в настольные модели процессоров старшие модификации своих графических ядер GT3/GT3e.
В итоге на данный момент A10-7850K можно рекомендовать лишь как основу недорогих настольных компьютеров для нетребовательных игроков. Для энтузиастов же этот процессор малоинтересен — в первую очередь из-за своей ограниченной x86-производительности. Впрочем, если AMD умерит свои амбиции и снизит цены, противопоставив A10-7850K не четырёхъядерным, а двухъядерным процессорам конкурента, мы будем готовы пересмотреть свою позицию.
Нельзя сказать, что AMD выпускает слабые видеокарты, особенно в недорогом сегменте. Производительности видеокарт зачастую хватает на большинство задач. Особенно если это не высоко требовательные задачи, вроде рендера видео или работы с 3D графикой. Для того чтобы лучше определить уровень производительности, следует рассмотреть две видеокарты серии AMD Radeon R7 200 Series.
В таблице описаны характеристики AMD Radeon R7 200 Series, а именно представлен сравнительный анализ двух видеокарт из этой серии.
Параметры видеокарты | Radeon R7 240 | |
Oland XT | ||
Частота ядра | 780 МГц | |
DDR3 | ||
Количество памяти | 2 Гб | |
Частота памяти | 1600 МГц | |
Техпроцесс | 28 | |
Потоковые процессы | 320 | |
Блоки рендеринга | 8 | |
20 | ||
128 бит | ||
Транзисторы | 1040 миллионов | 1040 миллионов |
Теплоотвод | 30 Вт | |
Поддержка | DirectX 12 |
Стоит учитывать, что базовая частота ядра R7 240 составляет 730 МГц, а 780 МГц – это частота после разгона. В параметрах видеокарт указан тип памяти DDR3, но при этом есть ещё вариант с GDDR5 памятью. В сравнении будет использоваться DDR3, поскольку на данный момент это самый распространённый тип.
AMD Radeon R7 200 Series относиться к категории бюджетных и доступных видеокарт. Тем не менее, она выполнена достаточно качественно. Видеокарты, рассматриваемые в этом обзоре, представлены от компании Gigabyte.
Модель получила 2 Гб видеопамяти типа DDR3. Также она имеет изначальный заводской разгон. Сама сборка выполнена качественно, хоть это и бюджетный сегмент.
На верхней части графической карты расположен охлаждающий кулер с большим радиатором. Такой решение обуславливается сильным нагревом карт AMD. Радиатор выполнен из алюминия, а сам вентилятор слегка выпирает. Длина всей видеокарты составляет 19,5 см.
Внешнее оформление графической карты ничем не отличается от младшей модели. Она также имеет электроизоляционное покрытие из синего текстолита и ширину в 19,5 см. Радиатор такой же громоздкий, как и у AMD Radeon R7 240.
Отличаются рассматриваемые карты исключительно микросхемами памяти и фазами питания. Radeon R7 250 имеет трёхфазовое питание, в отличии от двухфазового R7 240.
Результаты тестирования в игре Metro Last Night схожи. Видеокарта стабильно работала на 90-100%, при этом особо не нагревалась. Температура не превышала 46-47 °C.
Отличие только в количестве оборотов в минуту. Вентилятор работал со скоростью в 1200 об/мин, что в двое меньше скорости Radeon R7 240. Показатель FPS стабильно держался в районе 30-40 кадров.
Для начала потребуется установить следующие утилиты: MSI Afterburner, 3DMark, TechPowerUp GPU-Z, FurMark.
Теперь самый главный этап – разгон видеокарты AMD Radeon R7 200 Series. Начинаем с разгона видеопамяти. Сначала увеличиваем частоту памяти на 100 МГц и сохраняем настройку. После чего прогоняем видеокарту в FurMark. Повторяем данную процедуру до появления первых артефактов.
Если при тестировании компьютер зависнет, стоит немедленно его перезагрузить. После перезагрузки выставляем те параметры, при которых артефакты отсутствуют.
Напоследок проверяем карту в программе 3DMark, дабы избежать бликов, пятен и прочих дефектов.
С разгоном видео ядра ситуация такая же. Выставляем параметр «Power Limit» на максимум, после чего увеличиваем частоту ядра на 10 МГц. Тесты проводим в программах, которые использовали для разгона памяти.
Если появляются артефакты, то увеличиваем напряжение на ядро. Повторяем процедуру, пока не будет достигнут нужный результат.
В GTA V обе видеокарты показывают хороший результат. При низких настройках графики обе видеокарты выдавали в районе 35-40 FPS. На изначальных частотах R7 240 DDR3 немного выигрывает у и выдаёт на 10-15 FPS больше. Такие показатели достигаются не только из-за высокой производительности видеокарт, но и из-за хорошего уровня оптимизации GTA V.
В игре War Thunder при базовых частотах видеокарты выдают стабильные 35 FPS. А Radeon R7 240 опережает GT 730 на 13 FPS. Ситуация после разгона ещё лучше. Обе видеокарты от AMD не только идут вровень с GeForce GT 730 DDR3 и GeForce GT 730 типа GDDR5, но и опережают их на несколько процентов. Стоит отметить, что настройки графики были выставлены на средние значения.
Ну и последняя игра – Dota 2. Обе карты от AMD стабильно работают в районе 45 FPS. В сильно нагруженных сценах количество кадров просаживалось до 25-30 FPS. При базовых частотах Radeon R7 240 обгонял GeForce GT 730 на 25 FPS.
Ситуация с R7 250 немного хуже. Отсутствие разгона частоты видеопамяти сильно влияет на прирост производительности. Поэтому показатель FPS у Radeon R7 250 немного ниже показателя GeForce GT 730 (GDDR5). Тесты проводились на минимальных настройках графики.
В целом, тесты в играх AMD Radeon R7 200 Series показывают удовлетворительные результаты. Видеокарты способны тянуть вполне современные игры, хоть и на низких настройках. Сравнительный анализ показал, что в большинстве случаев видеокарты от AMD опережают видеокарты от Nvidia. Но нужно учитывать, что видеокарты находятся в бюджетном сегменте.
На фоне последних успехов корпорации Intel, которая не так давно представила процессоры Devil’s Canyon , а затем выпустила экстремальные восьмиядерные Haswell-E , компания Advanced Micro Devices редко балует своих поклонников громкими анонсами. В то время как процессоры конкурента штурмуют новые высоты быстродействия в сегменте высокопроизводительных настольных систем, «бело-зеленые» сосредоточились на разработке и производстве APU — Accelerated Processing Units, сочетающих на одной кремниевой подложке несколько вычислительных модулей x86 и производительный графический акселератор. Основные достоинства гибридных процессоров — компактность, энергоэффективность и высокое быстродействие видеоподсистемы — нашли применение не только в неттопах и ноутбуках, но и в десктопах. В бюджетном классе AMD предлагает APU Kabini в исполнении Socket AM1, которые обеспечивают начальный уровень продуктивности при минимальных затратах, а для конфигураций среднего класса компания выпускает гибридные процессоры Kaveri . Изначально продуктовая линейка для платформы Socket FM2+ насчитывала всего три наименования: A10-7850K, A10-7700К и A8-7600, хотя, последняя модификация добралась до полок магазинов лишь в последнее время. А с недавних пор ассортимент пополнился двумя новыми APU: A6-7400К и A10-7800, а также тремя моделями Athlon на базе вычислительных модулей Steamroller. В итоге, модельный ряд процессоров AMD в исполнении Socket FM2+ приобрел следующий вид:
Процессор | A10-7850K | A10-7800 | A10-7700К | A8-7600 | A6-7400K | Athlon X4 860K | Athlon X4 840 | Athlon X2 450 |
Ядро | Kaveri | Kaveri | Kaveri | Kaveri | Kaveri | Kaveri | Kaveri | Kaveri |
Разъем | FM2+ | FM2+ | FM2+ | FM2+ | FM2+ | FM2+ | FM2+ | FM2+ |
Техпроцесс, нм | 28 | 28 | 28 | 28 | 28 | 28 | 28 | 28 |
Число ядер | 4 | 4 | 4 | 4 | 2 | 4 | 4 | 2 |
Номинальная частота, МГц | 3700 | 3500 | 3400 | 3100 | 3500 | 3700 | 3100 | 3500 |
Частота Turbo Core, МГц | 4000 | 3900 | 3800 | 3800 | 3900 | 4000 | 3800 | 3900 |
L1-кеш, Кбайт | 16 x 4 + 96 x 2 | 16 x 4 + 96 x 2 | 16 x 4 + 96 x 2 | 16 x 4 + 96 x 2 | 16 x 2 + 64 x 1 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 | 16 x 2 + 64 x 1 |
L2-кеш, Мбайт | 4 | 4 | 4 | 4 | 1 | 4 | 4 | 1 |
Графическое ядро | Radeon R7 series | Radeon R7 series | Radeon R7 series | Radeon R7 series | Radeon R7 series | - | - | - |
Число унифицированных шейдерных процессоров | 512 | 512 | 384 | 384 | 256 | - | - | - |
Частота графического ядра, МГц | 720 | 720 | 720 | 720 | 720 | - | - | - |
Поддерживаемый тип памяти | DDR3-2133 | DDR3-2133 | DDR3-2133 | DDR3-2133 | DDR3-1866 | DDR3-2133 | DDR3-2133 | DDR3-1866 |
TDP, Вт | 95 | 65/45 | 95 | 45/65 | 65/45 | 95 | 65 | 65 |
Рекомендованная стоимость, $ | 142 | 132 | 122 | 91 | 58 | н/д | н/д | н/д |
Как водится, попавший в нашу тестовую лабораторию гибридный процессор AMD A10-7800 оказался лишенным комплекта поставки, тогда как розничные версии оснащаются простым алюминиевым охладителем, рассчитанным на работу с моделями, TDP которых не превышает 65 Вт. Конструктивно новейший APU полностью аналогичен старшей модели А10-7850К. Его полупроводниковый кристалл изготовлен по 28-нм технологическому процессу SHP (Super High Performance), кремниевая подложка занимает площадь 245 кв. мм, а количество транзисторов достигает 2410 млн. штук. Хрупкий кристалл от повреждений защищен металлической крышкой, которая также выполняет функцию равномерного распределения тепла. На крышку нанесена маркировка, согласно которой чип был изготовлен на 15 неделе 2014 года на мощностях GlobalFoundries в Германии, а окончательная сборка выполнялась на заводе AMD в Китае.
AMD A10-7800 (слева), AMD A10-7850K (справа)
В определении спецификаций новинки помог диагностический модуль CPUID из состава программного продукта AIDA64. Штатная частота A10-7800 составляет 3500 МГц, но большую часть времени гибридный процессор работает на 3600 МГц с напряжением 1,408 В, а при запуске приложений, не имеющих многопоточной оптимизации, технология Turbo Core автоматически разгоняет вычислительные ядра до 3800-3900 МГц с одновременным увеличением Vcore до 1,416 В. Встроенный северный мост AMD A10-7800 всегда функционирует в режиме 1600 МГц, а подсистема ОЗУ способна работать на частотах до 2133 МГц включительно.
Измерение уровня продуктивности и разгонного потенциала гибридного процессора AMD A10-7800 проводились в составе тестового стенда следующей конфигурации:
AMD A10-7800 (45W) | AMD A10-7850K | AMD A10-7850K OC | |||
Частота CPU, МГц | 3500 | 3000 | 3850 | 4000 | 4400 |
Частота Turbo Core, МГц | 3900 | 3500 | - | 3700 | - |
Напряжение Vcore, В | 1,416 | 1,176 | 1,376 | 1,336 | 1,472 |
Частота NB, МГц | 1600 | 1600 | 1760 | 1800 | 2000 |
Частота iGPU, МГц | 720 | 720 | 792 | 720 | 960 |
Частота ОЗУ, МГц | 1600 | 1600 | 2346 | 1600 | 2400 |
Тайминги | 10-12-12-31-2T | 9-9-9-24-1T | 10-12-12-31-2T | 9-9-9-24-1T | 10-12-12-31-2T |
Видеоадаптер | Radeon R7 (встроенный) | ASUS R7240-2GD3-L | MSI R7 250 1GD5 OC |
Ядро | Spectre | Oland | Oland |
Количество транзисторов, млн. шт | 2410* | н/д | н/д |
Техпроцесс, нм | 28 | 28 | 28 |
Площадь ядра, кв. мм | 245* | 77 | 77 |
Количество потоковых процессоров | 512 | 320 | 384 |
Количество текстурных блоков | 32 | 20 | 24 |
Количество блоков рендеринга | 8 | 8 | 8 |
Частота ядра, МГц | 720 | 780 | 1100 |
Шина памяти, бит | 128 | 128 | 128 |
Тип памяти | DDR3 | GDDR3 | GDDR5 |
Частота памяти, МГц | 2133 | 1800 | 4600 |
Объём памяти, МБ | 1024/2048 | 2048 | 1024 |
Интерфейс | - | PCI Express 3.0 | PCI Express 3.0 |
Заявленная максимальная потребляемая мощность, Вт | 65/95* | н/д | 65 |
На фоне видеокарт начального уровня спецификации графического ядра, которым оснащены APU, выглядят самыми убедительными по количеству потоковых процессоров и числу текстурных блоков, но уступают дискретным ускорителям на базе Oland по тактовой частоте. Также, интегрированная видеокарта однозначно выигрывает у внешних графических ускорителей по энергоэффективности и компактности, однако, предлагает менее гибкие возможности по апгрейду.
Кроме того, ради эксперимента была собрана конфигурация Dual Graphics, которая позволяет объединять ресурсы встроенного видеоядра Kaveri и дискретного графического ускорителя класса Radeon R7 240 или Radeon R7 250 с видеопамятью GDDR3. Из имеющихся в наличии видеокарт только ASUS R7240-2GD3-L в полной мере соответствует указанным выше требованиям, тогда как видеокарта MSI R7 250 1GD5 OC, укомплектованная GDDR5, вовсе отказалась работать в составе Dual Graphics.
Для оценки продуктивности гибридного процессора был использован следующий набор тестовых приложений:
Синтетические бенчмарки
Прикладное ПО
Тесты в 3D-играх
При тестировании в игровых приложениях к результатам интегрированных графических ядер добавились показатели быстродействия пары бюджетных видеокарт и связки Dual Graphics, в которую входит акселератор Radeon R7 240 и видеокарта, встроенная в APU AMD A10-7800. В 3D-играх измерение частоты смены кадров проводилось в экранном разрешении 1366x768 при высоких настройках качества изображения.
Энергопотребление
Для оценки энергопотребления тестовых стендов в режиме 2D использовалось устройство Basetech Cost Control 3000, с помощью которого было измерено среднее потребление электроэнергии «от розетки» при отсутствии нагрузки, а также пиковые значения потребляемой мощности во время прохождения стресс-теста Prime95 в режиме In-Place large FFTs.
Дополнительно была проведена оценка энергоэффективности тестовых стендов во время прохождения цикла графических бенчмарков, а также уровень потребления электроэнергии в простое для конфигураций с дискретными видеокартами и системы Dual Graphucs.
Выводы
По результатам тестирования стало понятно, что линейка гибридных процессоров AMD пополнилась очередной очень удачной моделью. Разница в быстродействии между A10-7800 и флагманским APU Kaveri не превысила и 3% в пользу последнего, тогда как рекомендованная стоимость новинки почти на 8% меньше. Также, герой сегодняшнего обзора продемонстрировал лучшую, чем A10-7850K энергоэффективность, правда, экономии в 30 Вт, которая следует из разности паспортных значений TDP, замечено не было. Зато, режим пониженного энергопотребления функционировал вполне корректно, снижая расход электроэнергии от 13% до 28% соответственно в видеоиграх и 2D-приложениях. Что касается разгона, то даже с тем ограниченным набором инструментов, что предлагается A10-7800, удалось добиться прироста быстродействия до 10% в прикладных программах, и почти на 25% повысить продуктивность в 3D-играх. А на фоне недавней коррекции стоимости стоимости на продукцию AMD, благодаря которой гибридные процессоры подешевели в среднем на 15-20%, приобретение APU Kaveri стало еще более оправданным. К сожалению, при тестировании А10-7800 было замечено снижение частоты вычислительных модулей при высокой нагрузке на встроенную видеокарту, про которое производитель почему-то скромно умалчивает. Очевидно, таким способом ограничивается общий уровень энергопотребления APU, который при отсутствии описанного выше защитного механизма наверняка превысил бы расчетные значения TDP.
Что касается графической подсистемы гибридных процессоров Kaveri, то ее быстродействие делает бессмысленным приобретение дискретных графических ускорителей Radeon R7 240, оснащенных видеопамятью GDDR3. Тоже самое касается перспективы организации систем Dual Graphics, эффективность которой во многих случаях не так высока, как того хотелось бы, а в некоторых тестах связка вовсе оказалась неработоспособной. Что же до графического акселератора Radeon R7 250, который использует быструю память GDDR5, то его результаты указывают на то, что гибридным процессорам AMD остро не хватает пропускной способности ОЗУ, которая сдерживает быстродействие мощного графического ядра. И, конечно, свою лепту в падение продуктивности в игровых приложениях внесло принудительное снижение частоты вычислительных модулей, которого нет в случае установки дискретного графического ускорителя. Таким образом, A10-7800 можно однозначно рекомендовать пользователям, которых в целом устраивает быстродействие APU в штатном режиме и которые готовы мериться с невозможностью полноценного разгона. Остальным же есть смысл доплатить лишние 10 долларов за старшую модель.
Сегодня мы поговорим про ряд видеокарт AMD Radeon R7 200 series. Речь пойдет о четырех представителях: 260, 250 и 240 сериях. Несмотря на то, что существует несколько отдельно взятых вариантов, разница между ними не настолько уж и велика. Все самые заметные отличия мы обязательно укажем и рассмотрим, чтобы вам не пришлось лишний раз задумываться о том, что покупать.
Начнем сразу с ценовой категории этих карточек. Несморя на то, что они все являются высокопроизводительными графическими процессорами и позволяют спокойно обрабатывать большие потоки данных, они находятся в так называемом эконом-секторе. В среднем вам придется отдать за такую карту до 10000 рублей, в зависимости от конкретной модели и магазина, что не может не радовать.
Хотя современные игры и создаются исключительно для самых новых видеокарт, а ультра-настройки работают только на видеопроцессорах от 50000 рублей, это не означает, что дешевые карты не смогут их заменить. Дело в том, что AMD Radeon R7 200 series отзывы от пользователей получают исключительно положительные, а значит, пользуются повышенным спросом.
Начнем мы с самых общих 200 series. Все они изготовлены по техпроцессу, определяющему размер кристалла 28 нм. Величина не слишком высокая, по сравнению с другими видеокартами, могла бы быть и лучше. В другом случае это привело бы к перегреву карты, однако два встроенных охлаждающих кулера сводят на нет данный конструкторский недочет AMD Radeon R7 200 series. Фото в статье это наглядно демонстрируют. Единственный недочет заключается в том, что вам придется чаще чистить систему охлаждения.
AMD Radeon R7 200 series, характеристики которых мы рассматриваем, подключаются через интерфейс PCI-E x16 версии 3.0. Вполне стандартно, но при этом намного лучше, чем AGP. При покупке просто обратите внимание на этот нюанс.
Что касается вывода информации на экран, то тут у AMD Radeon R7 200 series драйвер дает жару. Если в 240 серии видеокарта поддерживает всего два монитора, то во всех последующих появляется несколько возможностей.
При этом данные видеокарты поддерживают разрешение 4096х2160. Эти видеокарты подойдут как для обычных, так и для широкоформатных экранов. Таким образом, видеокарты способны поддерживать много-мониторные системы, а программное обеспечение, поставляемое вместе с ними, поможет пользователю с реализацией задуманного.
Давайте теперь поговорим о технической составляющей AMD Radeon R7 200 series. Характеристики данных видеокарт таковы, что они способны без особых усилий поддерживать работоспособность самых современных и требовательных игр. Исключением является AMD Radeon Но и выпущена она была достаточно давно.
Например, частота графического процессора, во многом определяющая производительность видеокарты, колеблется в районе 1 ГГц и может меняться в зависимости от производителя. В тоже время у 240 модели данная величина равна примерно 800 МГц.
Память видеокарты имеет форматы GDDR5 и DDR3. Но при этом если старые модели используют только устаревшую память, то новые (260 series) содержат исключительно современную технологию.
Также может существенно отличаться в пределах одной модели. Это также полностью зависит от производителя. Однако, несмотря на все старания, вы не сможете найти видеокарту AMD Radeon R7 200 series, характеристики которой содержат объем памяти выше 2 гигабайт. Но это и не нужно, если вас интересуют современные игры и требования к ним.
Исходя из формата памяти, также вытекает и пропускная способность AMD Radeon R7 200 series. Характеристики, которые мы получим на выходе, как нельзя лучше демонстрируют рабочие способности данных видеокарт:
Как видите, при многих прочих равных параметрах выигрывают только самые новые модели. Впрочем, при средней цене 7700 рублей покупка данной видеокарты для апгрейда своего ПК не составит большой проблемы.
Рассмотрев общие данные, доступные покупателю на ценнике в магазине, мы переходим к более точным цифрам. Характеристики AMD Radeon R7 200 series позволят нам точно сказать, какая из данных видеокарт лучше остальных.
Начнем мы с числа универсальных процессоров. С их помощью производится расчет цвета и формы объектов, выводящихся на экран. Как вы понимаете, от этого параметра сильно зависит быстродействие карточки в целом. И вот тут-то мы смело можем сказать, что 240 модель сильно отстает от своих собратьев по серии.
Безусловно, технические характеристики AMD Radeon R7 200 series очень важны. То, какие технологии способна поддерживать современная видеокарта, определяет её функциональность и полезность для пользователя.
Видеокарты рассмотренной серии уверенно себя чувствуют при работе с Direct X 12.0 и с Open CL 1.2. Кроме того, они прекрасно взаимодействуют с Open GL 4.3. А технология CrossFire давно перестала удивлять и также прекрасно поддерживается данными карточками. В чем же тогда различия?