Geforce gtx 980 обзор

Geforce gtx 980 обзор

Валерий Косихин

19 сентября 2014

В номенклатуре дискретных видеоадаптеров NVIDIA произошло нечто необычное: видеокарты GeForce минуют 800-ю серию и сразу переходят к линейке GeForce 900. Сделано это для того, чтобы синхронизировать наименования десктопных и мобильных SKU. В ноутбуках уже используются адаптеры 800-й серии, большинство из которых оснащены GPU архитектуры Kepler, а поскольку новые десктопные видеокарты основаны на архитектуре Maxwell, эту разницу следовало подчеркнуть, сразу запустив серию GeForce 900.

Сегодня NVIDIA представила две модели, в основе которых лежит графический процессор GM204. Если судить по этому коду, чип принадлежит к той же категории, что и GK104, первенец архитектуры Kepler, — это GPU второго эшелона. За более производительным ядром должно быть зарезервировано наименование GM201 или GM210. Ну а пока NVIDIA предлагает GM204 в качестве полноценной замены GK110 — топового ядра предыдущей архитектуры — в игровых видеоадаптерах. Пример GeForce GTX 680 показал, что относительно компактное ядро нового поколения может справиться с такой задачей, но в прошлый раз GK104 поспособствовал переход с техпроцесса 40 на 28 нм.

Однако оба основных производителя GPU вот уже три года как пользуются узлом 28 нм на TSMC и не имеют возможности перейти на 20 нм в ближайшей перспективе. Такая линия уже действует на TSMC, но пока что зарезервирована для производства мобильных SoC. Поэтому сейчас NVIDIA полагается исключительно на архитектурные изменения, которые должны увеличить производительность, используя резерв технологии 28 нм. Это и есть краеугольный камень Maxwell — радикальное увеличение производительности на ватт. Вплоть до 100%, если верить NVIDIA.

Поставки GeForce GTX 770, 780 и 780 Ti с сегодняшнего дня официально прекращаются. На смену им приходят GeForce GTX 970 и GTX 980. Новые адаптеры изначально дешевле, чем их предшественники: $329 (14 990 р. для России) за GTX 970 и $549 (23 990 р.) за GTX 980. Осталось убедиться в том, что они обладают как минимум не худшей производительностью. Начнем с GTX 980. Обзор GeForce GTX 970 вы увидите в ближайшее время.

⇡# Архитектура Maxwell: общие принципы

С архитектурой Maxwell мы уже познакомились на примере процессора GM107, который был представлен ранее в составе карт GeForce GTX 750 и 750 Ti. В целом, как и следовало ожидать, GM204 представляет собой увеличенный аналог GM107, а устройство строительных блоков GPU осталось по большей части неизменным. Повторим описание архитектуры Maxwell, данное в обзоре GTX 750 Ti и дополненное той информацией, которую мы получили позднее.

Maxwell является первым плодом стратегии NVIDIA, в соответствии с которой новые архитектуры GPU создаются в первую очередь с расчетом на мобильные и ультрамобильные устройства, а во главе угла стоит энергоэффективность.

Если судить по представленным блок-схемам, основное новшество Maxwell заключается в эффективной реорганизации исполнительных компонентов GPU. На глобальном уровне GM204 следует принципам, заложенным еще в Kepler (подробнее о них можно прочитать в обзоре GeForce GTX 680). Вся вычислительная логика сосредоточена в структурах под названием Graphics Processing Cluster (GPC), которых в GM204 четыре. Вне GPC расположен весь back-end процессора в виде блоков ROP и нескольких 64-битных контроллеров памяти, а также Giga Thread Engine, выполняющий функции смены контекста, одновременного исполнения kernel’ов и распределения потоков нагрузки между GPC.

Блок-схема NVIDIA GM204

Первое количественное отличие от Kepler здесь состоит в кеше L2, увеличенном с 256 до 2048 Кбайт, что должно компенсировать узкую, 128-битную шину, а также сократить расход энергии на транзакции с весьма прожорливой памятью, каковой является GDDR5 SDRAM.

На уровне GPC значимых нововведений по сравнению с Kepler не заметно. Есть несколько Stream Multiprocessors (которые теперь называются аббревиатурой SMM, а не SMX), и есть единственный Raster Engine, выполняющий первоначальные стадии рендеринга: определение граней полигонов, проекцию и отсечение невидимых пикселов.

Главные изменения произошли внутри потоковых мультипроцессоров. Идея состоит в том, чтобы сместить соотношение управляющей и вычислительной логики в пользу первого компонента. Как и в Kepler, потоковый мультипроцессор содержит четыре планировщика, но число ядер CUDA уменьшилось с 192 до 128, а текстурных блоков — с 16 до 8.

Известно, что отдельно взятый планировщик за такт может обратиться к одному (а при наличии параллелизма в потоке — сразу к двум) из следующих массивов вычислительных блоков:

  • 32 ядра CUDA;
  • 8 блоков Load/Store;
  • 8 SFU;
  • 4 текстурных блока.

Ключевое нововведение Maxwell состоит в том, что исполнительные блоки теперь не являются одинаково доступными для адресации любому планировщику. Каждый планировщик теперь получил в свое распоряжение фиксированную часть ресурсов: 32 ядра CUDA, 8 блоков Load/Store и SFU (Special Function Units, выполняющие, к примеру, тригонометрические операции). Только текстурные блоки и ядра CUDA, совместимые с вычислениями FP64, по-прежнему являются общими ресурсами.

Какие преимущества по сравнению с Kepler дает такая организация? Во-первых, потоковый мультипроцессор Maxwell, избавившись от 64 ядер CUDA, меньше полагается на параллелизм инструкций: четыре планировщика даже в пессимистичном сценарии способны обслужить 128 ядер CUDA. Разделение исполнительных блоков на отдельные «домены» также позволило сократить логику, которая соединяет с ними планировщики (crossbars) и координирует действия самих планировщиков. Планировщики также оптимизированы с целью уменьшения латентности исполнения инструкций. В конечном счете эти изменения позволили сохранить 90% производительности отдельного потокового мультипроцессора при существенно меньшей площади SMM.

Maxwell базируется на оптимизациях энергопотребления, представленных в архитектуре Kepler. После архитектуры Fermi NVIDIA отказалась от динамических планировщиков внутри GPU, переложив всю работу по планированию внеочередного исполнения инструкций на компилятор в составе драйвера. Такой подход позволил существенно сократить мощность, к тому же он не оказывает большого негативного влияния на собственно шейдерные вычисления. Однако задачи общего назначения (GP-GPU), не связанные с графикой, не всегда предсказуемы для компилятора, поэтому, в то время как архитектура GCN от AMD наращивает производительность за счет дополнительного ILP (параллелизма на уровне инструкций), чипы Kepler/Maxwell достигают равной эффективности только за счет грубой силы в виде большого количества CUDA-ядер.

Что касается именно GM204, то, поскольку это чип второй категории, а более крупное ядро на базе Maxwell, возможно, ожидает нас в будущем, NVIDIA нашла приемлемым оставить в каждом SMM только четыре ядра CUDA с поддержкой F64. В результате производительность GM204 в вычислениях двойной точности относительно производительности при работе с FP32 даже меньше, чем у GK104, — 1/32 против 1/24.

SMX (Kepler, GK104)

SMM (Maxwell, GM204)

⇡#GM204: вторая итерация Maxwell

Рассмотрим конфигурацию GM204 более внимательно. Цифра два в названи чипа указывает на вторую версию архитектуры Maxwel. И действительно, GM204 имеет несколько отличий от предтсавленных ранее GPU GM107 и GM108. Во-первых, на блок-схемах геометрический движок Polymorph Engine имеет версию 3.0, в то время как в GM107 — 2.0. Апгрейд обесечивает работу некоторых из новых аппаратных функций GM204.

Представленные в GM204 функции рендеринга делают его совместимым с наиболее полным feature level, официально существующим в стандарте DirectX — 11_1. Подробнее о них — в разделе ниже.

Другим дополнением архитектуры Maxwell второй волны стал усовершенствованный аппаратный кодек H.264 — NVENC. В Maxwell первой волны GPU уже был способен кодировать видео 1080p на скорости в 6-8 раз быстрее реального времени (4х для Kepler) и декодировать в 8-10 раз быстрее. Поддерживаются и 4K-разрешения. Кроме того, в Maxwell предусмотрен новый режим энергопотребления GC5, предназначенный для снижения мощности при легкой нагрузке — такой как декодирование видео силами NVENC. NVIDIA еще не внедрила в кремний декодер стандарта H.265 — он ускорятся лишь частично, с выполнением доли операций на CPU. Чем в этом плане отличается GM204, так это поддержкой полностью аппаратного кодирования видео стандарта H.265. Необходимая для этого производительность используется функцией NVIDIA ShadowPlay, которая позволяет на GM204 делать запись игрового процесса в разрешении Ultra HD с частотой 60 кадров/с. Увы, дела с поддержкой fixed-function-логики для кодирования видео в других, даже профессиональных приложениях, обстоят из рук вон плохо, хотя само железо давно присутствует в чипах NVIDIA и AMD.

По числу вычислительных блоков чип представляет собой промежуточный вариант между GK104 и GK110. В нем нет такого количества ядер CUDA, как в GK110. Но, принимая во внимание разную архитектуру, нельзя сравнивать чипы на базе Kepler и Maxwell напрямую по количеству исполнительных блоков. NVIDIA утверждает, что благодаря реогранизации логики GPU удалось увеличить эффективность ядра CUDA на 40%.

Наконец, GM204 имеет больше ROP, чем топовый Kepler, — 64 против 48. Это явно пойдет на пользу видеоадаптеру в 4К-разрешении, как показывает пример GPU AMD Hawaii, который также несет 64 ROP. Однако для того, чтобы реализовать потенциально столь большую скорость заполнения пикселов, требуется достаточная пропускная способность DRAM.

Между тем, конфигурация шины памяти адаптеров на GM204 такая же, как у GeForce GTX 770: разрядность 256 бит и эффективная частота 7 ГГц, в то время как GK110 и Hawaii используют, соответственно, 384- и 512-битные шины. Создателям GM204 пришлось принять меры для экономии пропускной способности интерфейса, которые, помимо увеличенного кеша L2, состоят в новом алгоритме цветовой компрессии. Это третья версия алгоритма, впервые представленного в чипе NV40, позволяющая сжимать данные с соотношением вплоть до 8:1 без потери информации.

⇡#GeForce GTX 970/980: технические характеристики

На основе GM204 NVIDIA выпустила два видеоадаптера — GeForce GTX 970 и GTX 980, которые различаются числом активных вычислительных блоков и тактовыми частотами. Флагманский адаптер имеет 1126 МГц базовой частоты по штатным спецификациям — это, прямо скажем, внушительное значение для техпроцесса 28 нм и 5,2 млрд транзисторов.

Новинки имеют беспрецедентно низкий TDP для своего класса: 145 и 165 Вт соответственно. Также весьма впечатляет, если учесть, что новинки заменяют в линейке GeForce модели с энергопотреблением от 230 до 250 Вт. Впрочем, забегая вперед, отметим, что в реальности запросы GM204 оказались повыше.

Поскольку GPU имеет 256-битную шину памяти, объем DRAM обеих моделей составляет 4 Гбайта. В этом плане GTX 970/980 превзошел модели GTX 780/780 Ti, имеющие 3 Гбайт RAM по референсным спецификациям, и не уступает топовым видеокартам AMD, которые также комплектуются 4 Гбайт видеопамяти на ядро.

Большие изменения GTX 980 принес в конфигурации видеовыходов. NVIDIA удалила один из портов DVI, зато теперь карта несет три разъема DisplayPort и HDMI стандарта 2.0 (что означает поддержку 4К-разрешений при частоте 60 Гц).

Модель Графический процессор Видеопамять Шина ввода/
вывода
TDP, Вт

Кодовое название

Число транзисторов, млн

Техпроцесс, нм

Тактовая частота, МГц:
High State /Boost State

Число шейдерных потоковых процессоров

Число текстурных блоков

Число ROP

Разрядность шины, бит

Тип микросхем

Тактовая частота: реальная (эффективная), МГц

Оглавление

Вступление

Лаборатория Overclockers.ru продолжает цикл материалов, посвященных выбору игровых графических ускорителей. Ранее мы уже познакомились с линейками GeForce GTX 960 и GeForce GTX 970, теперь же речь пойдет о следующей в иерархии Nvidia модели.

реклама

С другой стороны, за прошедшее с момента анонса GeForce GTX 980 время разработчики компаний-партнеров приложили немало усилий для реализации своих планов по выпуску по-настоящему интересных версий. Что ж, разберемся, кто из них не ударил в грязь лицом, а кто решил, что сойдет и так.

Как и ранее, обзор моделей разных производителей пойдет в алфавитном порядке, чтобы избежать путаницы. Но для начала детально изучим побывавший в лаборатории эталонный вариант GeForce GTX 980.

Nvidia GeForce GTX 980

реклама

Инженеры Nvidia использовали в своей новинке дизайн представителей линейки GeForce GTX Titan, сохранив традиционную для компании конструкцию СО. Очевидно, существующие системы охлаждения, оставшиеся со времен проектирования GeForce GTX 770/ GTX 780 (Ti), отлично подошли не только новому однопроцессорному флагману, но и GTX 980.

Для улучшения отвода воздуха во всех доступных и не занятых местах задней панели проделаны треугольные отверстия, которые смотрятся симпатичнее обычных прорезей.

Под кожухом установлена привычная пластина-радиатор, охлаждающая память и силовые цепи. А вот в конструкции основного радиатора испарительная камера уже не используется. Возможно, потому что GM204 достаточно «прохладный» процессор по сравнению с GM200.

Внутри радиатора расположены три тепловых трубки. Сверху по периметру наклеены специальные вставки, предотвращающие передачу вибраций и направляющие воздух на радиатор.

Неплохо продумали и тыльную часть системы охлаждения. Поскольку радиатор перекрывает доступ воздуха к соседней видеокарте, то возле разъемов питания снимается заглушка, после чего освобождается небольшое пространство для забора воздуха. Все это уже встречалось нам на GeForce GTX 970.

С момента появления GeForce GTX 770 и GTX 780 печатная плата изменилась мало, она аналогична модели GeForce GTX 970, рассмотренной ранее. Разработчики сохранили общее размещение компонентов, разве что вместо комбинации 6+8 pin задействовано 6+6 pin.

ШИМ-контроллер – NCP 81174. Он поддерживает управление четырьмя фазами питания, сам контроллер сменный и впаян в легко заменяемую мини-печатную плату.

Финальная формулировка фаз питания звучит так: 4+1+1 (GPU/MEM/PLL). Если задействовать два пустых места, то видеокарту легко оснастить шестифазным питанием.

Восемь микросхем памяти производства Samsung с шиной обмена данных 256 бит распаяны по сторонам от GPU, общий объем 4 Гбайта.

Штатные частоты Nvidia GeForce GTX 980 составляют 1126 МГц (Turbo Boost до 1216 МГц) и 1753 МГц соответственно для графического процессора и памяти.

В режиме нагрузки благодаря технологии GPU Boost 2.0 частота видеоядра повышается вплоть до отметки 1253 МГц. Оригинальная система охлаждения справляется со своей задачей, не позволяя разогреть GPU выше 77°C, при этом СО работала на 49% от своей максимальной мощности. А издаваемый уровень шума можно охарактеризовать как средний.

NVIDIA GeForce GTX 980 — видеокарта топового класса, основанная на новой микроархитектуре Maxwell. Для многих очевидно, что при создании новых графических архитектур производители видеокарт основное внимание уделяют на две вещи: больше FPS, меньше энергопотребления. И вот, калифорнийская компания сделала очередной серьезный (если не сказать «гигантский») шаг в этом направлении. Предыдущая графическая архитектура, носящая имя Kepler, во время своего появления в 2012 году была тоже значимым движением вперед в связке «производительность-энергопотребление». Спустя два года компания NVIDIA вновь доказала, что если не стоять на месте, то можно добиться большего.

Как вы могли заметить, графические адаптеры линейки GeForce для настольных решений, миновав 800-ю серию, сразу «перепрыгнули» к 900-й. Чем это может быть обусловлено? Известно, что в 800-й серии видеокарт для ноутбуков имеются модели как на Kepler, так и на Maxwell. И, вероятно, для того, чтобы подчеркнуть, что серия GeForce GTX 900 это новый отдельный продукт, производитель и использовал такой ход. Но вернемся к нашей новинке.

Касательно внешнего вида, дизайн референсного образца нам уже хорошо известен по прошлым моделям класса «ТОП». Эффектная серебристая крышка, выполненная из титанового сплава, является особой отличительной чертой последних моделей. В основании GeFоrce GTX 980 лежит графический чип с маркировкой GM204. Цифра 2 сообщает нам о том, что это уже второе поколение архитектуры, в отличие от «первопроходцев» GTX 750 и GTX 750Ti, созданных на процессоре GM107. Потребление энергии у новинки составляет всего 165 Вт. Для сравнения, прошлогодняя GeForce GTX 780 потребляет 250 Вт. Мощность блока питания для системы по рекомендации производителя должна быть не менее 500 Вт.

Технические характеристики GeForce GTX 980

Что касается конфигурации видеовыходов, то новая видеокарта имеет разъемы DVI-I (Dual-Link), три DisplayPort 1.2 и полноформатный HDMI, позволяющий выводить картинку с разрешением 4К и частотой обновления 60 Гц.

Тестирование в играх* (среднее количество FPS)

The Witcher 3: Wild Hunt
61 fps
GTA V 55 fps
Battlefield Hardline 94 fps
Battlefield 4 91 fps
Metro: Last Light 58 fps
Crysis 3 52 fps
GRID 2 139 fps
Skyrim 162fps
Tomb Raider 2013 92 fps

*Максимальное качество графики

Игровые тесты показывают, что производительность GeForce GTX 980 в некоторых современных играх незначительно, но всё же превосходит недавнего одночипового флагмана GeForce GTX 780Ti. Остается добавить, что рекомендованная розничная цена нового графического адаптера на момент старта продаж составляет 23990 рублей. Цифра, конечно, немного пугает, но, всё-таки, это новая энергоэффективная архитектура, плюс высочайшая производительность среди одночиповых видеокарт.

Читайте также:  Aoc gaming c27g1 отзывы
Ссылка на основную публикацию
Adblock detector