A+ A A-

Обзор и тест видеокарты Nvidia GeForce GTX 750 Ti – первый среди равных

  • Обновлено 19.02.2014 11:24
  • Автор: Андрианов Николай (Slayer)

Содержание материала

18.02.2014г. Компания Nvidia представила миру новый GPU на новой архитектуре Maxwell. GPU получил маркировку GM107, а видеокарты на его основе назвали Nvidia GeForce GTX 750 и Nvidia GeForce GTX 750 Ti.

В данной статье мы рассмотрим Nvidia GeForce GTX 750 Ti, а для Nvidia GeForce GTX 750 планируем отдельный материал, когда раздобудем тестовый образец.

 

Архитектура Nvidia Maxwell

Душа архитектуры Maxwell – производительность на ватт. Именно производительность на ватт была главной целью новой архитектуры.

Согласно слайду, по сравнению с прошлой архитектурой Kepler, Maxwell в два раза более энергоэффективнее при одновременном 35% приросте производительности на одно ядро.

Архитектура Maxwell

NVidia давно занимается мобильными решениями и в ходе разработок по перенесению архитектуры Kepler из десктопов, рабочих станций и суперкомпьютеров в мобильный сегмент узнала много нового не только о снижении энергопотреблении GPU в целом, но и том, как получить более высокую производительность при том же уровне энергопотребления.

Именно эти знания были воплощены в архитектуре Maxwell.

Maxwell представляет новый дизайн потоковых мультипроцессоров (Streaming Multiprocessor (SM или SMM), что значительно повышает производительность на ватт потребляемой мощности и производительность на единицу площади кристалла.

Хотя дизайн SMX в Kepler был очень эффективен для своего времени, но время не стоит на месте, и NVIDIA увидела возможности для дальнейшего увеличения архитектурной эффективности, что мы и наблюдаем в Maxwell.

Были усовершенствованы: управляющая логика разбиения, балансировка рабочей нагрузки, число выполняемых инструкций за такт и многие другие усовершенствования. Именно они позволяют Streaming Multiprocessor (SM) в Maxwell работать значительно эффективней SMX в Kepler.

Новая архитектура Maxwell Streaming Multiprocessor позволила увеличить количество Streaming Multiprocessor до пяти в GM107, по сравнению с двумя в GK107 (Kepler), при росте площади кристалла всего на 25%.

Помимо прочего в Maxwell вырос объем кэша L2 - теперь это 2048Кб в GM107 против 256Кб в GK107.

Чем больше кэш L2, тем реже GPU обращается к видеопамяти, или, не дай Бог, к системной памяти, тем самым повышая общую производительность GPU. В дополнение к этому, инженеры NVidia усиленно проработали реализацию каждого юнита в Maxwell GPU, чтобы повысить энергоэффективность.

Конечным результатом всех этих усилий является то, что Maxwell в 2 раза энергоэффективнее Kepler, при том же техпроцессе 28нм. Мы это проверим на практике - всему свое время!

Если же заглянуть немного дальше в прошлое — в 2010-й год, то по сравнению с архитектурой Fermi, энергоэффективность Maxwell выросла в 4 раза — по одному разу в год. :)

Архитектура Maxwell

По функциональным возможностям первое поколение GPU Maxwell предлагает те же самые возможности API, что и GPU архитектуры Kepler (т.е. Только DirectX 11, а не 11.2, как у конкурентов).

Посмотрим на блок-схему Nvidia Maxwell, реализованную в первом поколении — GPU GM107:

Архитектура Maxwell

GPC - Graphics Processing Cluster, включает в себя движок растеризации (Raster Engine) и пять потоковых мультипроцессоров (Streaming Multiprocessor). Каждый потоковый мультипроцессор включает полиморфный движок (Polymorph Engine) и текстурные блоки (Texture Units). Блоки ROP, как и в прежних архитектурах Nvidia, совпадают с слайсами кэша L2 и контроллерами памяти.

GM107 GPU содержит один GPC, пять потоковых мультипроцессоров Maxwell (SMM) и два 64-битных контроллера памяти (128-бит всего). Это полная реализация чипа, которая известна миру, как GeForce GTX 750 Ti.

 

ShadowPlay и Maxwell

Как Вы, наверняка, знаете, в 2013 году Nvidia представила интересную функцию ShadowPlay. ShadowPlay – функция фоновой записи видео и звука из игр для последующей обработки. Есть и функционал прямого стриминга на Twitch. Стриминг на YouTube так и не добавили, хотя я писал об этом в фидбек форму.

ShadowPlay

Но сейчас не об этом.

ShadowPlay

Почему же мы пишем про ShadowPlay сейчас?

В графические процессоры серий GeForce GTX 600 и GTX 700 был добавлен специальный блок аппаратного кодирования/декодирования видео H.264, который назвали NVENC. Ранее, для этого было необходимо использовать CUDA ядра, а теперь есть выбор: хочешь используй NVENC или CUDA. ShadowPlay как раз использует NVENC блок для своей работы. Однако это еще не объясняет, почему мы пишем про ShadowPlay именно сейчас.

Оказывается, в архитектуре Maxwell блок NVENC претерпел усиление, по сравнению с архитектурой Kepler, на которой базируются графические процессоры серий GeForce GTX 600 и GTX 700. NVENC блок в Maxwell при кодировании работает в 6-8 раз быстрее реального времени, а в Kepler он работал всего в 4 раза быстрее реального времени. При декодировании NVENC блок в Maxwell работает в 8-10 раз быстрее реального времени. При этом CUDA ядра не используются, а значит, не снижают графическую производительность системы.

Повышенная производительность и другие улучшения сказались положительно на энергопотреблении GPU Maxwell архитектуры, при использовании NVENC, согласно информации от NVidia.

Теперь самое время посмотреть на таблицу конкурентов.

Наименование GTX 650 GTX 650 Ti GTX 750 Ti GTX 750 R7 260 R7 260X
Кодовое имя GK107 GK106 GM107 GM107 Bonaire Pro Bonaire XT
Версия шины PCI-E 3 3 3 3 3 3
Версия DirectX 11 11 11 11 11,2 11,2
Техпроцесс, нм 28 28 28 28 28 28
Площадь ядра, мм2 118 221 148 148 160 160
Количество транзисторов, миллиардов 1,3 2,54 1,87 1,87 2,08 2,08
Частота ядра, МГц 1058 928 1020 1020 1000 1100
Число шейдеров (PS), шт 384 768 640 512 768 896
Число блоков 
растеризации (ROP), шт
16 16 16 16 16 16
Число текстурных 
блоков (TMU), шт
32 64 40 32 48 56
Объём памяти, Мб
GDDR5 (GDDR3)
1024 1024 2048 1024 1024 2048
Частота памяти, МГц
GDDR5 QDR (GDDR3 DDR)
5000 5400 5400 5400 6000 6500
Шина памяти, бит 128 128 128 128 128 128
Пропускная 
способность 
памяти, Гб/с
GDDR5 (GDDR3)
80 86,4 86,4 86,4 96 104
Пиковая мощность, Вт 64 110 60 55 95 115

Карты брошены!

Nvidia в своих материалах проводит сравнение с GPU GK107, который имеет наиболее близкий размер кристалла. Да и номер у них единый не зря. По факту новичок создан, чтобы заменить GK106 и, заодно потеснить на рынке пару красных конкурентов — AMD Radeon R7 260 и AMD Radeon R7 260X.

С AMD Radeon R7 260X будет сражаться Nvidia GeForce GTX 750 Ti, а с AMD Radeon R7 260 — меньшой брат, Nvidia GeForce GTX 750.

Nvidia GeForce GTX 750 отличается от Nvidia GeForce GTX 750 Ti меньшим числом шейдерных ядер — 512, против 640. То есть в нем заблокирован один из пяти потоковых мультипроцессоров, что и дает такой результат. В соответствии с архитектурой Maxwell, это же привело к потере восьми блоков текстурирования — т.е. их 32 вместо 40, а число ROP блоков осталось без изменения — 16. Контроллер памяти не резали, как и частоту установленных чипов памяти.

К сожалению, у нас пока нет на руках Nvidia GeForce GTX 750, но зато есть Nvidia GeForce GTX 750 Ti, который и был всесторонне изучен.

Комментарии