Amd firepro w9100 для майнинга

Amd firepro w9100 для майнинга

Адрес этой статьи в Интернете: http://www.thg.ru/graphic/obzor_amd_firepro_w9100/

Обзор видеокарты AMD FirePro W9100: Hawaii в рабочих станциях

Обзор AMD FirePro W9100 | Hawaii в профессиональной среде

Впервые с 2007 года AMD оснащает видеокарты под маркой FirePro действительно крутым графическим процессором. Hawaii оснащён 6,2 млрд транзисторов – это на 44% больше по сравнению с чипом Tahiti, который установлен в устройстве FirePro W9000. При этом оба процессора изготовлены на основе техпроцесса 28 нм.

В чём ещё заключается сходство между предыдущим флагманом и более новым изобретением? Спасибо, что спросили.

Для начала давайте сравним технические характеристики двух видеокарт Nvidia Quadro и модели AMD FirePro W9100. Возможно, это послужит нам основой для наших предположений относительно производительности. В то время как флагман AMD стоимостью $4000 стоит дороже, чем Quadro K5000, он оценивается немного дешевле, чем Quadro K6000. Так что и в следующей таблице наша новинка находится посередине.

Nvidia Quadro K6000 AMD FirePro W9100 Nvidia Quadro K5000
Кол-во шейдерных ядер 2880 (CUDA) 2816 1536 (CUDA)
Производительность FP32 (SP), ТФлопс 5,2 5,24 2,2
Производительность FP64 (DP), Тфлопс 1,73 2,62 0,09
Объём памяти, Гбайт 12 16 4
Шина памяти, бит 384 512 256
Пропускная способность памяти, Гбайт/с 288 320 173
Наличие памяти с коррекцией ошибок (ECC) Да Да Нет
Пропускная способность PCI Express, Гбайт/с 32 32 16
Максимальное количество дисплеев 4K2K для подключения на частоте 30 Гц 2 6 2
Максимальное количество дисплеев 4K2K для подключения на частоте 60 Гц 2 3 2
Потребляемая мощность видеокарты, Вт 187 (3D-нагрузка), 202 (GPGPU) 245 (3D-нагрузка), 260 (GPGPU) 126 (3D-нагрузка), 145 (GPGPU)

Если вы располагаете более высокой производительностью, то достигнете и новых возможностей. Продукция AMD чаще всего изготавливается для удовлетворения потребностей пользователей в разных сферах профессиональной деятельности, включая техническую, медицинскую и финансовую (и не забываем о развлечениях) – это и есть её сильные стороны. Но, учитывая такой мощный графический процессор Hawaii и GCN-архитектуру, которые подойдут для процессов, характеризующихся высокой вычислительной нагрузкой, компания рассчитывает также покрыть сегменты виртуализации, онлайн-игр и информационных панелей.

В таком стремлении, безусловно, есть свой смысл, поскольку приложения для рабочих станций всё больше и больше затрагивают ресурсы графического процессора. Зато в настоящее время вы можете одновременно запускать рабочие процессы систем CAD и CAE. Запуск следующего изображения вместе с обработкой предыдущего уже не является несбыточной мечтой, и такая цель вполне достижима. Никаких границ не существует и для выполнения задач общего назначения, включая 3D-графику.

У AMD достаточно опыта в работе с 3D, и теперь развитию подлежит GPGPU. Способствуя этому, компания нацелена на поддержку OpenCL в качестве альтернативы Stream и CUDA. Как мы уже наблюдали в различных сложных приложениях, при параллельном выполнении непростой вычислительной работы происходит оптимизация прироста производительности.

Тенденция использования на рабочем месте устройств с разрешением 4К (3840×2160 пикселей) также заметна, поскольку они дают инженерам и специалистам в области графических приложений гораздо больше возможностей для работы. И в то время как более высокая детализация приносит пользу 3D-приложениям, даже для 2D-задач, включая программирование, используется преимущество дополнительного места на экране и высокой плотности пикселей, характерных для 4К-дисплея.

Точно так же и профессиональные рабочие станции получают возможность редактирования видео высокого разрешения в режиме реального времени. Такое устройство, как AMD FirePro W9100, должно ускорить не только обработку видео- и фотофильтров, но и процесс кодирования/декодирования.

Рынок графических решений для рабочих станций довольно изменчив, а границы между различными сегментами становятся всё более размытыми, так же как накопление информации и рабочие нагрузки становятся более конкретными, чем раньше. CAD, CAE, M&E, приложения моделирования для профессионалов энергетической отрасли.… Самая свежая из видеокарт AMD – AMD FirePro W9100 – разработана для выполнения большинства всех этих задач. Впрочем, хватит общих слов, давайте-ка лучше испытаем нашу видеокарту.

Обзор AMD FirePro W9100 | Различия между графическими процессорами Hawaii и Tahiti

И хотя площадь кристалла Hawaii 438 мм? меньше, чем у GK110 на видеокарте Nvidia Quadro K6000, всё равно этот графический процессор остаётся самым крупным из всех, которые когда-либо были выпущены. У легендарного R600 она была равна «всего лишь» 420 мм?.

Во многих отношениях реализация архитектуры AMD Graphics Core Next практически идентична Tahiti в AMD FirePro W9000. В частности, структурные элементы вычислительного блока остались прежними: 64 шейдерных ядра, совместимых со стандартом IEEE 754-2008, состоят из 4 векторных и 16 текстурных блоков.

Конечно же, у Tahiti в серии видеокарт AMD FirePro W9000 замечены и улучшения, в число которых входят прямая адресация устройств для поддержки стандартных соглашений о связях, повышение точности исходных операций LOG и EXP, а также оптимизация функции MQSAD, что приводит к ускорению выполнения алгоритмов анализа параметров движений.

С введением DirectX 11.2 была внедрена и программируемая фиксация уровня детализации (LOD), а также возможность оповещения шейдерного процессора о наличии постоянной поверхности. Обе функции относятся ко второму уровню и связаны с ресурсами процессора с топологией типа двухмерной решётки.

В основном, отступление от графических процессоров на устройствах серии W9000 связано с расположением вычислительных блоков, ведь у Tahiti использовалось 32 вычислительных блока с общим количеством 2048 шейдерных ядер и 128 блоков текстурирования. В свою очередь, Hawaii имеет 44 вычислительных блока в четырёх шейдерных движках, и такая технология получила название Shader Engines. Нетрудно посчитать, что теперь у нас в наличии есть 2816 шейдерных процессора и 176 блоков текстурирования.

Также в новом GPU используются восемь обновлённых движков асинхронных вычислений (Asynchronous Compute Engine), которые отвечают за планирование задач в реальном времени и фоновые задачи на CU. В устройствах серии W9000 имеются два ACE, и каждый из них управляет восемью очередями (всего получается 64) и имеет доступ к кэшу L2 и общей памяти.

Таким образом, общую эффективность можно повысить, выделив большее количество ресурсов для выполнения вычислительных и графических задач.

Внешний интерфейс W9000 перемещает вертексные данные на шейдерные ядра через пару геометрических процессоров. Структура из четырёх шейдерных движков Shader Engine помогает видеокарте AMD FirePro W9100 удвоить это количество, обеспечив работу четырёх простейших элементов вместо двух за тактовый цикл. Расширение коснулось и промежуточного хранилища между внешним и внутренним интерфейсом для сокрытия задержек и реализации максимально возможной пиковой пропускной способности простейших элементов.

В дополнение к выделенному геометрическому движку (и 11 CU), Shader Engine также содержит свой собственный блок растеризации и четыре внутренних интерфейса для рендеринга с возможностью вывода 16 пикселей за такт. 64 пикселя за такт по всему GPU – это вдвое больше, чем у серии W9000. Hawaii обеспечивает до 256 команд задания глубины и формата за тактовый цикл – и это тоже вдвое больше по сравнению с Tahiti (128 команд).

Для видеокарты, предназначенной для работы на высоком разрешении, полезна большая скорость прорисовки пикселей, и во многих случаях, согласно AMD, при этом эффект «бутылочного горлышка» в плане производительности операций прорисовки пикселей теперь более очевиден относительно пропускной способности памяти.

Общий кэш второго уровня для записи/чтения вырос по сравнению с Tahiti (768 Кбайт) до 1 Мбайт. Он разделён на 16 частей по 64 Кбайт, а увеличение на 33% приводит к повышению пропускной способности между кэшем L1 и L2 на те же 33%, достигая 1 Тбайт/с.

Понятно, что повышение пропускной способности с добавлением 768 шейдерных ядер и удвоением скорости прорисковки пикселей в рамках внутреннего интерфейса предъявляют дополнительные требования к подсистеме памяти Hawaii. AMD обходит эту проблему, внедряя обновлённый контроллер.

Новый GPU использует 512-битную совокупную шину, занимающую, по словам сотрудников компании, на 20% меньше пространства в сравнении с 384-битной шиной у Tahiti и обеспечивающую вдвое большую пропускную способность на 1 мм?.

Как такое стало возможным? Высокая скорость передачи данных развивается за счёт потери пространства на кристалле и, доходя до уровня 6 Гбит/с при повышенном напряжении, шина Tahiti выглядит менее эффективной, по сравнению с шиной Hawaii, предусматривающей более низкие частоты и напряжение, а значит, и физически более компактной. В случае с AMD FirePro W9100 512-битная шина развивает скорость 5 Гбит/с с полосой пропускания до 320 Гбайт/с. В сравнении с этим показателем, пропускная способность памяти Tahiti не превышала 288 Гбайт/с.

Обзор AMD FirePro W9100 | Размеры, вес и различные особенности

Теперь коротко ознакомимся с техническими спецификациями новинки.

Размеры и вес
Длина 281,9 мм, включая разъёмы питания > 300 мм (разъёмы питания PCIe находятся сзади)
Ширина 34 мм на печатной плате со стороны кулера
5 мм на задней части печатной платы
Высота 103,1 мм от верха до PCIe-разъёма
Вес 1,098 кг

Видеокарта выглядит довольно скромно. Она заключена в чёрный пластиковый кожух, поэтому тут же в памяти всплывает модель Radeon HD 6970. Кажется, что в конструкции остался даже тот же самый референсный кулер, что заставляет насторожиться, если вспомнить о модернизированных видеокартах Nvidia Quadro.

Система охлаждения в видеокарте AMD FirePro W9100 включает в себя ту же испарительную камеру, что была задействована в модели AMD FirePro W9000. Выпуклый красный вентилятор контролирует пропускание воздуха через кулер, а вывод воздуха осуществляется через левую часть видеокарты и панель ввода/вывода. Как мы знаем из обзоров видеокарт Radeon R9 290X и Radeon R9 290 , такая конструкция не отличается низким уровнем шума, но зато мы уверены в том, что она способна полноценно исполнять свои прямые обязанности.

Задняя часть AMD FirePro W9100 закрыта металлической пластиной, которая не только добавляет жёсткости, но и более эффективно охлаждает модули памяти на этой стороне печатной платы.

На нижней части AMD FirePro W9100 нет ничего, кроме кожуха.

На верхней части AMD FirePro W9100 нет разъёмов CrossFire – GPU Hawaii использует DMA с поддержкой CrossFire через шину PCI Express. Здесь, как и на видеокарте AMD FirePro W9000, существует возможность подключения к модулю синхронизации с FirePro S400.

Сзади располагаются шести- и восьмиконтактные разъёмы для дополнительного питания, и о них мы расскажем в тот момент, когда начнём изучение энергопотребления AMD FirePro W9100.

Панель с разъёмами

Помимо шести разъёмов mini-DP с поддержкой подключения до шести 4К-мониторов с частотой 30 Гц (или трёх 4К-мониторов с частотой 60 Гц), здесь также содержится трёхконтактный порт mini-DIN для подсоединения 3D-мониторов.

Обзор AMD FirePro W9100 | Тестовая конфигурация и бенчмарки

Конфигурация и тесты

В данном случае мы не стали разгонять процессор Intel Core i7-4930K, так как рабочие станции чувствительны к стабильности, поэтому наш процессор работает на базовой частоте 3,5 ГГц. Однако сейчас наша тестовая установка содержит три SSD-накопителя, и мы разносим операционную систему, наборы тестов и журналы данных на разные хранилища.

Как правило, мы производим тестирование при помощи драйверов от каждого из независимых вендоров, однако это не является возможным в случае с совершенно новой видеокартой, так что нам пришлось использовать самый последний доступный драйвер для AMD FirePro W9100 (см. таблицу).

Для измерения энергопотребления требуется отдельный раздел тестов, и нам нужно увидеть отличия новинки от настольных ПК AMD. Прямо сейчас мы знаем, что FirePro не подвергается разгону на заводе, как многие игровые устройства.

Ниже следует список оборудования, которое мы будем использовать для тестирования.

Конфигурация тестового стенда
Корпус Microcool Banchetto 101
Конфигурация системы Intel Core i7-4930K (Ivy Bridge-E), базовая частота 3,5 ГГц, 6C/12T
Asus Rampage IV Black Edition
64 Гбайт оперативной памяти Corsair Dominator Platinum, DDR3-2133 1600 MT/с
Закрытая жидкостная система охлаждения Enermax TLC 240
Samsung 840 Pro, 256 Гбайт (система и приложения)
Накопитель для редактирования видео Corsair Neutron GX, 480 Гбайт (входные данные)
Накопитель для рабочих нагрузок Samsung 840 EVO, 500 Гбайт (выходные данные)
Операционная система Microsoft Windows 7 Ultimate x64 (профессиональные приложения и вычисления)
Microsoft Windows 8 Professional x64 (игровой процесс)
Видеодрайверы Catalyst Pro 13.35
Nvidia Quadro Desktop Driver 334.95
Комнатная температура 22 градуса

Обзор AMD FirePro W9100 | Результаты тестов

OpenCL: Вычисление, криптография и пропускная способность

Шейдерная производительность: FP32 против FP64

Начнём с бенчмарка OpenCL, который позволит вычислить теоретический предел производительности при 32- и 64-битных вычислениях.

Хотя этот тест является синтетическим (наряду с криптографическим тестом), Nvidia по-прежнему не высказывает какого-либо энтузиазма по отношению к OpenCL.

Мы знаем, что Nvidia предлагает собственный интерфейс CUDA API, и его поддерживают множество приложений. Однако всё чаще независимые вендоры отказываются от поддержки двух вычислительных языков, и в результате этого обороты в разработке набирает именно OpenCL. Даже компании, которые длительное время поддерживали CUDA (например, Adobe) делают выбор в пользу OpenCL.

Запустим для этой видеокарты бенчмарк Folding@Home, хотя и мало кто будет использовать рабочую станцию стоимостью $4000 для «майнинга» биткоинов.

В тесте пропускной способности памяти OpenCL устройства Nvidia практически настигают новинку от AMD, а переключение в DirectX позволяет архитектуре GK110 ещё больше опередить AMD FirePro W9100 примерно на 50%.

Результаты синтетических тестов следует иметь в виду, переходя на тестирование бенчмарками на базе приложений. Это поможет расшифровать результаты тестирования в реальных условиях, в ходе которых нужно учитывать влияние со стороны других подсистем платформы.

На данный момент для нас остаётся неясным ответ на вопрос, правильной ли является стратегия компании Nvidia, поверхностно поддерживающей OpenCL и делающей упор на CUDA. Время покажет.

OpenCL: вычисления в финансовой и научной сфере

Моделирование ценообразования входит в группу задач с интенсивной вычислительной нагрузкой, где графические процессоры могут успешно себя проявить. В тестах с одинарной и двойной точностью видеокарта AMD FirePro W9100 одерживает уверенные победы.

Тем не менее, производительность при тестировании с двойной точностью у устройств AMD меньше в три раза, а у Nvidia Quadro K6000 – меньше, чем в два раза по сравнению с предыдущими вычислениями. Модель K5000 в этом плане видится совершенно непригодной.

Аналогичное соотношение наблюдается у AMD и в GEMM-тесте наряду с заметным падением производительности при переходе с вычислений с одинарной к вычислениям с двойной точностью.

При переходе из одного состояния в другое модель Nvidia Quadro K6000 сохраняет большую часть своей производительности, в то время как флагман AMD теряет значительную часть скорости и в конечном итоге финиширует позади своего конкурента.

2D производительность: GDI и GDI+

Почему мы до сих пор используем GDI и GDI+?

Даже сейчас, в 2014 году, многие приложения используют для рисования интерфейсы GDI и GDI+, даже если только задействуют GUI. Старые рабочие приложения и специфические бизнес-задачи выполняются преимущественно с помощью GDI/GDI+. Диапазон приложений велик – от простых 2D-CAD-программ и инструментов просмотра до WYSIWYG-приложений, используемых при подготовке макетов, и программ, предполагающих экспорт или импорт файлов.

Так как современные видеокарты с унифицированными шейдерными ядрами больше не имеют специальных 2D-блоков, а современные операционные системы не используют мгновенный доступ к видеокартам, решающее значение в быстром выполнении графических задач в 2D имеют драйвера устройств.

Показ текста является важнейшей задачей для такого класса устройств, и оба производителя убеждены в том, что их высококлассные видеокарты практически мгновенно воспроизводят большие объёмы текста.

Линии входят в число основных 2D-элементов (например, линии в меню), и снова ни одна из видеокарт не испытывает никаких проблем при выполнении данной задачи. Карты AMD, тем временем, опережают своих конкурентов примерно на 20%.

Сплайны и кривые Безье

Для кривых линий нужна некоторая вычислительная мощность, и вполне естественно, что для их прорисовки требуется больше времени. Продукция AMD снова впереди на те же два десятка процентов.

Бенчмарк выводит на экран заполненные и пустые многоугольники с вершинами в количестве от трёх до семи, и видеокарты AMD знают, как справиться с этой задачей, чего не скажешь про модель Nvidia Quadro K5000, которая работает примерно вдвое медленнее, чем более старая AMD FirePro W9000.

Да, прямоугольники – это тоже многоугольники, но для их прорисовки GDI экспортирует отдельный и более простой API. Понятно, что этот процесс должен протекать быстрее, чем рисование многоугольников, о которых говорилось выше.

И, похоже, что под эти задачи больше подходит продукция Nvidia, а не AMD, ведь обе видеокарты Quadro опережают две модели FirePro.

Круги, круговые сегменты и эллипсы

В этом тесте результаты всех четырёх видеокарт примерно равны между собой.

Побитовое копирование изображения (бит-блиттинг)

Данный процесс характеризуется копированием блоков из системы к графической памяти и со временем становится всё менее важным. В конце концов, предполагается, что заполнением своей памяти пикселями занимается сама видеокарта, а не процессор. Неудивительно, что производительность при выполнении этой операции не слишком повысилась за последние годы. На самом деле она пошла по другому пути.

Похоже, Nvidia справляется с этим процессом получше, хотя в целом результаты всех видеокарт несколько разочаровали. Помогает формат DIB (аппаратно-независимый растр), выполняющий все операции рисования во временном растровом изображении, которое располагается в оперативной памяти компьютера, а на заключительном этапе – передающий его на видеокарту.

Здесь дело обстоит ещё хуже, так как задействуется процессор.

Победителя в соревновании по производительности GDI среди продукции Nvidia и AMD объявить не удалось. К сожалению, развитие 2D стоит на месте года с 2010-го. Но, по крайней мере, AMD удалось нивелировать некоторые «узкие места».

В целом, приложения достигают более высокой производительности, если передают всю информацию во временный формат DIB, а затем копируют результат для видеокарты. Однако на экранах с более высоким разрешением тот объём данных, который необходимо скопировать через PCIe-интерфейс, может быть весьма велик. Это ужасно, что в эпоху PCIe 3.0 процесс копирования данных на видеокарту происходит гораздо медленнее, чем операции копирования внутри оперативной памяти рабочей станции.

С учётом вышесказанного, видеокарты AMD работают лучше, чем устройства Nvidia, в основном, при прорисовке линии, сплайна и многоугольника. Может быть, и наша, в своё время жестокая, критика драйверов от AMD частично повлияла на результат.

Новинка AMD FirePro W9100 справляется с комплексным процессом 2D-рисования при помощи GDI практически в два раза быстрее, чем Nvidia Quadro K5000. Или вдвое легче. Как угодно.

SPECviewperf12: CATIA, Creo и Maya 2013

Знакомство с SPECviewperf 12

SPECviewperf 11 появился в 2010 году, но со временем устарел, и уже не мог предоставлять нам более реалистичную картину производительности современных рабочих станций и драйверов. Устаревшими были и приложения в его составе. Более того, AMD и Nvidia тщательно оптимизировали свою продукцию под определённые рабочие нагрузки, так что в этом наборе бенчмарков уже не было никакой нужды.

В итоге SPEC вновь вступила в игру, выпустив столь необходимое обновление. Всё-таки основной задачей компании является создание соответствующих бенчмарков, которые тесно связаны с современными отраслевыми стандартами.

AMD и Nvidia входят в SPEC, что позволяет им оказывать некоторое влияние на разработку новых тестов. Смысл заключается в том, чтобы ни одна из компаний не получила несправедливого преимущества. Посмотрим, как это выглядит на практике.

AMD FirePro W9100 обгоняет своего предшественника и модель Nvidia Quadro K5000, а результат видеокарты Nvidia Quadro K6000 недостижим абсолютно для всех. Но и при этом следует отметить впечатляющий дебют устройства AMD FirePro W9100 .

Хоть наша новинка и снова опережает свою предшествующую модель, обе видеокарты Nvidia Quadro её превосходят. Очевидно, что разработчикам драйверов AMD ещё есть куда стремиться.

В этом тесте всё наоборот, и здесь свой вклад в успех AMD вносит Autodesk, а AMD FirePro W9100 на мизерную долю превосходит Nvidia Quadro K6000.

SPECviewperf 12: Showcase, Siemens NX и SolidWorks

Второе место за видеокартой AMD FirePro W9100 , а побеждает Nvidia Quadro K6000. При этом оба устройства значительно опережают все остальные модели видеокарт. Заметим, что Showcase 2013 – это одно из немногих профессиональных приложений, которое полностью базируется на DirectX.

И снова флагманы Nvidia и AMD обгоняют все остальные устройства с большим преимуществом. В споре между ними небольшой перевес на стороне Nvidia Quadro K6000.

SolidWorks 2013 SP1

Nvidia Quadro K6000 развивает превосходную производительность, которая вполне соответствует её немалой стоимости. Что касается модели AMD FirePro W9100 , то она еле превосходит более старую видеокарту W9000, но уступает Nvidia Quadro K5000. Можете себе представить, насколько унизительно посредственной кажется производительность AMD FirePro W9100 в сравнении с устройством Nvidia Quadro K6000? Что ж, вот и ещё одна непростая задача для разработчиков программного обеспечения AMD.

SPECviewperf12: синтетические симуляторы

Синтетические тесты: приложения сферы энергетики

Этот бенчмарк имитирует типичное мощное и требовательное приложение, которое используется для геофизических исследований (сейсмология, поиск нефти и природного газа) и медицинской визуализации. Во время этих исследований 2D-модели формируют объёмные изображения с 2D- и 3D-видами для дальнейшего анализа.

Бенчмарк energy-01 использует аппаратную поддержку 3D-текстур и трилинейную интерполяцию, которая, в свою очередь, зависит от наличия большого объёма быстрой видеопамяти. AMD FirePro W9100 серьёзно отстаёт от Nvidia Quadro K6000, да и практически не опережает модель W9000. В свою очередь, обе видеокарты AMD ненамного превосходят Nvidia Quadro K5000.

Синтетические тесты: приложения медицинской сферы

Как и при предыдущем тестировании, который охватывал геофизические исследования и визуализацию, SPECviewperf 12 применяет синтетический набор, имитируя деятельность в области медицины, где используется функциональность, часто задействованная при таком наборе текстур объёмного рендеринга. Двухмерные изображения, созданные посредством компьютерной или магнитно-резонансной томографии, визуализируются в 3D.

Прямой объёмный рендеринг достигается при параллельном выстраивании частичек изображения. Это происходит на основе текстурных координат, которые указаны на каждой из вершин. Они располагаются в 3D-пространстве (x, y, z) и определяют выравнивание и масштабирование текстуры на многоугольнике через объект. Далее те значения, которые необходимы для реального отображения, рассчитываются на основе текстурных координат. Так происходит композитинг. Весь объём может рассматриваться как множество ячеек или объёмных пикселей, отвечающих за непрозрачность и цветность текстуры.

Объёмный рейкастинг используется для вычисления фактического изображения из объёмных пикселей. Этот бенчмарк состоит из двух частей — «4D Heart Data Set» с несколькими 3D-объектами и «Stag Beetle» с серьёзными задачами для памяти. AMD FirePro W9100 отлично подходит для обоих тестов и одерживает убедительную победу над конкурентами.

OpenCL: обработка 4К-видео

Редактирование и кодирование видео

Для работы в мультимедийных и развлекательных приложениях профессионалам требуется плавная и эффективная обработка контента с высоким разрешением. OpenCL и CUDA хорошо подходят для ускорения столь сложных вычислений.

Поскольку 4К-разрешение (3840×2160 пикселей) становится всё более и более распространённым в профессиональных и настольных системах, мы выбрали два приложения, которые используются для ускорения обработки (фильтрации) и кодировки столь сложного формата.

Мы слегка изменили нашу тестовую установку, добавив третий SSD-накопитель Samsung 840 EVO ёмкостью 500 Гбайт. На него записываются выходные данные, которые представляют собой большие кодированные в формате H.264 видеофайлы. Входные файлы (несколько 4К-изображений в формате TIFF и 4К-видео) хранятся на Corsair Neutron GX ёмкостью 480 Гбайт. Мы хотели убедиться в том, что накопитель не будет испытывать на себе влияния «узких мест», в свою очередь влияющих на производительность.

Adobe Premiere CC Pro

Итак, оба наших теста содержат последовательность из TIFF-изображений, подвергшихся влиянию ускоренных OpenCL-фильтров, и видео высокого разрешения, которое также проходит через множество фильтров.

В первом тесте AMD FirePro W9100 располагается немного пониже Nvidia Quadro K6000. После уменьшения количества OpenCL-фильтров небольшая разница в быстродействии падает до промежутка в несколько секунд.

В этом тесте AMD FirePro W9100 удаётся показать свою мощь, опережая Nvidia Quadro K6000 ещё заметнее, чем в тесте Adobe Premiere Pro CC.

В целом, AMD FirePro W9100 держит свой уровень, и мы видим, что чем с большим мультимедийным контентом приходится работать и чем более сложными становятся фильтры, тем больший прирост производительности получает GPU.

OpenCL: производительность рендеринга

LuxMark против RatGPU

Итак, на очереди у нас два разных инструмента рендеринга, использующих различные подходы. Во-первых, это популярный LuxRender, на котором базируется LuxMark, и который привлёк внимание Nvidia, снова и снова указывая на слабости видеокарт GeForce и Quadro. Другой – RatGPU – столь же заметным не стал, поскольку новинки Nvidia сразу справлялись с ним без каких-либо проблем.

Согласно LuxRender, Nvidia достаточно неплохо поддерживает OpenCL, если нет возможности использования CUDA. Когда-то и AMD имел в этом тесте значительное преимущество в производительности, хотя оно с тех пор начинало сокращаться. Но всё-таки уверенное лидерство остаётся за новинкой AMD.

Три следующих графика содержат результаты измерения LuxMark на трёх разных уровнях сложности:

По сравнению с прошлым бенчмарком, в тесте ratGPU новая видеокарта AMD не так хороша. Как и в случае с LuxMark, нас ждут три уровня сложности:

DirectX11: Full HD против Ultra HD

Производительность в играх при разных разрешениях

Мы выбрали четыре игры на DirectX 11. На разрешении 1080p (1920×1080 пикселей) AMD FirePro W9100 становится победителем в двух наших тестах, а в остальных – впереди Nvidia Quadro K6000. Однако на высоких разрешениях флагман AMD превосходит своего конкурента во всех четырёх тестах, хотя в одном из бенчмарков поединок почти закончился вничью.

Преимущество AMD FirePro W9100 заключается не в большой ёмкости памяти (16 Гбайт), а в её интерфейсе и более высокой пропускной способности. Конечно, в других играх (к примеру, Assassin’s Creed IV) Nvidia Quadro K6000 может и опередить нашу новинку. Но полученный нами результат неудивителен – видеокарты на чипе Hawaii для настольных систем в очных сражениях, как правило, превосходят продукцию Nvidia.

Энергопотребление: пара слов о нашем оборудовании

Знакомимся с нашим тестовым оборудованием

Наша тестовая установка была изготовлена в сотрудничестве с HAMEG (Rohde & Schwarz), чтобы измерения на малых интервалах были максимально точными. Для этого мы постоянно работали над улучшением механизма в течение последних нескольких месяцев.

Технологии PowerTune (от AMD) и GPU Boost (от Nvidia) вносят существенные изменения в нагрузку и требуют профессионального подхода к измерению для получения точных показателей. Имея это в виду, мы добавляем серию бенчмарков с чрезвычайно коротким диапазоном в 100 мкс и частотой в 1 мкс.

Точных результатов помогает достичь цифровой осциллограф HAMEG HMO 3054 с частотой 500 МГц, а измерение тока и напряжения легко производить через пульт дистанционного управления.

Все измерения фиксируются при помощи трёх зондов с высоким разрешением (HAMEG HZ050) не только через карту расширения для 3,3 и 12 В (которая была специально сконструирована под наши потребности с поддержкой PCIe 3.0), но и при помощи специально модифицированных дополнительных кабелей.

Напряжение измеряется при помощи источника питания по линии +12 В. Для стандартных показаний мы используем разрешение 2 мс, этого должно хватить для того, чтобы зафиксировать изменения PowerTune и GPU Boost. Поскольку происходит выдача необработанных данных, мы используем ограниченный двухминутный диапазон.

Конфигурация тестового стенда для измерения энергопотребления
Конфигурация измерений Безконтактное измерения постоянного тока в слоте PCIe (райзер-карта)
Безконтактное измерения постоянного тока на внешнем кабеле питания PCIe
Измерение напряжения на блоке питания
Тестовое оборудование Один четырёхканальный осциллограф HAMEG HMO 3054, 500 МГц
Три датчика тока HAMEG HZO50 (1 мA — 30 A, 100 кГц, постоянный ток)
Четыре HAMEG HZ355 (10:1 датчик, 500 МГц)
Один HAMEG HMC 8012 DSO
Блок питания Corsair AX860i (модифицированные выходы с измерительными ответвлениями)

Что происходит в течение 100 мс?

Много чего! Мы записываем потребление энергии на трёх датчиках с интервалами по 2 мс и для демонстрации берём период в 100 мс. Затем мы наносим на график 50 точек данных.

Глядя на график, хочется пожалеть блок питания. Энергопотребление по кабелям PCIe скачет в диапазоне 94-356 Вт в течение нескольких миллисекунд. Две тестовых точки в райзер-карте PCIe таких радикальных колебаний нагрузки не показывают.

В отличие от большинства потребительских видеокарт, в нашем случае не слышно шума от катушек. Конечно, учитывая ценовой уровень данной модели, лучше обойтись без него.

Хорошо, что ни устройства Nvidia, ни видеокарта AMD не достигают предельного значения 75 Вт. Большую часть нагрузки взваливают на себя дополнительные разъёмы питания. Также нет резких скачков при работе разъёма на материнской плате, что увеличивает степень стабильности системы и даёт дополнительное преимущество устройствам с несколькими GPU.

Подробные результаты измерения энергопотребления

Энергопотребление в простое

Не задействуя режим энергосбережения Zero Core, видеокарта рассеивает в состоянии почти полного простоя 15,4 Вт, обеспечивая частоту обновления монитора 60 Гц. Нам хотелось бы увидеть меньший результат, но он всё равно остаётся приемлемым, учитывая уровень этой модели. Несмотря на наличие 16 Гбайт быстрой памяти GDDR5, в простое она потребляет всего 1 Вт.

Максимальное энергопотребление в 3D (OpenGL)

Максимальное энергопотребление достигает уровня 245 Вт, что немного меньше, чем у других настольных видеокарт AMD топ-категории, потребляющих 250 Вт. Примерно 51 Вт поступает из материнской платы, а ещё 194 Вт – через кабели к разъёмам для дополнительного питания.

Максимальное энергопотребление при вычислениях (OpenCL)

Даже при 100%-ной нагрузке нам не удалось «разогнать» видеокарту до энергопотребления на уровне 275 Вт. Перед достижением максимального результата энергопотребления предварительно нагретая видеокарта сталкивается со своим тепловым пределом.

Обзор AMD FirePro W9100 | Температура и уровень шума

Мы проводим тепловые измерения видеокарты при температуре окружающей среды 22 градуса и нормальной влажности.

Почти каждая из протестированных нами видеокарт достигает заводского температурного предела, что видно и из следующей диаграммы.

Модель В простое 3D-нагрузка
Quadro K5000 30 °C 76 °C
Quadro K6000 32 °C 80-82 °C
FirePro W9100 40 °C 92-93 °C
FirePro W9000 34°C 78 °C

Мы измеряем уровень шума каждой из видеокарт с помощью высококачественного студийного микрофона, расположенного перпендикулярно центру видеокарты на расстоянии 50 см. Это расстояние вместе с мощными характеристиками микрофона позволяет найти компромисс между шумом, который издаётся вентилятором, и посторонними шумами, которые нельзя устранить полностью. Наши усилия по шумоподавлению, безусловно, помогают их минимизировать, но никогда не будут стопроцентно успешными.

Как мы уже видели много раз прежде, референсные видеокарты обеспечивают эффективное охлаждение за счёт более высокого уровня шума. Высококлассные видеокарты выводят тепло через панель ввода-вывода, чтобы избежать воздействия на другие компоненты платформы. Тем не менее, этим карта обязана радиальному вентилятору, и, судя по нашим результатам, от него исходит довольный сильный шум.

Ниже можно ознакомиться с подробными результатами измерения уровня шума:

Модель В простое 3D-нагрузка, открытый тестовый стенд 3D-нагрузка, закрытый корпус
Quadro K5000 30,8 дБ (А) 37,7 дБ (А) 37,1 дБ (А)
Quadro K6000 30,8 дБ (А) 42,7 дБ (А) 41,2 дБ (А)
FirePro W9100 33,5 дБ (А) 51,3 дБ (А) 49,8 дБ (А)
FirePro W9000 33,2 дБ (А) 55,4 дБ (А) 52,7 дБ (А)

Обзор AMD FirePro W9100 | Королева среди видеокарт для рабочих станций?

Если вы хотите добиться от вашей профессиональной графики наибольшей эффективности, то в этом случае трудно превзойти модель AMD FirePro W7000. Целью AMD FirePro W9100 является обеспечение высокого уровня производительности в 3D наряду с выполнением сложных вычислительных задач. Полностью превзойти лучшие образцы Nvidia в этих дисциплинах не удастся. Однако новинка от AMD, похоже, обеспечивает наиболее экономичный способ достижения самых серьёзных высот в мире рабочих станций. И наши CAD- и CAE-тесты, а также мультимедийные и развлекательные бенчмарки, это подтверждают – уровню их задач видеокарта полностью соответствует.

В то время как AMD успешно продвигает ускорение OpenCL в профессиональных приложениях, её серия видеокарт FirePro должна продолжать завоевание своей доли на рынке. С добавлением Mac в качестве поддерживаемой платформы компания движется в верном направлении, хотя количество совместимых с Mac видеокарт по-прежнему остаётся небольшим.

4К-разрешение и множество вариантов для подключения

AMD FirePro W9100 является первой (и единственной) видеокартой, которая поддерживает подключение шести мониторов на полном 4К-разрешении, хотя при этом придётся работать на частоте 30 Гц, если подключено более трёх устройств. Большого объёма быстрой памяти (16 Гбайт GDDR5) более чем достаточно для решения любой задачи.

Охлаждение и потребляемая мощность

Одно из впечатляющих усовершенствований заключается в создании системы охлаждения, которую мы наблюдали и на предыдущих референсных видеокартах для рабочих станций. Модернизация кулера на примере многих партнёрских компаний может привести к работе чипа Hawaii на температуре менее 92 градусов. Тёплый воздух не должен уходить в корпус, как в игровых моделях, поскольку это неприемлемо для решения задач, на которые нацелены рабочие станции.

Вместо этого профессиональные видеокарты должны выводить тепло через панель ввода-вывода, как это удалось Nvidia с её продукцией Quadro, и AMD должна следовать данному примеру. Несомненно, с теплоотводом и кулером в AMD FirePro W9100 можно пожертвовать некоторой производительностью, поскольку Hawaii лучше всего функционирует при оптимальном охлаждении.

AMD уверенно оценивает свою модель AMD FirePro W9100 в $4000, что выглядит вполне адекватно в сравнении с более медленной Nvidia Quadro K5000 за $1800 и более быстрой Nvidia Quadro K6000 за $5000. К тому же эта новинка отлично подходит для выполнения функций рабочих станций, особенно когда нагрузка полностью соответствует силе графического процессора (и разработанному ПО).

Какой итог анализа видеокарты AMD FirePro W9100 мы можем озвучить? Стоимость $4000 соответствует отличному уровню производительности, универсальности при работе в различных профессиональных сферах с самыми современными нагрузками и непревзойдённым количеством поддерживаемых способов внешнего подключения. Видеокарта обеспечивает сочетание скорости в 3D-задачах и приложениях общего назначения с интенсивной вычислительной нагрузкой.

Источник

Читайте также:  Период окупаемости по инвестиционному кредиту что это такое
Оцените статью