- Профессиональные видеокарты против игровых — зачем нужна Nvidia Quadro?
- Содержание
- Содержание
- Зачем нужны профессиональные видеокарты
- В чем отличия профессиональных и игровых видеокарт
- Можно ли играть на профессиональных видеокартах?
- Tesla — GPU
- #1 OFFLINE lelikcr
- Профессиональная видеокарта NVIDIA Tesla K40 в майнинге — шедевр или…?
- Технические особенности видеокарты NVIDIA Tesla K40
- Элементная база видеокарты Nvidia Tesla K40
- Как запустить майнинг на видеокарте Nvidia Tesla K40?
- Хешрейт видеокарты NVIDIA Tesla K40 при майнинге
- Заключение
Профессиональные видеокарты против игровых — зачем нужна Nvidia Quadro?
Содержание
Содержание
Компании Nvidia и AMD выпускают не только геймерские и офисные видеокарты. Та же линейка Nvidia Tesla используется в суперкомпьютерах и мощных вычислительных системах, ориентированных на научные расчеты. А мы поговорим о профессиональных видеокартах для массовых пользователей — линейке Nvidia Quadro и аналогичных.
Зачем нужны профессиональные видеокарты
Все видеокарты выполняют общую задачу — отрисовывают на дисплее кадры, которые до этого подготавливает процессор. Графический чип получает исчерпывающую информацию о сцене: состав и расположение объектов относительно зрителя, цвет, уровень освещения, видимость и так далее. Пару десятилетий назад в играх была пиксельная графика, но сейчас для создания 3D- сцен используются объекты из множества полигонов.
Полигон — это плоскость в трехмерном пространстве. Как правило, в играх используются треугольные полигоны, на основе которых создают уже полноценные 3D-модели. Чем выше число этих треугольников, тем большую детализацию имеет выводимое изображение.
Именно поэтому в старых играх персонажи имеют угловатые формы — вычислительные мощности того времени позволяли оперировать лишь небольшим числом полигонов. По мере совершенствования видеокарт количество полигонов у моделей росло, персонажи становились более реалистичными, резкие углы сглаживались. Это можно хорошо заметить на примере различных ремастеров, например, Crash Bandicoot.
В среднем на одного персонажа приходится от 15 до 45 тысяч таких треугольников. Одним из рекордсменов в этой области является Нейтан Дрейк из Uncharted 4: A Thief’s End. В его модели более 80 тысяч полигонов.
А теперь представьте, что на экране несколько персонажей и еще различные объекты окружения. Игровым видеокартам приходится обрабатывать положение пары сотен тысяч полигонов, не говоря о наложении других эффектов.
Если говорить об игровой видеокарте, то ее задача — расположение всех полигонов в пространстве, прорисовка текстур, затенение, создание динамического освещения и сглаживание. В итоге мы видим на экране финальный кадр со всеми эффектами.
Профессиональные видеокарты чаще нужны для САПР, бизнес-приложений, визуализации, инженерных расчетах. Если вы занимаетесь моделированием и работаете в таких программах, как КОМПАС-3D, T-FLEX CAD, SOLIDWORKS, Autodesk 3ds Max и аналогичных, то предпочтительней именно профессиональная видеокарта.
Помимо этого, видеокарты NVIDIA Quadro используются при создании различных спецэффектов в фильмах.
Профессиональная видеокарта делает по сути тоже самое, что и игровая, но с небольшими нюансами. В узкоспециализированных 3D- моделях не нужно накладывать различные эффекты, которые делают графику фотореалистичной. При проектировании и разработке крайне важна точность, поскольку на основе созданных моделей обычно делают реальные вещи. Соответственно, число полигонов может в несколько раз превышать описанные ранее числа — до нескольких миллионов на сцену.
В чем отличия профессиональных и игровых видеокарт
Теперь давайте разберемся, чем конкретно профессиональные видеокарты отличаются от геймерских.
Больший объем видеопамяти. Для обработки огромного числа полигонов нужно много памяти. Для сравнения, видеокарта NVIDIA Quadro P6000 2016 года имеет 24 ГБ памяти. Если взять топовую геймерскую видеокарту на аналогичной архитектуре GTX 1080 Ti начала 2017-го, то у нее всего 11 ГБ памяти. Тенденция сохраняется и с текущим поколением: игровая RTX 3090 оснащается 24 ГБ, в то время ка профессиональная NVIDIA Quadro RTX 8000 имеет целых 48 ГБ.
Жесткая стандартизация. В геймерсих видеокартах существует нереференсные улучшенные модели от сторонних компаний — Asus, MSI, Palit и других. Профессиональные видеокарты выпускаются строго под контролем разработчиков и обычно не имеют нереференсных моделей. Это позволяет исключить ситуации, когда вмешательство вендора привело к неработоспособности устройства.
Использование ECC-памяти. Как мы сказали ранее, в профессиональных видеокартах определяющее значение имеет точность, и ошибки при расчетах недопустимы. В связи с этим используется специальная ECC-память, которая способна распознавать и исправлять спонтанные ошибки в битах. Однако память с коррекцией работает немного медленнее в сравнении с non-ECC, которая стоит на игровых видеокартах. Тесты энтузиастов показывают, что разница скорости между ECC и non-ECC в различных задачах не превышает 2 %.
Аппаратная поддержка OpenGL. Это программный интерфейс, используемый при написании различных приложений с 2D/3D графикой. Аппаратная поддержка ощутимо ускоряет вычисления, но ее реализация повышает стоимость продукта.
Специализированные драйверы и BIOS. Для профессиональной видеокарты нужен специальный драйвер. Он предлагает немного больше настроек, например, в панели Nvidia Control пользователи Quadro могут установить сглаживание граней объектов вплоть до 64Х, в то время как GeForce предлагает только 8X. Также спецдрайвер предоставляет более широкие возможности управления рабочими столами и их конфигурациями.
В установочный пакет драйверов для Quadro входит особое ПО — NVIDIA WMI (Windows Management Instrumentation) и специальный инструмент NVIDIA SMI для мониторинга. Для игровых GeForce GTX/RTX в стандартном пакете этого нет.
BIOS в Quadro разрабатывают непосредственно инженеры компании, а не специалисты сторонних брендов.
Сертификация от разработчиков ПО. В профессиональных моделях крайне важна корректная работа в узкоспециализированных программах без багов и зависаний, поэтому разработчики ПО проводят отдельную сертификацию.
Более длительный жизненный цикл. Обновление линеек геймерских видеокарт происходит в среднем один раз в 1,5-2 года. Профессиональные модели обновляются реже — раз в 2–4 года.
Специфика портов. В профессиональных моделях вы редко встретите HDMI и, тем более, VGA. В Nvidia Quadro последнего поколения используются порты DP1.4, а также Virtuallink. В более старых моделях присутствует DVI порт.
Цена. Рекомендованная цена Quadro RTX 8000 — 9 999 долларов. За топовую геймерскую RTX 3090 придется отдать 1499 доллара, что существенно дешевле.
Профессиональные карты имеют аппаратные и программные особенности, направленные на повышение производительности сугубо в специализированных приложениях для работы с 3D и 2D графикой, а также на общую стабильность и надежность.
Можно ли играть на профессиональных видеокартах?
Технически профессиональные модели имеют все то же, что и игровые: ядра CUDA, блоки растеризации, текстурные блоки, а новые Quadro RTX по аналогии с геймерскими RTX имеют и тензорные ядра. Именно поэтому вы без проблем сможете запустить игру на Quadro или аналогичных с комфортным FPS.
Проблема в том, что Quadro не ориентированы на отрисовку графических эффектов, которые актуальны для видеоигр. Именно поэтому при относительно равных параметрах профессиональные ускорители выдают меньший FPS. На этом сказывается и ориентация драйверов — для Quadro и аналогичных они просто не подогнаны под игры.
Несмотря на то, что профессиональные видеокарты могут показать неплохой результат в играх, с учетом их стоимости покупка будет актуальной только для узкоспециализированных задач.
Источник
Tesla — GPU
#1 OFFLINE lelikcr
ГРАФИЧЕСКИЕ УСКОРИТЕЛИ TESLA
ДЛЯ РАБОЧИХ СТАНЦИЙ
TESLA GPU ДЛЯ РАБОЧИХ СТАНЦИЙ
Ключевые возможности Tesla K40 Tesla K20 Пиковая производительность для вычислений двойной точности с плавающей точкой Tesla K40 — 1.43 Tflops Tesla K20 — 1.17 Tflops
Пиковая производительность для вычислений одинарной точности с плавающей точкой Tesla K40 — 4.29 Tflops Tesla K20 — 3.52 Tflops
Полоса пропускания памяти
(без ECC) Tesla K40 — 288 GB/s Tesla K20 — 208 GB/s Memory size (GDDR5) Tesla K40 — 12 GB Tesla K20 — 5 GB
Tesla K40 — 2880 Tesla K20 — 2496
Интересует цена сего девайса. И кто нибудь использовал сей девайс в майнинге.
Источник
Профессиональная видеокарта NVIDIA Tesla K40 в майнинге — шедевр или…?
В статье «Видеокарта Nvidia GeForce GT 770 с 2 GB памяти в майнинге» рассматривались особенности видеокарты GeForce GT770 с точки зрения майнинга. GT770-я, собранная на основе ядра GK104-425-A2 способна выдавать на алгоритме ethash в Linux около 20 mh/s. Пропускная способность VRAM у GeForce GT770 равна 224 GB/s, а производительность при операциях с плавающей запятой FP64 равна 138.9 GFLOPS.
Профессиональные видеокарты NVIDIA Tesla K40 и K80 также созданы на архитектуре Kepler, но со значительно большей производительностью. У видеоускорителя Tesla K40 (ядро GK110B) скорость обработки данных VRAM равна 288.4 GB/s (больше, чем у GT770 на 28%), а FP64-производительность равна 1.682 TFLOPS (в двенадцать (!) раз больше). Она имеет внушительный объем VRAM даже по современным меркам, равный 12 GB.
Технические данные NVIDIA Tesla K40 согласно GPU-Z:
Исходя из такой производительности, хешрейт на алгоритме Ethash у Tesla K40 должен равняться 36 mh/s, что прилично и в наши дни. При потреблении (TDP), равном 245 ваттам, эффективность майнинга Ethereum составляет 0.15 mh/s на 1 ватт. На практике эффективность майнинга у NVIDIA Tesla K40 гораздо ниже, так как полноценно задействовать вычислительные возможности этой карты в современных условиях не так легко.
В данной статье рассматриваются некоторые аппаратные особенности видеокарты NVIDIA Tesla K40, а также приводятся результаты тестирования видеоускорителя NVIDIA Tesla K40 в майнинге на некоторых актуальных алгоритмах.
Технические особенности видеокарты NVIDIA Tesla K40
Профессиональные графические ускорители NVIDIA Tesla K40 начали выпускаться еще в июле 2013 года. В них используется уже значительно устаревший GPU GK110B, созданный на основе архитектуры Kepler.
Во время своего появления GK110B был топовым видеочипом, который устанавливался на следующих видеокартах фирмы Nvidia:
- GeForce GTX 780 3/6 GB (чипы GK110-300-B1/GK110-301-B1) — урезанная версия с 2304 шейдерными процессорами и 192 TMU, работающая на частоте до 902 MHz;
- GeForce GTX 780Ti 3/6 GB (GK110-425-B1) — полноценная версия GPU с 240 TMU, частота GPU — до 928 MHz;
- GeForce GTX Titan Black/Titan Z на 6 GB — видеокарты с чипами GK110-430-B1/GK110-350-B1, работающими на частотах до 980/876 MHz;
- Nvidia Quadro K5200 на 8 GB — видеокарты с «обрезанными» чипами (2304 шейдера и 192 TMU), работающие на частоте до 771 MHz;
- Nvidia Quadro K6000 на 12 GB — видеокарты с чипами GK110-890-B1, работающие на частоте до 902 MHz;
- Nvidia Tesla K40D/K40M/K40S/K40st/K40T — профессиональные видеокарты без видеовыходов, с чипами, работающими на частоте до 876 MHz.
NVIDIA Tesla K40 работает со скоростью в 2.8xраз большей, чем видеоускоритель Tesla M2090 и на 40% быстрее, чем карты Tesla K20X предыдущего поколения.
Tesla K40 поддерживает технологии ECC, SMX Engine, Dynamic Parallelism, Hyper-Q, CUDA и GPU Boost. Из них наиболее важной для майнинга является аппаратно поддерживаемая версия CUDA — чем новее она, тем лучше.
Так как Tesla K40 создана по архитектуре Kepler, то она поддерживает только версию 3.5 технологии CUDA, а также OpenCL 1.2. Это значительно сужает диапазон применения этих мощных видеоускорителей в современных условиях и во многих случаях требует использования самостоятельно скомпилированных майнеров, либо программ, созданных несколько лет назад (с ограниченным набором алгоритмов). Схожий видеоускоритель Tesla K80 (24 GB VRAM, видеочип GK210) поддерживает технологию CUDA 3.7, что также недостаточно для реалий 2021 года.
Элементная база видеокарты Nvidia Tesla K40
Передняя сторона печатной платы Nvidia Tesla K40:
Задняя сторона печатной платы Nvidia Tesla K40 :
Вычислительную мощь Nvidia Tesla K40 обеспечивает чип GK110-897-B1:
Солидный объем видеопамяти 3D-ускорителя Nvidia Tesla K40, равный 12 GB памяти GDDR5-типа, набран 24 микросхемами Hynix H5GC4H24MFR-T2C (по 12 с каждой стороны платы):
Эти чипы могут работать на эффективной частоте 5-6 Gbps (тактовая частота 1200-1500 MHz) при напряжении 1.35-1.5V. Так как на печатной плате используется 24 модуля, включенных по интерфейсу в 16 бит, то ширина шины памяти у видеокарты Tesla K40 равна 16х24=384 бита.
VRAM bandwidth у Nvidia Tesla K40 равен:
ШИМ-контроллер NCP81208 производства On Semiconductor и ШИМ-контроллер APW7142 фирмы Anpec Electronics:
На лицевой стороне печатной платы видеокарты Nvidia Tesla K40 расположены фазы питания GPU, набранные DrMOS FDMF6823B производства Fairchild Semiconductor:
Модули FDMF6823B работают с 93% эффективностью на токах до 55 ампер и включают в одном корпусе драйвер, два силовых MOSFETа, ограничительный диод Шоттки
Типовая схема включения FDMF6823B:
Блок-схема DrMOS FDMF6823B:
Конфигурация пинов FDMF6823B:
Полевые транзисторы NTMFS4939N (Id=15.7 A, Uds=30 V) и двухфазный ШИМ-контроллер APW7088:
На плате используется несколько трехамперных линейных регуляторов напряжения GS7103 фирмы GStek:
Типовая схема включения и функциональная диаграмма преобразователя постоянного напряжения GS7103:
Микросхема флеш-BIOS 25Q20BT и место с нераспаянными деталями видеовыходов:
Сравнительные характеристики технических характеристик видеокарт Nvidia Tesla K40, GeForce GTX 1080Ti/1080, AMD Radeon R9 290:
Параметр | Nvidia Tesla K40 | Nvidia GeForce GTX 1080Ti | Nvidia GeForce GTX 1080 | AMD Radeon R9 390 |
Дата начала производства | 22 ноября 2013 | 10 марта 2017 | 27 мая 2016 | 18 июня 2015 |
Графический процессор | GK110B | GP102-350 | GP104-400 | Grenada PRO (215-0880030) |
Архитектура | Kepler | Pascal | Pascal | GCN 2.0 |
Технический процесс, нм | 28 | 16 | 16 | 28 |
Количество транзисторов, млрд | 7.08 | 11.8 | 7.2 | 6.2 |
Площадь кристалла, mm² | 561 | 471 | 314 | 438 |
Количество ядер (Cores) | 2880 | 3584 | 2560 | 2560 |
Количество блоков текстурирования/ растеризации (TMU/ROP) | 240/48 | 224/88 | 160/64 | 160/64 |
Частота работы GPU, МГц | 745-876 | 1481-1582 | 1607-1733 | 1000 |
Производительность при операциях с плавающей запятой FP64, GFLOPS | 1682 | 354.4 | 277.3 | 640 |
Объем видеопамяти, GB | 12 | 11 | 8 | 8 |
Тип видеопамяти | GDDR5 | GDDR5X | GDDR5X | GDDR5 |
Тактовая частота памяти, МГц | 1502 | 1376 | 1251 | 1500 |
Разрядность шины памяти, бит | 384 | 352 | 256 | 512 |
Эффективная частота работы памяти, Gbps | 6 | 11 | 10 | 6 |
Полоса пропускания памяти, GB/s | 288.4 | 484.4 | 320.3 | 384 |
Поддерживаемая версия CUDA/ OPENCL | 3.5/1.2 | 6.1/1.2 | 6.1/1.2 | -/2.0 |
Теоретический хешрейт на Ethash, mh/s (согласно производительности VRAM) | 36 | 60.5 | 40 | 48 |
Потребление (TDP), ватт | 245 | 250 | 180 | 275 |
Как запустить майнинг на видеокарте Nvidia Tesla K40?
При выборе видеокарты Nvidia Tesla K40 лучше ориентироваться на модели ревизии K40c, которая имеет встроенную активную систему охлаждения с вентилятором.
Модель видеокарты с буквой M (K40m) имеет пассивную систему охлаждения, которая в большинстве случаев требует доработки для майнинга/высокопроизводительных вычислений. Проблема (при наличии желания) успешно решается путем установки дополнительных радиаторов на чипы памяти и установки вместо штатного кожуха на лицевую сторону видеокарты вентиляторов.
Для практического использования видеокарт Nvidia Tesla K40 нужно задействовать материнские платы с включенной опцией large BAR или Above 4G Decoding и поддержкой PCI-E третьего поколения. В противном случае в Windows появляется ошибка 12, связанная с нехваткой ресурсов:
Увеличение виртуальной памяти даже до 24 GB, а также использование 6xGPU_mod в этом случае не помогают. На компьютерах под управлением Linux без поддержки large BAR/Above 4G Decoding при включении Nvidia Tesla K40 ситуация не лучше.
Для полноценного раскрытия Tesla K40/K80 нужно включать в слот PCIE, работающий в режиме x16 3.0.
В связи с тем, что видеокарта K40 имеет большой объем VRAM (12GB), для ее работы, кроме ресурсов в виде выделенных линий PCI-E, требуется обеспечить 16 GB выделенной памяти BAR (Base Address Registers). На практике удавалось запустить Теслу К40 и в конфигурации с 8 GB ОЗУ.
Потребление ресурсов видеокартой Tesla K40, отображаемое по команде lspci -vvv (видно, что резервируется 16G памятия для Region 1):
В покое в операционной системе xubuntu 18.04 видеокарта NVIDIA Tesla K40M потребляет 19 ватт (не считая потребления системы охлаждения, подключаемой отдельно):
Хешрейт видеокарты NVIDIA Tesla K40 при майнинге
В связи с почтенным возрастом видеоускорителя NVIDIA Tesla K40, ему присущи проблемы, связанные с отсутствием поддержки CUDA 3.5 в современных майнерах, работающих с CUDA не ниже пятой версии.
Вычислительные возможности видеокарт NVIDIA Tesla серии K ограничены compute capability третьего поколения:
Категорически отказываются работать с Tesla K40 и К80 программы с закрытым исходным кодом, например, nanominer, NBMiner, gminer, verthashminer, CryptoDredge, T-Rex и другие.
Например, nanominer при попытке запустить майнинг на видеокартах NVIDIA Tesla K выдает сообщение:
При настройке паарметров разгона Tesla K40 следует учитывать, что она поддерживает power limit от 180.00 до 235.00 W (параметр nvidia-smi -pl).
Несмотря на различные ухищрения, использование разных версий драйверов и программ, видеоускоритель Tesla K40 на практике показывает смехотворную производительность при майнинге, не соответствующую его теоретическим возможностям.
На алгоритме verthash в xubuntu 18.04 он выдает «целых» 181 kh/s, что хуже Radeon RX462:
PhoenixMiner при майнинге Ethereum (DAG больше 4 GB) на Tesla K40 выдает 1.8 mh/s, несмотря на то, что DAG генерируется с внушительной скоростью 275 MB/s (хешрейт должен равняться 34 mh/s):
PhoenixMiner и Claymore Miner при майнинге на алгоритме Ethash с малым DAG на Nvidia Tesla K40 обеспечивают хешрейт 7-11 mh/s в xubuntu 18.04:
В Windows хешрейт аналогичен:
Нас алгоритме zhash (equihash 144) в программе miniZ в Windows видеокарта Тесла К40 выдает единицы sol/s:
В программе xmrig-nvida, скомпилированной для старых видеокарт, удалось запустить майнинг на алгоритмах семейства Cryptonight как в Linux, так и в Windows. На алгоритме CN_GPU Тесла К40 выдает 440-450 h/s в Windows 8.1, 280-290 h/s в xubuntu, на CN_Haven — 230-240 h/s (Windows), 190-200 h/s (xununtu).
Майнинг на Nvidia Tesla K40 на алгоритме CN_GPU, xmrig-nvidia, Windows 8.1, драйвер 461.40, cuda-bfactor=10:
Майнинг на nvidia tesla k40 на алгоритме CN_GPU в программе xmrig-nvidia в xubuntu 18.04 (cuda-bfactor=10):
Майнинг на nvidia tesla k40 на алгоритме CN_Haven в программе xmrig 6.10.0 (cuda-bfactor=10, xubuntu 16.04, драйвер 430.64):
В программе MSI Afterburner управление параметрами разгона и даунвольтинга видеоускорителя TESLA K40 ограничено только памятью, ползунок частоты ядра активен, но его изменение не влияет на реальные показатели GPU:
Программа nvidiainspector вообще не видит GPU Tesla K40.
Возможно, проблемы с майнингом вызывает аппаратное ограничение TDP видеокарт Tesla K, так как потребление при майнинге слишком мало в сравнении с выставленным лимитом/штатным TDP. Это подтверждается одинаково заниженным потреблением в Linux и Windows.
TDP видеоускорителя Tesla K40 при майнинге в Windows аппаратно ограничивается 50% (майнинг в программе xmrig-nvidia на алгоритме CN_Haven):
Несмотря на заданный предел потребления, равный 180 ваттам, в xubuntu карта держит свое потребление на уровне 86-120 ватт даже в холодном состоянии (38 градусов по Цельсию):
Заключение
Профессиональные видеокарты Tesla, предназначенные для установки в OEM-серверах (C2075, K20, K40, K80), мало подходят для майнинга. Это связано с отсутствием в открытом доступе документации о способах раскрытия их вычислительного потенциала и объясняется стремлением производителей получать прибыль от продажи видеоускорителей новых поколений.
Для полного раскрытия потенциала видеоускорителей Tesla, вероятно, нужно обеспечивать включение опции Resizable BAR, что требует наличия поддержки на аппаратном и программном уровне.
Практическое использование этих видеокарт для майнинга в настоящее время требует проведения усиленных «танцев с бубнами» и, в большинстве случаев, не стоит затраченного на это времени (в сравнении с достигаемыми результатами).
Источник