- Майнинг на профессиональных видеокартах
- Результативность
- Mining with a tesla M2090
- NVIDIA Tesla M2090: технические характеристики и тесты
- Описание
- Общая информация
- Характеристики
- Совместимость и размеры
- Оперативная память
- Видеовыходы
- Поддержка API
- Тесты в бенчмарках
- Octane Render OctaneBench
- Профессиональная видеокарта NVIDIA Tesla K40 в майнинге — шедевр или…?
- Технические особенности видеокарты NVIDIA Tesla K40
- Элементная база видеокарты Nvidia Tesla K40
- Как запустить майнинг на видеокарте Nvidia Tesla K40?
- Хешрейт видеокарты NVIDIA Tesla K40 при майнинге
- Заключение
Майнинг на профессиональных видеокартах
Очень часто задаю вопрос, а стоит ли майнить на профессиональных видеокартах? Выдадут ли Tesla или Quadro, Radeon PRO лучший результат, чем обычные потребительские видеокарты? Думаю, пора раскрыть этот вопрос. Если толком не понимаете, что такое майнинг, лучше ознакомьтесь с более подробной информацией о нем на сайте: https://spzp.ru/ Там раскрыты многие аспекты работы с криптовалютой.
Но, на правах человека, работающего с профессиональной техникой, постараюсь объяснить, почему профессиональные видеокарты — плохой вариант для майнинга. Исключение, если достались за бесплатно, но тогда выгодней продать и купить кучу обычных видеокарт.
UPD для тех, кто пишет «посмотри на цены обычных видеокарт»: эта статья написана в 2019 году, соответственно, тогда цены на видеокарты пользовательского сегмента были адекватными.
Результативность
Д а, на данный момент Tesla V100 – одна из самых производительных карт для майнинга. Почему? Все довольно просто. TDP – 250 вт, 14 терафлопс для операций одинарной точности и 7 для двойной, а если использовать NVlink, то и того больше . Эта видеокарта создана для вычислений. А майнинг, по сути, и есть высокопроизводительные вычисления.
Например, разнообразные тесты в майнинге Ethereum показывают результаты от 8 0 Mh/s при TDP 150Вт и до 92 при TDP от 250 до 300 вт. Выглядит серьезно. Получается, что Nvidia Tesla V100 самая энергоэффективная карта на текущий момент. Но есть аспекты, которые способны смутить — стоимость около 8000 $, плохая доступность в розничной продаже. Фактически, с экономической точки зрения, профессиональная вычислительная плата является нецелесообразной. Дорого, очень долгая окупаемость.
П осмотрите на таблицу, приведенную ниже.
Например, результаты GTX 1080ti, который в стоке дает 35 Mh/s, а в разгоне можно вытянуть до 50. При этом, на 8000 баксов можно прикупить около 8 видеокарт, при этом еще сдача останется. Конечно, энергоэффективность решения получится ниже. Но даже в стоке 8 видеокарт дадут около 260 мегахешей в секунду и это с учетом потерь. То бишь, при той же стоимости эффективность будет выше, срок окупаемости ниже, соответственно, расход электроэнергии окупится лучше, чем от одной Теслы.
А если посмотреть на 1070, которая в стоке дает 28,5 и стоит около 400 долларов? Еще интереснее, ведь получится 20 видеокарт, которые дадут около 480 хешей с учетом потерь. Энергопотребление выросло, но скорость окупаемости снизилась. Шикарно.
Quadro, Tesla , даже Titan имеют сейчас стоимость далеко за тысячу долларов. Только стоимость делает данные видеокарты неэффективными. Например Titan Xp имеет стоимость около 1500 $ и выдает около 50 мегахешей при майне эфира. Radeon Vega 64 выдает те же результаты, но стоит около 500 долларов. Выбор явно очевиден. Профессиональные видеокарты проиграли чисто экономически.
Как видите, использовать профессиональные видеокарты для майнинга попросту не выгодно. Они шустрее, энергоэффективнее, но заточены под другие задачи, имеют очень высокую стоимость, которая значительно повышает время окупаемости. Потому, в майнинге криптовалют продолжают упорно лидировать видеокарты потребительского сегмента, способные дать высокие результаты за счет количества и малой цены.
Насколько публикация полезна?
Нажмите на звезду, чтобы оценить!
Средняя оценка 4.1 / 5. Количество оценок: 18
Источник
Mining with a tesla M2090
Building my GPU rig. Still haven’t settled on a graphics card just yet. It seems the «standard» GPU of choice is an R9 280X, or similar. It is stated Radeon GPUs get better perfomance overall compared to NVidia based devices. However, in terms of a rough comparison, I did some googling to see how they compare
512 CUDA cores vs 2048 Stream processors (I realize they don’t directly compare)
1.3 GHZ vs 1 GHZ clock speed
6 GB GDDR5 vs 3 GB GDDR5 memory
177 gb/s vs 288 gb/s memory bandwith
1.85 ghz vs 6 ghz memory clock speed
225 Watts vs 250 watts power consumption
It’s really strange to compare the two. More memory, slower and less bandwidth, but a higher clock speed?
Scrolling down to the explanation of why AMD mines faster than Nvidia is because in the SHA256 algorithm, many shift instructions are used. Since ethash makes use of Kekkak, I decided to check what it mainly uses, which is XOR. There’s still two shift instructions, one of which might require many iterations to shift. AMD fires back though with a single rotate-wherever bit align instruction. Perhaps the extra .3 GHZ could make up for this?
I’m rather unsure of whether or not the M2090 is worth the hashes/$ for $145 on ebay, whereas I could spend about $20 more to get something that can output an average of 20 MH/s.
. Then again, I read someone’s benchmarks of their Quadro 4200, which has 448 CUDA cores @ 1.6 GHz, and 4 GB of GDDR5 memory @ 173 gb/s, and managed to pull around 19 MH/s. Both devices are, of course, using CUDA 2.0, and are Fermi-based architectures, so it’s logical to conclude that if the 4200 can use the mining software, so can the M2090
So. slightly slower GPU with more cores, twice the memory, a slightly faster memory, and less power consumption, *MIGHT* prove advantageous over an R9280X.
I could experiment to see just what it can do. Returns within 30 days for the tesla are accepted if it doesn’t work out
Источник
NVIDIA Tesla M2090: технические характеристики и тесты
Описание
NVIDIA начала продажи Tesla M2090 25 июля 2011. Это десктопная видеокарта на архитектуре Fermi 2.0 и техпроцессе 40 нм, в первую очередь рассчитанная на дизайнеров. На ней установлено 6 Гб памяти GDDR5 на частоте 3.7 ГГц, и вкупе с 384-битным интерфейсом это создает пропускную способность 177.4 Гб/с.
С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 2.0 x16. Длина референсной версии – 248 мм. Для подключения требуется один кабель 6-pin и один кабель 8-pin, а потребляемая мощность – 250 Вт.
У нас нет данных о результатах тестирования Tesla M2090.
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре Tesla M2090, а также о времени начала продаж и стоимости на тот момент.
Характеристики
Общие параметры Tesla M2090: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности Tesla M2090, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Совместимость и размеры
Параметры, отвечающие за совместимость Tesla M2090 с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Оперативная память
Параметры установленной на Tesla M2090 памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.
Видеовыходы
Перечисляются имеющиеся на Tesla M2090 видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Поддержка API
Перечислены поддерживаемые Tesla M2090 API, включая их версии.
Тесты в бенчмарках
Это результаты тестов Tesla M2090 на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.
Octane Render OctaneBench
Это специальный бенчмарк для измерения производительности видеокарты в OctaneRender, который является реалистичным движком GPU рендеринга, созданным компанией OTOY Inc., доступным либо как отдельная программа, либо как плагин для 3DS Max, Cinema 4D и многих других приложений. Он рендерит четыре различные статические сцены, а затем сравнивает время рендеринга с эталонной видеокартой, которой на данный момент является GeForce GTX 980. Этот бенчмарк не измеряет игровую производительность, и предназначен для профессиональных художников, работающих с 3D графикой.
Источник
Профессиональная видеокарта NVIDIA Tesla K40 в майнинге — шедевр или…?
В статье «Видеокарта Nvidia GeForce GT 770 с 2 GB памяти в майнинге» рассматривались особенности видеокарты GeForce GT770 с точки зрения майнинга. GT770-я, собранная на основе ядра GK104-425-A2 способна выдавать на алгоритме ethash в Linux около 20 mh/s. Пропускная способность VRAM у GeForce GT770 равна 224 GB/s, а производительность при операциях с плавающей запятой FP64 равна 138.9 GFLOPS.
Профессиональные видеокарты NVIDIA Tesla K40 и K80 также созданы на архитектуре Kepler, но со значительно большей производительностью. У видеоускорителя Tesla K40 (ядро GK110B) скорость обработки данных VRAM равна 288.4 GB/s (больше, чем у GT770 на 28%), а FP64-производительность равна 1.682 TFLOPS (в двенадцать (!) раз больше). Она имеет внушительный объем VRAM даже по современным меркам, равный 12 GB.
Технические данные NVIDIA Tesla K40 согласно GPU-Z:
Исходя из такой производительности, хешрейт на алгоритме Ethash у Tesla K40 должен равняться 36 mh/s, что прилично и в наши дни. При потреблении (TDP), равном 245 ваттам, эффективность майнинга Ethereum составляет 0.15 mh/s на 1 ватт. На практике эффективность майнинга у NVIDIA Tesla K40 гораздо ниже, так как полноценно задействовать вычислительные возможности этой карты в современных условиях не так легко.
В данной статье рассматриваются некоторые аппаратные особенности видеокарты NVIDIA Tesla K40, а также приводятся результаты тестирования видеоускорителя NVIDIA Tesla K40 в майнинге на некоторых актуальных алгоритмах.
Технические особенности видеокарты NVIDIA Tesla K40
Профессиональные графические ускорители NVIDIA Tesla K40 начали выпускаться еще в июле 2013 года. В них используется уже значительно устаревший GPU GK110B, созданный на основе архитектуры Kepler.
Во время своего появления GK110B был топовым видеочипом, который устанавливался на следующих видеокартах фирмы Nvidia:
- GeForce GTX 780 3/6 GB (чипы GK110-300-B1/GK110-301-B1) — урезанная версия с 2304 шейдерными процессорами и 192 TMU, работающая на частоте до 902 MHz;
- GeForce GTX 780Ti 3/6 GB (GK110-425-B1) — полноценная версия GPU с 240 TMU, частота GPU — до 928 MHz;
- GeForce GTX Titan Black/Titan Z на 6 GB — видеокарты с чипами GK110-430-B1/GK110-350-B1, работающими на частотах до 980/876 MHz;
- Nvidia Quadro K5200 на 8 GB — видеокарты с «обрезанными» чипами (2304 шейдера и 192 TMU), работающие на частоте до 771 MHz;
- Nvidia Quadro K6000 на 12 GB — видеокарты с чипами GK110-890-B1, работающие на частоте до 902 MHz;
- Nvidia Tesla K40D/K40M/K40S/K40st/K40T — профессиональные видеокарты без видеовыходов, с чипами, работающими на частоте до 876 MHz.
NVIDIA Tesla K40 работает со скоростью в 2.8xраз большей, чем видеоускоритель Tesla M2090 и на 40% быстрее, чем карты Tesla K20X предыдущего поколения.
Tesla K40 поддерживает технологии ECC, SMX Engine, Dynamic Parallelism, Hyper-Q, CUDA и GPU Boost. Из них наиболее важной для майнинга является аппаратно поддерживаемая версия CUDA — чем новее она, тем лучше.
Так как Tesla K40 создана по архитектуре Kepler, то она поддерживает только версию 3.5 технологии CUDA, а также OpenCL 1.2. Это значительно сужает диапазон применения этих мощных видеоускорителей в современных условиях и во многих случаях требует использования самостоятельно скомпилированных майнеров, либо программ, созданных несколько лет назад (с ограниченным набором алгоритмов). Схожий видеоускоритель Tesla K80 (24 GB VRAM, видеочип GK210) поддерживает технологию CUDA 3.7, что также недостаточно для реалий 2021 года.
Элементная база видеокарты Nvidia Tesla K40
Передняя сторона печатной платы Nvidia Tesla K40:
Задняя сторона печатной платы Nvidia Tesla K40 :
Вычислительную мощь Nvidia Tesla K40 обеспечивает чип GK110-897-B1:
Солидный объем видеопамяти 3D-ускорителя Nvidia Tesla K40, равный 12 GB памяти GDDR5-типа, набран 24 микросхемами Hynix H5GC4H24MFR-T2C (по 12 с каждой стороны платы):
Эти чипы могут работать на эффективной частоте 5-6 Gbps (тактовая частота 1200-1500 MHz) при напряжении 1.35-1.5V. Так как на печатной плате используется 24 модуля, включенных по интерфейсу в 16 бит, то ширина шины памяти у видеокарты Tesla K40 равна 16х24=384 бита.
VRAM bandwidth у Nvidia Tesla K40 равен:
ШИМ-контроллер NCP81208 производства On Semiconductor и ШИМ-контроллер APW7142 фирмы Anpec Electronics:
На лицевой стороне печатной платы видеокарты Nvidia Tesla K40 расположены фазы питания GPU, набранные DrMOS FDMF6823B производства Fairchild Semiconductor:
Модули FDMF6823B работают с 93% эффективностью на токах до 55 ампер и включают в одном корпусе драйвер, два силовых MOSFETа, ограничительный диод Шоттки
Типовая схема включения FDMF6823B:
Блок-схема DrMOS FDMF6823B:
Конфигурация пинов FDMF6823B:
Полевые транзисторы NTMFS4939N (Id=15.7 A, Uds=30 V) и двухфазный ШИМ-контроллер APW7088:
На плате используется несколько трехамперных линейных регуляторов напряжения GS7103 фирмы GStek:
Типовая схема включения и функциональная диаграмма преобразователя постоянного напряжения GS7103:
Микросхема флеш-BIOS 25Q20BT и место с нераспаянными деталями видеовыходов:
Сравнительные характеристики технических характеристик видеокарт Nvidia Tesla K40, GeForce GTX 1080Ti/1080, AMD Radeon R9 290:
Параметр | Nvidia Tesla K40 | Nvidia GeForce GTX 1080Ti | Nvidia GeForce GTX 1080 | AMD Radeon R9 390 |
Дата начала производства | 22 ноября 2013 | 10 марта 2017 | 27 мая 2016 | 18 июня 2015 |
Графический процессор | GK110B | GP102-350 | GP104-400 | Grenada PRO (215-0880030) |
Архитектура | Kepler | Pascal | Pascal | GCN 2.0 |
Технический процесс, нм | 28 | 16 | 16 | 28 |
Количество транзисторов, млрд | 7.08 | 11.8 | 7.2 | 6.2 |
Площадь кристалла, mm² | 561 | 471 | 314 | 438 |
Количество ядер (Cores) | 2880 | 3584 | 2560 | 2560 |
Количество блоков текстурирования/ растеризации (TMU/ROP) | 240/48 | 224/88 | 160/64 | 160/64 |
Частота работы GPU, МГц | 745-876 | 1481-1582 | 1607-1733 | 1000 |
Производительность при операциях с плавающей запятой FP64, GFLOPS | 1682 | 354.4 | 277.3 | 640 |
Объем видеопамяти, GB | 12 | 11 | 8 | 8 |
Тип видеопамяти | GDDR5 | GDDR5X | GDDR5X | GDDR5 |
Тактовая частота памяти, МГц | 1502 | 1376 | 1251 | 1500 |
Разрядность шины памяти, бит | 384 | 352 | 256 | 512 |
Эффективная частота работы памяти, Gbps | 6 | 11 | 10 | 6 |
Полоса пропускания памяти, GB/s | 288.4 | 484.4 | 320.3 | 384 |
Поддерживаемая версия CUDA/ OPENCL | 3.5/1.2 | 6.1/1.2 | 6.1/1.2 | -/2.0 |
Теоретический хешрейт на Ethash, mh/s (согласно производительности VRAM) | 36 | 60.5 | 40 | 48 |
Потребление (TDP), ватт | 245 | 250 | 180 | 275 |
Как запустить майнинг на видеокарте Nvidia Tesla K40?
При выборе видеокарты Nvidia Tesla K40 лучше ориентироваться на модели ревизии K40c, которая имеет встроенную активную систему охлаждения с вентилятором.
Модель видеокарты с буквой M (K40m) имеет пассивную систему охлаждения, которая в большинстве случаев требует доработки для майнинга/высокопроизводительных вычислений. Проблема (при наличии желания) успешно решается путем установки дополнительных радиаторов на чипы памяти и установки вместо штатного кожуха на лицевую сторону видеокарты вентиляторов.
Для практического использования видеокарт Nvidia Tesla K40 нужно задействовать материнские платы с включенной опцией large BAR или Above 4G Decoding и поддержкой PCI-E третьего поколения. В противном случае в Windows появляется ошибка 12, связанная с нехваткой ресурсов:
Увеличение виртуальной памяти даже до 24 GB, а также использование 6xGPU_mod в этом случае не помогают. На компьютерах под управлением Linux без поддержки large BAR/Above 4G Decoding при включении Nvidia Tesla K40 ситуация не лучше.
Для полноценного раскрытия Tesla K40/K80 нужно включать в слот PCIE, работающий в режиме x16 3.0.
В связи с тем, что видеокарта K40 имеет большой объем VRAM (12GB), для ее работы, кроме ресурсов в виде выделенных линий PCI-E, требуется обеспечить 16 GB выделенной памяти BAR (Base Address Registers). На практике удавалось запустить Теслу К40 и в конфигурации с 8 GB ОЗУ.
Потребление ресурсов видеокартой Tesla K40, отображаемое по команде lspci -vvv (видно, что резервируется 16G памятия для Region 1):
В покое в операционной системе xubuntu 18.04 видеокарта NVIDIA Tesla K40M потребляет 19 ватт (не считая потребления системы охлаждения, подключаемой отдельно):
Хешрейт видеокарты NVIDIA Tesla K40 при майнинге
В связи с почтенным возрастом видеоускорителя NVIDIA Tesla K40, ему присущи проблемы, связанные с отсутствием поддержки CUDA 3.5 в современных майнерах, работающих с CUDA не ниже пятой версии.
Вычислительные возможности видеокарт NVIDIA Tesla серии K ограничены compute capability третьего поколения:
Категорически отказываются работать с Tesla K40 и К80 программы с закрытым исходным кодом, например, nanominer, NBMiner, gminer, verthashminer, CryptoDredge, T-Rex и другие.
Например, nanominer при попытке запустить майнинг на видеокартах NVIDIA Tesla K выдает сообщение:
При настройке паарметров разгона Tesla K40 следует учитывать, что она поддерживает power limit от 180.00 до 235.00 W (параметр nvidia-smi -pl).
Несмотря на различные ухищрения, использование разных версий драйверов и программ, видеоускоритель Tesla K40 на практике показывает смехотворную производительность при майнинге, не соответствующую его теоретическим возможностям.
На алгоритме verthash в xubuntu 18.04 он выдает «целых» 181 kh/s, что хуже Radeon RX462:
PhoenixMiner при майнинге Ethereum (DAG больше 4 GB) на Tesla K40 выдает 1.8 mh/s, несмотря на то, что DAG генерируется с внушительной скоростью 275 MB/s (хешрейт должен равняться 34 mh/s):
PhoenixMiner и Claymore Miner при майнинге на алгоритме Ethash с малым DAG на Nvidia Tesla K40 обеспечивают хешрейт 7-11 mh/s в xubuntu 18.04:
В Windows хешрейт аналогичен:
Нас алгоритме zhash (equihash 144) в программе miniZ в Windows видеокарта Тесла К40 выдает единицы sol/s:
В программе xmrig-nvida, скомпилированной для старых видеокарт, удалось запустить майнинг на алгоритмах семейства Cryptonight как в Linux, так и в Windows. На алгоритме CN_GPU Тесла К40 выдает 440-450 h/s в Windows 8.1, 280-290 h/s в xubuntu, на CN_Haven — 230-240 h/s (Windows), 190-200 h/s (xununtu).
Майнинг на Nvidia Tesla K40 на алгоритме CN_GPU, xmrig-nvidia, Windows 8.1, драйвер 461.40, cuda-bfactor=10:
Майнинг на nvidia tesla k40 на алгоритме CN_GPU в программе xmrig-nvidia в xubuntu 18.04 (cuda-bfactor=10):
Майнинг на nvidia tesla k40 на алгоритме CN_Haven в программе xmrig 6.10.0 (cuda-bfactor=10, xubuntu 16.04, драйвер 430.64):
В программе MSI Afterburner управление параметрами разгона и даунвольтинга видеоускорителя TESLA K40 ограничено только памятью, ползунок частоты ядра активен, но его изменение не влияет на реальные показатели GPU:
Программа nvidiainspector вообще не видит GPU Tesla K40.
Возможно, проблемы с майнингом вызывает аппаратное ограничение TDP видеокарт Tesla K, так как потребление при майнинге слишком мало в сравнении с выставленным лимитом/штатным TDP. Это подтверждается одинаково заниженным потреблением в Linux и Windows.
TDP видеоускорителя Tesla K40 при майнинге в Windows аппаратно ограничивается 50% (майнинг в программе xmrig-nvidia на алгоритме CN_Haven):
Несмотря на заданный предел потребления, равный 180 ваттам, в xubuntu карта держит свое потребление на уровне 86-120 ватт даже в холодном состоянии (38 градусов по Цельсию):
Заключение
Профессиональные видеокарты Tesla, предназначенные для установки в OEM-серверах (C2075, K20, K40, K80), мало подходят для майнинга. Это связано с отсутствием в открытом доступе документации о способах раскрытия их вычислительного потенциала и объясняется стремлением производителей получать прибыль от продажи видеоускорителей новых поколений.
Для полного раскрытия потенциала видеоускорителей Tesla, вероятно, нужно обеспечивать включение опции Resizable BAR, что требует наличия поддержки на аппаратном и программном уровне.
Практическое использование этих видеокарт для майнинга в настоящее время требует проведения усиленных «танцев с бубнами» и, в большинстве случаев, не стоит затраченного на это времени (в сравнении с достигаемыми результатами).
Источник