Instinct MI100 — прорыв на рынке профессиональных видеоускорителей от AMD?
В конце 2020 года множество ожиданий тех, кто занимается высокопроизводительными вычислениями, было связано с выходом видеокарт AMD шеститысячной серии.
Модели 6000-й линейки имеют высокую производительность при проведении FP32-вычислений, но имеют слабую производительность при работе с большими массивами данных (например, на алгоритме Ethash) из-за небольшой пропускной способности памяти GDDR6. Видеопамять GDDR6X имеет во много раз большую эффективность, поэтому Nvidia со своими видеокартами трехтысячной серии выглядит безусловным лидером среди геймеров и майнеров. На рынке профессиональных видеокарт Nvidia является безоговорочным лидером после выпуска весной 2020 года модели A100 SXM4 с 40 Гб памяти типа HBM2e.
Компания AMD не собирается сдаваться и в конце 2020 года выпустила в свет профессиональную видеокарту Instinct™ MI100, имеющую на борту быстродействующую память типа HBM2 с шиной в 4096 бит (32 гигабайта). При цене примерно в два раза меньшей топового профессионального решения от nvidia это неплохая альтернатива для дата-центров.
Рассмотрим подробнее возможности видеокарты AMD Instinct MI100 в сравнении с другими топовыми GPU в контексте проведения высокопроизводительных вычислительных операций (соотношения выдаваемого хешрейта на Ethash к потребленной энергии и цене).
Сравнение характеристик видеокарт AMD Instinct MI100, Radeon RX 6900 XT и Nvidia A100 SXM4, RTX 3080, 3090
Видеокарты компании AMD Instinct MI100, Radeon RX 6900 XT и Nvidia A100 SXM4, GTX3080/3090 имеют следующие технические характеристики (приводятся только данные, интересные с точки зрения высокопроизводительных вычислений):
Параметр | Видеокарты | |||||
AMD | Nvidia | |||||
Radeon RX6900XT | Radeon RX6800XT | Instinct MI100 | A100 SXM4 | RTX 3090 | RTX 3080 | |
Анонс/ Дата выпуска | 28.10.2020/ 08.12.2020 | 28.10.2020/ 18.11.2020 | 16.11.2020 | 14.05.2020 | 01.09.2020/ 24.09.2020 | 01.09.2020/ 17.09.2020 |
Рекоменд. цена, USD | 999 | 649 | 5000-6400 (?) | 9895 | 1499 | 699 |
Техпроцесс, нм | 7 | 7 | 7 | 7 | 8 | 8 |
Графический чип | Navi21XTX | Navi21XT | MI100XL | GA100 | GA102-300-A1 | GA102-200-KD-A1 |
Архитектура | RDNA2 | RDNA2 | Arcturus CDNA 1.0 | Ampere | Ampere | Ampere |
Площадь кристалла, кв. мм | 536 | 536 | 750 | 826 | 628 | 628 |
Число транзисторов, млрд | 26,8 | 23 | 50 | 54.2 | 28.3 | 28.3 |
Кол-во ядер (шейдеров) GPU | 5120 | 4608 | 7680 | 6912 | 10496 | 8704 |
Кол-во ROP | 128 | 128 | 64 | 160 | 112 | 96 |
Базовая частота GPU, МГц | 1825 | 1825 | 1000 | 1410 | 1395 | 1440 |
Частота GPU в разгоне, МГц | 2250 | 2250 | 1502 | 1695 | 1710 | |
Вычислительн. мощность FP32, TFLOPS | 23.04 | 20.74 | 16.17 | 19.49 | 35.58 | 29.77 |
Тип памяти | GDDR6 | GDDR6 | HBM2 | HBM2e | GDDR6X | GDDR6X |
Объем памяти | 16 | 16 | 32 | 40 | 24 | 10 |
Частота памяти, Mhz | 2000 | 2000 | 1200 | 1215 | 1219 | 1188 |
Эффективная частота памяти, Мгц | 16000 | 16000 | 2400 | 2400 | 19500 | 19000 |
Разрядность шины памяти, бит | 256 | 256 | 4096 | 5120 | 384 | 320 |
Пропускная способность памяти, GB/sec | 512 | 512 | 1228.8 | 1555 | 936.2 | 760.3 |
Макс. мощность (TDP), ватт | 300 | 300 | 250 | 400 | 350 | 320 |
Хешрейт на Ethash, mh/s | 64 | 64 | 153.6 | 194.3 | 117.02 | 95 |
Энергетическая эффективность, mh/watt (чем больше, тем лучше) | 0.21 | 0.21 | 0.61 | 0.48 | 0.33 | 0.29 |
Цена за 1 mh/s, дол. США (чем меньше, тем лучше) | 15.6 | 10 | 32.5-41.6 | 50.92 | 12.8 | 7.35 |
Как видно из технических характеристик, AMD Instinct MI100 безоговорочно отстает по всем параметрам (кроме цены) от своего прямого конкурента — видеокарты Nvidia A100 SXM4.
В сравнении с обычными видеокартами Nvidia, карта MI100 отстает при проведении операций с плавающей запятой (в 2,2 раза слабее RTX 3090), но зато имеет большую пропускную способность подсистемы видеопамяти (на 31% больше, чем RTX 3090 и меньше на 26.5%, чем A100 SXM4). Такая производительность подсистемы видеопамяти в купе с низким энергопотреблением дает выигрыш при майнинге на Ethash почти в 2 раза больший в сравнении с 3090-й картой, и лучше на 21% по энергоэффективности, чем Nvidia A100 SXM4.
Выигрыш в экономичности связан с тем, что частота ядра Instinct MI100 специально занижена для уменьшения потребления, что делает эту карту очень экономичной и холодной. Ее энергопотребление на 40% меньше RTX 3090 и на 60% лучше A100 SXM4, хотя это не сопоставимо с отставанием красного GPU по мощности вычислений.
Цена видеокарты RTX 3090 в несколько раз ниже Instinct MI100, при значительном отставании последней при проведении операций с плавающей запятой и незначительном выигрыше красной карты на алгоритме Ethash/Dagger Hashimoto. Это делает топовые видеокарты Nvidia безоговорочными лидерами на современном рынке видеоакселераторов среди майнеров.
Нужно отметить, что сравнивать Radeon Instinct MI100 с обычными видеокартами не совсем корректно, так как они предназначены для разных задач. Radeon Instinct MI100 — -это AI-ML-акселератор, позиционирующийся компанией АМД, как Server Accelerator. Это бесполезная с точки зрения геймеров видеокарта, так как она не поддерживает технологий DirectX/OpenGL, нужных для большинства игр, а также не имеет видеовыходов. Выпуск Radeon Instinct MI100 является запоздалым на полгода ответом красных на профессиональную видеокарту Nvidia A100 SXM4.
Фактически, Radeon Instinct MI100 — это майнинговая карта, изделие, близкое по своим характеристикам к специализированным FPGA, но более гибкое и удобное с точки зрения программирования под разные вычислительные задачи. Она не входит в линейку карт Big Navi/Navi и по своим техническим характеристикам ближе к линейке видеокарт Vega, которые также имеют память HBM (в отличие от них, Instinct MI100 не имеет 3D-акселератора). Отсутствие на ядре Arcturus блоков, ответственных за 3D-графику позволило увеличить количество вычислительных ядер и снизить уровень энергопотребления, что очень важно для вычислительных центров.
В случае очередного взрывного роста рынка майнинга возможно появление младших моделей AMD серии Instinct с архитектурой Arcturus, которые станут востребованными во время очередного майнингового бума.
Дорогая и производительная память HBM2, установленная в Instinct MI100 позволяет эффективно использовать электроэнергию и площадь на вычислительном/майнинг центре при проведении вычислений на алгоритмах, подобных Ethash. Но, при ограничениях в бюджете, и возможных планах использования видеокарт не только в качестве счетных машинок, обычные топовые видеокарты Nvidia с памятью GDDR6X выглядят более привлекательными.
Заключение
Выход в свет видеокарты Instinct MI100 хорошо иллюстрирует закономерность, связанную с тем, что богатые со временем должны становятся еще богаче. Instinct MI100 — это монстр, доступный обеспеченным людям, которые при умелом использовании такого зверя станут еще богаче. Для майнеров использовать инстинкты при проведении высокопроизводительных вычислений — не самое удачное решение, поэтому на сегодняшний день выбор зеленых «Амперов» для этого занятия, наверное, предпочтительнее…
Источник
⛏ Доходность видеокарт в майнинге
Мы провели большое сравнение доходности видеокарт в майнинге и рассмотрели модели последних лет, которые не утратили актуальность. Разумеется, современная высокопроизводительная карта будет быстрее своих предшественников, но ее цена зачастую делает покупку нерациональной, поэтому не всегда разумно гнаться за новинками.
Таблица доходности видеокарт в майнинге
Для добытчиков криптовалюты важно, чтобы майнинг приносил прибыль. Эксперты редакции изучили все подходящие модели и создали топ наиболее востребованных видеокарт, приносящих реальный доход в майнинге. В список попали только карты, которые можно устанавливать в фермы.
Модель | Цена | ETH | EXP | UBQ | RVN | BEAM | Прибыль | Окупаемость |
---|---|---|---|---|---|---|---|---|
NVIDIA RTX 3090 | 303247.49 ₽ | 125.0 M H/S | 125.0 M H/S | 125.0 M H/S | 58.0 M H/S | 55.0 H/S | 17231.97 ₽ | 545 дней |
NVIDIA RTX 3080 Ti | 223878.83 ₽ | 67.0 M H/S | 67.0 M H/S | 67.0 M H/S | 55.0 M H/S | 0.0 H/S | 13987.20 ₽ | 496 дней |
NVIDIA RTX 3080 | 231172.23 ₽ | 100.0 M H/S | 100.0 M H/S | 100.0 M H/S | 42.0 M H/S | 0.0 H/S | 13785.70 ₽ | 519 дней |
AMD VII | 144365.74 ₽ | 95.0 M H/S | 95.0 M H/S | 95.0 M H/S | 30.0 M H/S | 33.2 H/S | 13096.26 ₽ | 341 дней |
AMD RX 6800 XT | 115550.37 ₽ | 65.0 M H/S | 65.0 M H/S | 65.0 M H/S | 0.0 M H/S | 0.0 H/S | 8960.55 ₽ | 399 дней |
AMD RX 6900 XT | 144437.96 ₽ | 65.0 M H/S | 65.0 M H/S | 65.0 M H/S | 0.0 M H/S | 0.0 H/S | 8960.55 ₽ | 499 дней |
NVIDIA RTX 2080 Ti | 102603.67 ₽ | 55.5 M H/S | 55.5 M H/S | 55.5 M H/S | 33.9 M H/S | 32.0 H/S | 8621.10 ₽ | 368 дней |
AMD RX 6800 | 108328.47 ₽ | 61.0 M H/S | 61.0 M H/S | 61.0 M H/S | 0.0 M H/S | 0.0 H/S | 8409.37 ₽ | 399 дней |
NVIDIA RTX 3070 | 141476.98 ₽ | 60.0 M H/S | 60.0 M H/S | 60.0 M H/S | 31.0 M H/S | 32.0 H/S | 8271.42 ₽ | 530 дней |
NVIDIA RTX 3060 Ti | 131438.54 ₽ | 60.0 M H/S | 60.0 M H/S | 60.0 M H/S | 0.0 M H/S | 0.0 H/S | 8271.42 ₽ | 492 дней |
AMD RX 5700 XT | 86727.77 ₽ | 56.5 M H/S | 56.5 M H/S | 56.5 M H/S | 21.0 M H/S | 20.5 H/S | 7789.06 ₽ | 345 дней |
AMD RX 5700 | 85283.39 ₽ | 56.0 M H/S | 56.0 M H/S | 56.0 M H/S | 20.0 M H/S | 19.0 H/S | 7719.93 ₽ | 342 дней |
NVIDIA RTX 2080 SUPER | 82979.61 ₽ | 44.3 M H/S | 44.3 M H/S | 44.3 M H/S | 30.2 M H/S | 30.0 H/S | 7680.25 ₽ | 334 дней |
NVIDIA RTX 2080 | 75796.71 ₽ | 44.3 M H/S | 44.3 M H/S | 44.3 M H/S | 26.5 M H/S | 26.5 H/S | 6739.09 ₽ | 348 дней |
NVIDIA GTX 1080 Ti | 63552.70 ₽ | 43.5 M H/S | 52.5 M H/S | 52.5 M H/S | 25.2 M H/S | 25.5 H/S | 6408.63 ₽ | 307 дней |
AMD RX 6700 XT | 97495.62 ₽ | 46.0 M H/S | 46.0 M H/S | 46.0 M H/S | 23.0 M H/S | 0.0 H/S | 6341.36 ₽ | 476 дней |
NVIDIA RTX 2070 SUPER | 68535.81 ₽ | 44.3 M H/S | 44.3 M H/S | 44.3 M H/S | 24.1 M H/S | 24.1 H/S | 6129.01 ₽ | 346 дней |
NVIDIA RTX 2070 | 67091.43 ₽ | 44.3 M H/S | 44.3 M H/S | 44.3 M H/S | 21.5 M H/S | 19.0 H/S | 6107.00 ₽ | 340 дней |
NVIDIA RTX 2060 SUPER | 64924.86 ₽ | 44.3 M H/S | 44.3 M H/S | 44.3 M H/S | 20.0 M H/S | 18.5 H/S | 6107.00 ₽ | 329 дней |
NVIDIA RTX 3060 | 81246.35 ₽ | 26.0 M H/S | 26.0 M H/S | 26.0 M H/S | 24.0 M H/S | 0.0 H/S | 6103.59 ₽ | 412 дней |
AMD RX Vega 64 | 56323.58 ₽ | 40.0 M H/S | 40.0 M H/S | 40.0 M H/S | 23.5 M H/S | 21.0 H/S | 5976.18 ₽ | 292 дней |
AMD RX 5600 XT | 62829.79 ₽ | 42.2 M H/S | 42.2 M H/S | 42.2 M H/S | 12.6 M H/S | 0.0 H/S | 5817.46 ₽ | 334 дней |
AMD RX Vega 56 | 53145.95 ₽ | 36.5 M H/S | 36.5 M H/S | 36.5 M H/S | 22.0 M H/S | 19.5 H/S | 5594.88 ₽ | 294 дней |
NVIDIA GTX 1080 | 49880.93 ₽ | 35.5 M H/S | 35.5 M H/S | 35.5 M H/S | 17.4 M H/S | 18.0 H/S | 4893.97 ₽ | 315 дней |
NVIDIA P104-100 | 37553.87 ₽ | 35.5 M H/S | 39.0 M H/S | 39.0 M H/S | 15.9 M H/S | 17.0 H/S | 4893.97 ₽ | 237 дней |
NVIDIA RTX 2060 | 59254.95 ₽ | 28.6 M H/S | 28.6 M H/S | 28.6 M H/S | 18.0 M H/S | 18.0 H/S | 4577.46 ₽ | 401 дней |
AMD RX 580 8GB | 31812.46 ₽ | 32.2 M H/S | 32.2 M H/S | 32.2 M H/S | 14.0 M H/S | 13.5 H/S | 4438.89 ₽ | 222 дней |
AMD RX 480 8GB | 30331.97 ₽ | 31.5 M H/S | 31.5 M H/S | 31.5 M H/S | 13.0 M H/S | 13.5 H/S | 4342.48 ₽ | 216 дней |
AMD RX 570 8GB | 28201.51 ₽ | 30.9 M H/S | 30.9 M H/S | 30.9 M H/S | 12.0 M H/S | 11.0 H/S | 4259.71 ₽ | 205 дней |
NVIDIA GTX 1660 SUPER | 49108.91 ₽ | 30.2 M H/S | 30.2 M H/S | 30.2 M H/S | 11.7 M H/S | 12.2 H/S | 4163.30 ₽ | 365 дней |
NVIDIA GTX 1070 Ti | 47007.33 ₽ | 30.0 M H/S | 31.5 M H/S | 31.5 M H/S | 15.2 M H/S | 17.0 H/S | 4135.71 ₽ | 352 дней |
AMD RX 470 8GB | 27443.21 ₽ | 29.7 M H/S | 29.7 M H/S | 29.7 M H/S | 11.0 M H/S | 10.0 H/S | 4094.48 ₽ | 207 дней |
NVIDIA GTX 1660 Ti | 49867.20 ₽ | 29.1 M H/S | 29.1 M H/S | 29.1 M H/S | 13.2 M H/S | 12.5 H/S | 4011.71 ₽ | 385 дней |
AMD R9 NANO | 14443.80 ₽ | 0.0 M H/S | 26.5 M H/S | 26.5 M H/S | 15.5 M H/S | 0.0 H/S | 3941.96 ₽ | 113 дней |
NVIDIA GTX 1070 | 39756.55 ₽ | 25.2 M H/S | 30.0 M H/S | 30.0 M H/S | 14.5 M H/S | 15.5 H/S | 3687.45 ₽ | 334 дней |
AMD RX 5500 XT 8GB | 46147.93 ₽ | 26.5 M H/S | 26.5 M H/S | 26.5 M H/S | 9.0 M H/S | 12.8 H/S | 3653.35 ₽ | 391 дней |
AMD RX 580 4GB | 11230.05 ₽ | 0.0 M H/S | 32.2 M H/S | 32.2 M H/S | 14.0 M H/S | 13.5 H/S | 3560.35 ₽ | 97 дней |
NVIDIA GTX 1660 | 38341.06 ₽ | 24.5 M H/S | 24.5 M H/S | 24.5 M H/S | 10.7 M H/S | 12.0 H/S | 3377.45 ₽ | 351 дней |
AMD RX 480 4GB | 10760.63 ₽ | 0.0 M H/S | 31.5 M H/S | 31.5 M H/S | 13.0 M H/S | 13.5 H/S | 3306.15 ₽ | 100 дней |
NVIDIA P106-100 | 21593.47 ₽ | 22.5 M H/S | 22.5 M H/S | 22.5 M H/S | 11.0 M H/S | 9.3 H/S | 3101.86 ₽ | 215 дней |
NVIDIA GTX 1060 6GB | 28852.20 ₽ | 22.5 M H/S | 22.5 M H/S | 22.5 M H/S | 11.0 M H/S | 9.3 H/S | 3101.86 ₽ | 288 дней |
AMD RX 570 4GB | 10760.63 ₽ | 0.0 M H/S | 30.9 M H/S | 30.9 M H/S | 12.0 M H/S | 11.0 H/S | 3051.64 ₽ | 109 дней |
AMD RX 470 4GB | 10038.44 ₽ | 0.0 M H/S | 29.7 M H/S | 29.7 M H/S | 11.0 M H/S | 10.0 H/S | 2797.44 ₽ | 111 дней |
NVIDIA GTX 1650 SUPER | 26063.83 ₽ | 0.0 M H/S | 18.9 M H/S | 18.9 M H/S | 9.7 M H/S | 7.1 H/S | 2466.67 ₽ | 327 дней |
AMD RX 5500 XT 4GB | 21593.47 ₽ | 0.0 M H/S | 26.5 M H/S | 26.5 M H/S | 9.0 M H/S | 12.8 H/S | 2288.73 ₽ | 292 дней |
NVIDIA P106-90 | 16538.15 ₽ | 13.4 M H/S | 20.5 M H/S | 22.5 M H/S | 5.9 M H/S | 5.6 H/S | 1847.29 ₽ | 277 дней |
NVIDIA GTX 1650 | 20943.50 ₽ | 0.0 M H/S | 14.7 M H/S | 14.7 M H/S | 7.0 M H/S | 6.0 H/S | 1780.02 ₽ | 364 дней |
NVIDIA GTX 1050 Ti | 9843.45 ₽ | 0.0 M H/S | 13.9 M H/S | 13.9 M H/S | 6.5 M H/S | 5.0 H/S | 1652.92 ₽ | 184 дней |
AMD RX 560 4GB | 10471.75 ₽ | 0.0 M H/S | 14.5 M H/S | 14.5 M H/S | 5.7 M H/S | 0.0 H/S | 1449.56 ₽ | 223 дней |
NVIDIA GTX 1060 3GB | 14371.58 ₽ | 0.0 M H/S | 22.5 M H/S | 22.5 M H/S | 0.0 M H/S | 0.0 H/S | 1258.29 ₽ | 354 дней |
AMD RX 550 4GB | 8666.28 ₽ | 0.0 M H/S | 14.5 M H/S | 14.5 M H/S | 3.5 M H/S | 0.0 H/S | 890.01 ₽ | 301 дней |
Нашли ошибку? Напишите в поддержку или на почту, исправим!
На момент написания статьи самые доходные видеокарты в майнинге лидирует RX 470, у них окупаемость меньше пол года. Но, после хардфорка Constayninopole за найденный блок Ethereum будут платить всего 2 монеты и владельцы GPU-ригов Nvidia, скорее всего, окажутся в более выгодном положении. Многое будет зависеть от ситуации на криптовалютном рынке.
Для фермы из шести видеокарт подойдут RX 470. Такая система обеспечит хороший доход при быстрой окупаемости от 4 до 6 месяцев. Также можно использовать связку из четырех видеокарт GeForce GTX 1070 или Radeon RX 570, но окупаемость будет на несколько месяцев больше.
Возможен домашний вариант фермы из восьми видеокарт. Как в предыдущем случае можно использовать RX 480, а можно ограничиться моделями RX 470. По окупаемости они примерно одинаковые – от 7 до 9 месяцев. Также можно собрать комплект из восьми карт GeForce GTX 1060. Система получится экономичной, но хешрейт будет невысоким, и само оборудование стоит дороже.
Источник