Как понизить температуру видеопамяти при майнинге

Про перегрев памяти в RTX 3080 и домашний майнинг — мой личный опыт

Немного истории

Недавно я сделал самодельный корпус так как собирался поменять видеокарту, но как оказалось — купить видеокарту не так то и просто.

реклама

Отчаявшись заполучить 3080 за рекомендованные семь сотен на официальном сайте в день релиза я дождался карт у локальных дилеров. Они появились, но цена была той же дикой, над которой мы смеялись видя объявления перекупов на ebay — $1400.
Ну ладно, думаю — подожду радеон, еще лучше обещают! Процессоры AMD то были доступны в день релиза в магазине под домом. Но с радеонами вышла та же ерунда, что и с картами nVidia. Купить по рекомендованной цене — шансов не было.

Убедил себя, что играть все равно не во что, купил с рук старенький 1080ti Strix и успокоился на несколько дней. Но вы понимаете — 3080 то все равно хочется!

Перечитав кучу статей вижу, что карты достаются только майнерам, так что выход найден: самому.

Стать майнером

Попробовал «копать» на тех картах, что уже есть, а это 1080ti, 1080 и 1070. Карты стоят в трех отдельных компьютерах, как что об энергоэффективности речи не шло. Оказалось, что 3 карты вместе приносят около $7-8 в день, а их суммарная производительность равна одной 3080.
Удивительно, но этой зимой выгодно майнить даже на некоторых процессорах! 5600х дает $0.5 в день. Использовал nicehash.

Ну, думаю, дело пошло! Куплю карту за $1400 а разницу между MSRP — отмайню за несколько месяцев. В крайнем случае, карта никуда не денется.
По $1400 довольно свободно можно было набрать ASUS TUF или даже AORUS, но мне вот вперлось найти STRIX. Пока я ждал еще неделю своего Стрикса карты стремительно пропадали и дорожали. В итоге, я купил тот самый TUF (самый последний официальный 3080 в большом городе) за совершенно безумные $1750 :facepalm:
И что вы думаете? Прошел месяц — пока ни капельки не жалею!

  • Карты все еще дорожают и с офф гарантией цена доходит до $2k.
  • Я ликвидировал криптовалютную безграмотность, завел эфирный и биткоин кошельки и даже сделал пару покупок за крипту.
  • Чтобы включить все 4 карты пришлось купить по объявлению райзер, пообщался с прожжеными майнерами — молодые ребята, живут неплохо. Интересно.
  • Сейчас все 4 карты дают около 200MH (мегахешей), если не играть. Профит около $12-15 в день. Жрет все вместе ровно 1 киловатт. Можно параллельно играть. Скажем, при игре в CSGO, RTX 3080 дает около половины обычного (96) хешрейта.. 50-60. Там где стоит 2 карты — можно на одной играть, а на второй майнить.
  • какой-никакой, а опыт инвестиций. На nicehash можно обменивать криптовалюты, пробовать играть на курсах валют, рискуя только намайненым.
  • За неполный месяц насобиралось

$300 по текущим курсам. Перевожу на BTC и Ether кошельки, но в реальные деньги выводить пока не пробовал. Считаю, что моя 3080 уже стала немного дешевле.

Но вернемся к теме.

Перегрев памяти

реклама

Я так радовался, что мой TUF такой холодный и тихий. При майнинге температура была около 54 градусов, но тут поперли чертовы статьи про перегрев памяти, а в них и ссылка на тул, которым мерять — hwinfo.

Померял. Там где стоит этот риг (теперь называю компы ригами) у меня прохладно, но память и правда горячая — 100-102 градуса в режиме майнинга хотя в играх около 80. Такие дела.

Конечно, это внутренняя температура в чипе, и говорят, что на 110 градусах начнется троттлинг и прям вот быстро не сгорит, но трехзначная температура — это нехорошо.

Поиграл с настройками, направил вентилятор на бекплейт (что мало помогло).

реклама

И пришел вот к каким выводам:

  1. Проблема в том, что обороты вентиляторов зависят от температуры чипа, который загружен всего на 50% при майнинге. А вот подсистема памяти работает на 100%+, только температура чипов памяти никого не волнует и память перегревается. Думаю, что производители могут исправить эту проблему прошивкой, добавив температуру памяти к критериям для выбора скорости вентилятора. Установив вентилятор на 75% руками я опустил температуру памяти на 7-8 градусов до 94 градусов.
  2. Проблема затрагивает только майнеров, так как в играх нагрузка GPU и памяти сбалансирована и вентиляторы справляются. Майнеры же задирают частоту памяти до предела, а с ней и тепловыделение.
    На 3080 я ставил память +900 мегагерц. Сбавил до +800 на всякий случай, потеряв около 1 процента профита.
  3. Проблема существует и в старых поколениях карт 10 и 20 серии, но пока непонятно, как мониторить температуру памяти.
  4. Не все так хорошо с картами «после майнинга». Не такой он и щадящий, этот майнинг. Несмотря на низкие температуры GPU, память может быть прожаренная.

Итого

Вот что у меня получилось после установки вентилятора на 73% и снижении разгона памяти до +800 мегагерц.

Частота и напряжение на GPU заданы через кривую в MSI afterburner на 1400Mhz и 0.743v, так что потребление не выходит за 70% (

220W). Температура памяти остановилась на 96 градусах, что намного лучше 100+ при вентиляторах в режиме авто.

Карты после майнинга

реклама

Старый вопрос опять станет актуальным, когда пройдет и этот бум. Покупать 3080 после майнинга или нет?

Мои старые карты десятой серии тоже «после майнинга» от завязавших майнеров 2017, но я брал с остаточной гарантией и на пломбах.

Стоит ли брать карты без пломб с «замененной термопастой«?

Я бы не брал, чтобы ни рассказывал продавец. На чипах памяти стоят термопрокладки, которые тоже надо менять, а они не дешевые и купить их немного сложнее, чем пасту. Боюсь, что на память вернут старые пожеванные прокладки и будет память греться еще сильнее, а «майнер» будет радоваться, что температура карты упала — просто тепло от памяти на радиатор не доходит!

Хорошие термопрокладки стоят $10-$15 и это только одна толщина. Часто на карту надо 3 разных вида. Я заказал прокладки и буду менять в конце недели на 1070 — сделаю отчет.

Однозначно, не стоит гнать память на картах после майнинга. Для игр прирост небольшой, а риски возрастают.

Майнить можно и на одной карте. Делать это можно не ради выгоды, а для получения минимальных знаний о криптовалютах.

Следите за температурами и не перегревайтесь!

Источник

О деградации памяти видеокарт при майнинге

Многие майнеры, занимающиеся добыванием криптовалют с помощью ригов на видеокартах, со временем неизбежно сталкиваются с тем, что память уже не может работать на тех частотах, которые она раньше с легкостью брала.

Из-за этого подвисают программы-майнеры, работа ригов становиться нестабильной. Для устранения проблем приходиться занижать частоту памяти/уменьшать ее разгон, что уменьшает хешрейт и прибыль.

Рассмотрим подробнее, отчего со временем портятся полупроводниковые кристаллы в памяти видеокарт и как можно увеличить продолжительность и качество ее работы.

Почему портится память видеокарт при майнинге?

Эксплуатация полупроводниковых элементов в вычислительных устройствах (особенно при повышенной температуре) со временем приводит к сбоям и поломкам, причину которых подчас трудно найти.

Основными причинами неисправностей в работе чипов памяти являются:

  • перегрев и электромиграция (они взаимосвязаны) – сильно влияет на качество и долговременность работы чипов памяти и (не так сильно) процессоров;
  • электромагнитное излучение (в обычных условиях эффект минимален);
  • влияние электростатики (ESD, electrostatic discharge) – может проявляться при неквалифицированном обслуживании видеокарты;
  • разрушающее физическое воздействие, вибрация и прочее.

Наибольшее влияние на чипы памяти при майнинге оказывают перегрев и диффузный эффект электромиграции.

Иллюстрация возникновения эффекта электромиграции в полупроводниках:

Эффект электромиграции также влияет на процессор/ядро видеокарт, но в этих случаях электромиграция проявляется намного меньше, так как частота CPU и ядра GPU в разы меньше эффективной частоты работы памяти.

Этот эффект связан с переносом вещества в металле/полупроводнике при прохождении тока высокой плотности. Вследствие этого в чипах постепенно происходит диффузионное перемещение ионов, которое ускоряется при высоких плотностях тока и температурах. Если на полупроводниковый элемент одновременно прикладывается высокий ток и возникает его перегрев, то эффект проявляется в сотни и тысячи раз сильнее, что может привести к мгновенному выходу чипа из строя.

Согласно расчетам производителей, при работе в штатных условиях чипы памяти должны отработать около 100 тысяч часов.

При повышенном вольтаже и высокой температуре (такой считается диапазон от 75 до 125°C) на чипах значительно увеличивается влияние эффекта электромиграции и кардинально ускоряется их деградация.

Каждое повышение температуры с шагом в 10 градусов уменьшает срок службы полупроводниковых элементов в два раза.

Похожая деградация происходит и с электролитическими конденсаторами, особенно с теми, в которых используется полужидкий электролит (подробнее об этом можно прочитать в статье «Об износе электролитических конденсаторов блоков питания во время майнинга»).

Электромиграция отдельных микрочастиц внутри полупроводниковых кристаллов особенно сильно проявляется во время переходных процессов, связанных с включением/выключением питания, при которых происходят скачки напряжения. При этом возникают случайные микропробои/замыкания внутри кристаллов чипов, постепенно уменьшается количество работоспособных элементов и нарушается их нормальный порядок работы.

Эффект электромиграции действует постоянно, но особенно сильно проявляется при большом нагреве чипов в условиях воздействия сильного электрического поля. При этом в полупроводниках происходит интенсивный нежелательный перенос (дрейф) веществ вместе с ионами. Он проявляется тем сильнее, чем меньший техпроцесс использовался при производстве полупроводников.

Это явление имеет накопительный эффект, так как на возникающие в результате электромиграции маленькие островки со временем осаждается все больше микрочастиц. Поначалу эти микроучастки слабо влияют на работу чипов, хотя их рабочие характеристики (возможность разгона) постепенно падают из-за возникновения паразитных емкостей и нежелательных соединений. Постепенно они увеличиваются, возникают большие бугорки (очаги) с повышенной плотностью тока и нагревом, которые постепенно приводят к частичному или полному разрушению полупроводникового элемента.

Возникновение бугорков(Hillock) и пустот (Void) в полупроводниковом элементе в результате электромиграции:

Появление пустот приводит к пропаданию полезных контактов, а возникновение бугорков – к появлению нежелательных контактов и коротких замыканий.

Особенно сильно эффект электромиграции проявляется у алюминия, который широко применяется при изготовлении микросхем. Для борьбы с этим эффектом в радиодеталях используют добавки меди (добавление 2-4% меди уменьшает эффект электромиграции в 50 раз). Если в качестве проводника используется чистая медь, то допустимая плотность тока возрастает в разы, что также увеличивает надежность элементов. Поэтому в вопросах долговечности и надежности работы памяти немаловажную роль играет качество изготовления. Если в проводящих элементах больше меди, то они могут выдержать большую плотность тока и меньше нагреваются, что увеличивает их долговечность.

Вследствие деградации полупроводников постепенно увеличиваются задержки сигнала и падает их быстродействие. Чипы еще могут работать, но для этого нужно снижать частоту и корректировать рабочее напряжение в сторону уменьшения. Из-за этого эффекта видеокарты даже с качественной памятью GDDR5 фирмы Самсунг, которая держала разгон до 2100 МГц, через 1-2 года майнинга устойчиво держат частоты порядка 1900 МГц, а память Elpida, итак с трудом работавшая на частотах до 1950 МГц, скатывается до уровня 1800 МГц.

У памяти GDDR6, изготовленной по более компактной технологии, чем GDDR5, эффект деградации проявляется быстрее. По опыту автора, чипы производства фирмы Micron, державшие разгон в +800 МГц через 6-8 месяцев эксплуатации при температурах порядка 59 градусов уже не могут держать стабильный разгон более +500 МГц. Естественно, это привело к падению хешрейта при майнинге на алгоритме Ethash с 31,5 до 29,5 mh/s.

Явление деградации полупроводниковых элементов проявляется тем сильнее, чем более миниатюризированный технологический процесс используется при их изготовлении. Процессоры и память, изготовленные 15-20 лет назад по 45-90 нм процессу с успехом работают и поныне. При этом они сохраняют работоспособность даже при кратковременном перегреве до высокой температуры.

Проблема электромиграции стала сильно проявляться уже при 28-нм процессе. Современные чипы, изготовленные по 7-10 нм технологии, не могут проработать долгий промежуток времени в неблагоприятных условиях из-за очень близкого расположения активных элементов. Они обречены на быстрое старение, если им не обеспечить хорошие условия эксплуатации, особенно охлаждение.

Деградация чипов (в особенности памяти) является очень нежелательным явлением. Такие чипы уже невозможно восстановить, можно только немного улучшить условия их работы, прочистив систему охлаждения и заменив термопрокладки. Эксплуатировать их все равно уже придется при более низких частотах.

Что можно сделать для снижения деградации памяти при майнинге?

Усиленная нагрузка на полупроводниковые элементы памяти и (видео)процессоры при майнинге (высокоинтенсивных вычислениях) неизбежно приводит к их повышенному нагреву, что ускоряет старение чипов.

Для новых видеокарт можно существенно увеличить срок производительной работы полупроводниковых элементов памяти с помощью эксплуатации при более низких температурах и (по возможности) меньшем вольтаже.

Этого невозможно сделать при использовании некачественной системы охлаждения видеокарт и недостаточном вентилировании мест установки ригов.

Для продления срока службы чипов желательно периодически проверять систему охлаждения GPU на предмет правильной установки термопрокладок и обеспечение отвода тепла от зоны с микросхемами памяти. Этому может помочь и установка теплопроводящего бекплейта.

Кроме того, необходимо максимально снижать напряжение на ядре видеокарт для уменьшения их общей температуры. Нужно помнить, что каждый лишний градус на чипах памяти уменьшает срок их плодотворной (скоростной) жизни.

Заключение

Чем новее технология, которая применяется при производстве полупроводниковых элементов, тем меньше расстояния между кристаллами в них. Из-за этого увеличивается влияние температурного фактора, который неизбежно приводит чипы к износу/выходу из строя чипов памяти.

Эксплуатация видеокарт с загрязненной системой охлаждения при высоких температурах, использование некачественных термопрокладок, плохая вентиляция – все эти факторы приводят к ускоренной деградации полупроводниковых приборов и быстрому проявлению эффекта электромиграции. В связи с этим со временем чипы памяти не могут работать с разгоном, начинают сбоить даже на штатных частотах.

Чтобы как можно дольше использовать чипы памяти на высоких частотах, нужно обеспечивать для них благоприятный температурный режим – порядка 40-50 градусов.

Так как при майнинге относительно низкая температура видеокарты возможна только при использовании очень хорошего охлаждения, то деградация чипов видеопамяти практически гарантирована уже после нескольких месяцев майнинга.

Из-за этого не стоит покупать видеокарты с одним/двумя кулерами, особенно б/у, которые долгое время использовались при высоких температурах. По крайней мере, не стоит рассчитывать на их работоспособность при разгоне по памяти.

Источник

Читайте также:  Рейтинг офбу по доходности
Оцените статью