- Устранение ошибок при майнинге, связанных с неверной установкой или конфигурированием видеокарт
- Аппаратные ошибки, приводящие к неверной работе или отсутствии видеокарт в диспетчере задач
- Программные ошибки, связанные с видеокартами, приводящие к сбоям майнеров
- Ошибки, вызванные неправильной установкой драйверов
- Ошибки в конфигурации майнера при указании видеокарт
- Другие ошибки, приводящие к сбоям в работе майнеров
- Заключение
- Что и как часто ломается в майнинге [видеокарты и комплектующие]? Сколько можно потерять
- Сломанные кулера
- Пример сломанных кулеров
- Отвал чипа
- Пример отвала чипа
- Райзера убийцы
- Пример райзера убийы
- Прогар райзеров
- Блоки питания
- Пример сломанных блоков питания
- Оптимальные температуры в майнинге
- Дополнительное охлаждение
- Редкие типы поломок
Устранение ошибок при майнинге, связанных с неверной установкой или конфигурированием видеокарт
При настройке и эксплуатации оборудования для майнинга часто возникают различные ошибки.
В данной статье рассматриваются характерные ошибки, возникающие при майнинге при неверной сборке майнинг ферм или в связи с программными ошибками.
Аппаратные ошибки, приводящие к неверной работе или отсутствии видеокарт в диспетчере задач
На аппаратном уровне к ошибкам в определении видеокарт или к постоянному их вылету при работе приводят некоторые часто встречающиеся проблемы. К ним относятся:
- слабые блоки питания, которые не могут обеспечить достаточной мощности для видеокарт при майнинге. Нужно понимать, что различные блоки питания имеют граничные показатели эффективности и могут выдавать в круглосуточном режиме только ограниченную мощность. Для качественных БП это до 80% от их заявленной мощности, а для дешевых – от 50 до 70% от паспортных данных по линии 12 вольт;
- некачественные райзера. При использовании райзеров с плохими контактами (как по линии питания, так и по линии данных), с конденсаторами малой емкости, некачественными кабелями USB, видеокарты могут не определяться совсем, либо определяться системой, но вылетать при работе майнера. Для устранения проблем, связанных с райзерами, нужно выбирать только качественные райзера, желательно с 6-пиновым разъемом питания (в крайнем случае Molex), использовать по возможности самые короткие, толстые, экранированные USB-кабеля данных;
- иногда пользователи забывают подключить все разъемы питания к видеокарте и к райзеру. В этом случае видеокарта может и определяться, но будет отображаться в диспетчере устройств с ошибками;
- при подключении нескольких блоков питания к майнинг ферме нужно стараться подключать и видеокарту и ее райзер к одному блоку питания. Ни в коем случае нельзя подключать к материнской плате питание от разных блоков питания. Это гарантированно приведет к появлению перетоков и выгоранию электронных элементов платы.
Во всех случаях, связанных с поиском неисправностей в работе электро и радиоаппаратуры и вычислительной техники нужно помнить, что:
ОСНОВНЫМИ ПРИЧИНАМИ НЕИСПРАВНОСТЕЙ В ЛЮБЫХ ЭЛЕКТРИЧЕСКИХ УСТРОЙСТВАХ ЯВЛЯЮТСЯ НАЛИЧИЕ ЛИШНИХ ИЛИ ОТСУТСТВИЕ НУЖНЫХ КОНТАКТОВ.
Программные ошибки, связанные с видеокартами, приводящие к сбоям майнеров
При неверной настройке операционной системы, сбое в установке драйверов, неправильной конфигурации майнеров, избыточном разгоне возникают ошибки, в результате которых происходит сбой при запуске программы-майнера.
Ошибки, вызванные неправильной установкой драйверов
Как правило, в майнинг фермах с несколькими видеокартами возникают следующие ошибки, связанные с неправильной установкой драйверов:
- Ошибка с кодом 43 (error 43) – при установке драйверов АМД на видеокарты с перепрошитым BIOS. Эта ошибка легко лечится с помощью патчера AMD/ATI Pixel Clock Patcher. В операционной системе Windows 7 при установке более четырех видеокарт такая ошибка может возникнуть и с непрошитыми картами. Для ее устранения нужно применять 6xGPU_mod, последнюю версию которого можно скачать на Bitcointalk.
Ошибка с кодом 43, как правило, возникает при установке новых драйверов в системе, что может сделать и сама система во время автоматической установки обновлений. Кроме того, драйвера могут слететь при сбоях в питании, появлении ошибок на носителе системы, воздействии вирусов и других проблемах.
После такого обновления может появиться ошибка 43, а также значительно упасть хешрейт видеокарт. Для видеокарт AMD после установки драйверов нужно применить AMD-Compute-Switcher, а для видеокарт Нвидиа включить P0 state согласно методике, описанной в статье «Оптимизация потребления видеокарт Nvidia при майнинге».
Если после применения патчера и мода (для Windows 7) и перезагрузки системы ошибка не исчезает, то возможно на видеокарте прошит неверный BIOS, произошел сбой при его записи, либо вышла из строя микросхема BIOS на видеокарте. Для устранения такой ошибки нужно:
- прошить верный BIOS (вернуть заводской);
- повторить заново процесс прошивки и дождаться сообщения программы AtiFlash об успехе;
- переключиться на резервный Bios (при наличии такового).
При невозможности восстановить рабочее состояние видеокарты прошивкой верного Биоса или переключением переключателя BIOS на резерв нужно менять чип BIOS в сервис-центре, либо искать другую причину неполадок.
- Ошибка с кодом 12, которая обозначает нехватку ресурсов в системе. Для ее устранения нужно проверить настройки BIOS материнской платы, где нужно:
- отключить все лишнее (например, serial и parallel port);
- включить above 4g декодирование;
- попробовать переключить систему в режим multi GPU;
- включить/выключить внутреннюю видеокарту (на разных системах этот способ действует по разному);
- установить режим работы PCI-E устройств в Gen 1 или 2;
- попробовать обновить BIOS материнской платы на самый последний.
Ошибки в конфигурации майнера при указании видеокарт
Этот вид ошибок возникает в случае отсутствия или неправильного указания в пакетном файле для запуска майнинга видеокарт, которые должны осуществлять майнинг (как АМД, так и Nvidia).
Например, в программе claymore dual miner и других программах от этого программиста, иногда возникает ошибка NO AMD OPENCL found. Она появляется при запуске программы для майнинга и обозначает, что не найдено устройств, поддерживающих технологию OPENCL. В разных программах она может иметь различное написание, но ее суть сводится к невозможности найти подходящее для майнинга устройство. При отсутствии аппаратных ошибок и проблем, связанных с неверной установкой драйверов, неисправность нужно искать в конфигурации майнера.
Эта ошибка может возникать и в других программах, использующихся для майнинга. Например, в программе sgminer подобная ошибка называется clDevicesNum returned error, no GPUs usable. При запуске майнера появляется подобное сообщение:
[02:56:02] Started sgminer v0.1.1
[02:56:02] * using Jansson 2.11
[02:56:09] Specified platform that does not exist
[02:56:09] clDevicesNum returned error, no GPUs usable
[02:56:09] Command line options set a device that doesn’t exist
Еще раз повторимся, что если в диспетчере устройств нужные видеокарты отображены корректно и не имеют восклицательных знаков с кодами ошибки, то неправильно сконфигурирован BAT-файл. Это случается в системах с различными типами карт, установленными в системе (например, интегрированная видеокарта плюс видеокарты AMD или одновременное использование GPU от AMD и Nvidia и все три типа устройств вместе). Как правило, для устранения этой ошибки нужно либо правильно указать номера использующихся в майнере видеокарт, либо указать какую платформу (AMD или Nvidia) нужно использовать.
В Claymore-майнере это команда -platform с цифровым значением: 1 – использовать только видеокарты AMD, 2 — только NVIDIA, 3 – использовать и AMD и NVIDIA GPU (по умолчанию в майнере действует команда 3, согласно которой используются оба типа карт).
В Phoenix miner это команды -amd или –nvidia соответственно.
В sgminer (его различных версиях и подобных программах, например, cgminer) в смешанных системах может понадобиться указывать в командной строке параметр —gpu-platform 1 или 2.
Обычно, при отсутствии включенной внутренней видеокарты этот майнер работает без указания этого парметра, но в этом случае иногда может потребоваться использование команды —gpu-platform 0.
Другие ошибки, приводящие к сбоям в работе майнеров
Рассмотрим другие ошибки, которые иногда возникают при работе программ для майнинга:
ошибка OpenCL error -4 (0) — cannot create DAG on GPU – эта ошибка в Claymore майнере возникает при майнинге криптовалют на алгоритме Ethash (Ethereum, UBIQ, ETC, MOAC и другие). Для ее устранения нужно увеличить объем доступной виртуальной памяти в системе, а также использовать самые новые версии майнеров, способные работать с последними эпохами DAG;
ошибка WATCHDOG: GPU hangs in OpenCL call появляется при переразгоне видеокарт, некачественных райзерах, плохих (очень длинных) соединительных USB-кабелях. Не нужно выжимать из видеокарт все соки, увеличивая частоту памяти и видеоядра, так как простои, вызванные переразгоном, сведут на нет весь доход от такого майнинга. Понять то, где выставлены очень большие значения частоты поможет программа hwinfo, которая показывает ошибки по памяти для видеокарт AMD:
Как правило, при переразгоне по памяти вылетает одна из видеокарт, а при чрезмерном разгоне по ядру (или очень сильном даунвольтинге) компьютер полностью зависает;
- майнер с GPU от AMD выключается с ошибкой о температуре карты в 511 градусов (на картах Nvidia появляется ошибка NVML: cannot get current temperature, error 15) – эта проблема возникает при плохом контакте видеокарты с райзером, при котором не проходит сигнал о температуре видеокарты либо есть проблемы по линии питания. Нужно поменять райзер и/или USB-кабель, почистить их контакты, а также контакты разъема видеокарты ваткой, смоченной в спирте. Можно попробовать поменять разъем PCI-E на материнке или вставить карту непосредственно в разъем материнской платы. Кроме того, видеокарта может выдавать такую ошибку при слишком большом разгоне/даунволтинге, а также плохом контакте (или слишком большой нагрузке на блок питания) по линии 12 вольт. В этом случае нужно проверить все разъемы питания, подходящие к карте на предмет наличия прогаров, особенно в случае применения различных переходников/разветвителей, а также снизить нагрузку на БП.
Заключение
Майнинг требует наличия определенных знаний, связанных с эксплуатацией вычислительной техники и сетей связи. Это необходимо, потому что знание основ функционирования радиоаппаратуры и каналов связи дает возможность самостоятельно разобраться в причинах появления неполадок и понять, как их можно устранить наиболее рациональным способом.
Знание основ электротехнических цепей поможет избежать ошибок, связанных с навешиванием чрезмерной нагрузки на одну линию (например, более одной видеокарты на линию Molex), что часто приводит к подгоранию контактов или выходу из строя райзеров и видеокарт.
Понимание закона Ома поможет избежать проблем, связанных с использованием переходников с разъема питания SATA на райзера, которое гарантированно приведет к прогоранию контактов и связанным с этим проблемам.
Чем больше человек знает, тем больше он понимает, что знает очень мало или не знает ничего… Процесс поиска истины благотворно воздействует на человеческую карму и дает жизненный опыт, для обретения которого, возможно, мы и живем…
Источник
Что и как часто ломается в майнинге [видеокарты и комплектующие]? Сколько можно потерять
Дата обновления: 29.03.2021 в 18:04
В данной статье (видео) мы поговорим какие поломки часто встречаются в майнинг фермах.
Какие поломки были у нас, у наших коллег и вообще с чем придутся столкнуться начинающему майнеру!
Сразу скажем, что мы будем говорить только о механических поломках.
Сломанные кулера
Начнем с первой и довольно частой поломкой, с которой сталкивается к сожалению каждый 2 майнер — это сломанные кулера.
К сожалению они довольно часто (если смотреть в масштабах всех видов поломок видеокарт) выходят из строя при работе майнинг фермы 24/7.
Почему так происходит? Ну тут причин довольно много.
- Первая и самая распространенная причина – это дешевизна, то есть слабое качество самих кулеров, которые устанавливает вендор (производитель).
- Вторая причина, когда владелец выставляет обороты на 100% и держит их так 24/7.
Естественно не все видеокарты выдерживают такой нагрузки и в течении полутора – двух лет выходят из строя.
Кстати в одной партии карт одного производителя, какие-то карты могут прожить с такой нагрузкой и больше 3х лет, а какие-то выходят из строя очень быстро.
Следующая причина – это высыхание масла. Ее сразу не заметить, но если видеокарты остановить (ну бк примеру, для продувки) и карты часа 2 будут не активны, то за это время кулер просто наглухо затвердеет и не сможет больше крутиться, ну или будет еле-еле работать.
Почти во всех картах кулера одноразовые и заменить масло не получится.
Можно конечно просверлить самостоятельно дырку и аккуратно все смазать, но если Вы в этом не разбираетесь, то просто закажите новые кулера с Aliexpress и замените самостоятельно, либо отдайте карту в мастерскую.
Пример сломанных кулеров
Лично у нас были поломки кулеров. Причем на довольно хороших картах – Asus Strix.
Мы просто заказали новые кулера с Aliexpress и заменили их. После чего карта идеально работала.
Главное проверяйте размеры кулера вашей карты, так как можно заказать кулер другого размера, который не подойдет в Вашу карту, или будет заметно меньше! У одного производителя, одной линейки (к примеру Asus Strix) могут быть разные диаметры кулеров!
Отвал чипа
Следующий тип поломок – это отвал чипа. Это самая ужасная поломка, после которой очень часто карта идет на помойку.
Для начала объясним, что подразумевается под словом «отвал» чипа. Самое простое объяснение – это нарушается целостность пайки кристалла GPU к подложке либо к поверхности платы.
Происходит это по трём основным причинам:
- Высокая температура карты во время работы
- Механические повреждения (удары по карте)
- Заводской брак.
От слишком высокой температуры (свыше 80 градусов Цельсия) плавятся свинцовые шарики, обеспечивающие контакт, или разрушается клей-компаунд, которым кристалл крепится к подложке.
Посмотрите видео с нашего YouTube канала про оптимальные температуры в майниге. В этом видео мы подробно разобрали, какая температура приемлема, а какой лучше избегать, а также развели многие мифы про температурные режимы!
Не исключён также и случай заводского брака – подобное встречается даже у самых популярных производителей вроде ASUS или Gigabyte, и более часты у брендов B-категории вроде Inno3D.
Пример отвала чипа
У наших коллег с одной их картой произошел отвал чипа (об этом мы не однократно говорили в наших ранних видео). Они несколько раз прогревали карту и это помогало, она служила верой и правдой пару недель и потом все по новой. Спустя где-то полгода карта полностью умерла.
Почему они не сдали ее по гарантии спросите вы?
Они купили ее Б/У, и гарантий на нее у них не было. Поэтому покупка Б/У карт – это кот в мешке, но при тщательном изучении можно действительно купить надежные и недорогие карты!
Как Вы могли понять, если у Вас нет гарантии (а иногда, с нашими недобросовестными магазинами и с гарантией) такая поломка может привести к потере больших денег!
Райзера убийцы
Следующий вид поломки – это не совсем поломка как таковая, но она может привести к убийству карты – это райзера убийцы.
Что такое райзер убийца? И почему после обычного райзера умирает карта, почему он выжигает чип?
Все очень просто, на каждом райзере существует дополнительный стабилизатор, который служит для того, чтобы создать напряжение 3,3 вольт.
Когда Вы вставляете карту в рабочий райзер (нормальный), мы получаем стандартное напряжение. То есть райзер прекрасно справляется со своей задачей.
А вот когда мы вставляем карту в райзер убийцу, стабилизатор, который должен выдавать 3,3 Вольта, начинает выдавать 5 Вольт, потом резко 30, потом опять 3 и так далее.
То есть этот стабилизатор просто сжигает чип, после которой восстановление карты уже невозможно.
Поэтому всегда, каждый райзер проверяйте дешевой картой, заглушкой, которую не жалко, подойдет любая карта, хоть за 20$, которая даст небольшую нагрузку.
Пример райзера убийы
Мы так проверяем каждый райзер и 1 раз, еще в далеком 2017 году нам попался райзер убийца, который унес за собой карту заглушку (на который мы проверяли райзера).
Поэтому всегда проверяйте райзера, картами, которые не жалко.
Прогар райзеров
Следующий тип поломки — это обычные райзера (не убийцы), которые просто сгорели.
Обычно с такой поломкой ферма продолжает работать, но тянуть не стоит, лучше сразу же отключить эту карту и заменить райзер
Блоки питания
Тут также очень много причин, почему они ломаются. Одна из причин – это пыль.
Блок питания может сгореть из-за обилия пыли. Пылью забьются лопасти вентилятора на блоке питания, он будет плохо работать и соответственно плохо охлаждать все элементы.
Также блок питания может выйти из строя из-за перепадов напряжения. В общем причин очень много.
Посмотрите видео с нашего канала как выбрать блок питания, на что нужно обращать внимание и так далее.
Пример сломанных блоков питания
За всю нашу историю майнинга, с 2016 года сломался только 1 блок. Он полностью сгорел, но спасибо ему, карты за собой не потянул. Вырубил всю ферму и тихо умер.
Поэтому проверяйте температуру блока питания, он не должен быть горячим, если его температура высокая и до него не дотронуться, то что-то не то, скорее всего случилась какая-то поломка.
Отключите ферму, продуйте блок питания и осмотрите его.
Оптимальные температуры в майнинге
Также проверяйте температуры всех комплектующих: жестких дисков, видеокарты, CPU, Блока питания и та далее, через специальные программы:
Такие как MSI Afterburner, CPU-Z, AIDA, GPUz и так далее. Следите что бы вся ферма работала на оптимальной температуре.
- Для процессора – это температура до 50 градусов (если Вы ней майните на нем)
- Для видеокарты – желательно держать температуру до 70 градусов, чем ниже тем лучше.
- Для HDD — 35-45
- Для блока питания – это около 45 градусов
Дополнительное охлаждение
Следующий тип поломки – это сломанное дополнительное охлаждение:
- Вентиляторы
- Кулера и так далее
Мы с 2016 года заменили 2 напольных вентилятора. Поэтому учитывайте что из-за такой, хоть и не значительной поломки тоже можно встрять на деньги!
Редкие типы поломок
Итак, мы перечислили самые основные поломки, далее вкратце расскажем, что еще у Вас может выйти из строя из-за чего можно встрять на дополнительные расходы.
Первое – это жесткие диски, которые начинают сыпаться и еле работают.
Лично у нас стоят SSD с 2016 года. И ни один SSD у нас пока еще не сломался.
Далее может сломаться материнская плата, что также очень редко встречается.
В общем в этом деле Вы должны всегда быть на чеку и не заходить в майнинг на последние деньги, так как этот тип деятельности может привести к дополнительным тратам.
Вам может показаться что все это незначительные суммы…Ну че там, долларов 15-20 за кулер, долларов 5 за райзер, делов-то.
Но нет, это не так, каждая такая поломка увеличивает срок окупаемости Вашей фермы. Ведь теперь, при замене кулера, Ваша ферма условно стоит не 10000$ а 10020$ и с каждой поломкой цена будет расти!
Поэтому будьте осторожны и следите за своими фермами!
Источник