Деградация чипа видеокарты что это

О деградации памяти видеокарт при майнинге

Многие майнеры, занимающиеся добыванием криптовалют с помощью ригов на видеокартах, со временем неизбежно сталкиваются с тем, что память уже не может работать на тех частотах, которые она раньше с легкостью брала.

Из-за этого подвисают программы-майнеры, работа ригов становиться нестабильной. Для устранения проблем приходиться занижать частоту памяти/уменьшать ее разгон, что уменьшает хешрейт и прибыль.

Рассмотрим подробнее, отчего со временем портятся полупроводниковые кристаллы в памяти видеокарт и как можно увеличить продолжительность и качество ее работы.

Почему портится память видеокарт при майнинге?

Эксплуатация полупроводниковых элементов в вычислительных устройствах (особенно при повышенной температуре) со временем приводит к сбоям и поломкам, причину которых подчас трудно найти.

Основными причинами неисправностей в работе чипов памяти являются:

  • перегрев и электромиграция (они взаимосвязаны) – сильно влияет на качество и долговременность работы чипов памяти и (не так сильно) процессоров;
  • электромагнитное излучение (в обычных условиях эффект минимален);
  • влияние электростатики (ESD, electrostatic discharge) – может проявляться при неквалифицированном обслуживании видеокарты;
  • разрушающее физическое воздействие, вибрация и прочее.

Наибольшее влияние на чипы памяти при майнинге оказывают перегрев и диффузный эффект электромиграции.

Иллюстрация возникновения эффекта электромиграции в полупроводниках:

Эффект электромиграции также влияет на процессор/ядро видеокарт, но в этих случаях электромиграция проявляется намного меньше, так как частота CPU и ядра GPU в разы меньше эффективной частоты работы памяти.

Этот эффект связан с переносом вещества в металле/полупроводнике при прохождении тока высокой плотности. Вследствие этого в чипах постепенно происходит диффузионное перемещение ионов, которое ускоряется при высоких плотностях тока и температурах. Если на полупроводниковый элемент одновременно прикладывается высокий ток и возникает его перегрев, то эффект проявляется в сотни и тысячи раз сильнее, что может привести к мгновенному выходу чипа из строя.

Согласно расчетам производителей, при работе в штатных условиях чипы памяти должны отработать около 100 тысяч часов.

При повышенном вольтаже и высокой температуре (такой считается диапазон от 75 до 125°C) на чипах значительно увеличивается влияние эффекта электромиграции и кардинально ускоряется их деградация.

Каждое повышение температуры с шагом в 10 градусов уменьшает срок службы полупроводниковых элементов в два раза.

Похожая деградация происходит и с электролитическими конденсаторами, особенно с теми, в которых используется полужидкий электролит (подробнее об этом можно прочитать в статье «Об износе электролитических конденсаторов блоков питания во время майнинга»).

Электромиграция отдельных микрочастиц внутри полупроводниковых кристаллов особенно сильно проявляется во время переходных процессов, связанных с включением/выключением питания, при которых происходят скачки напряжения. При этом возникают случайные микропробои/замыкания внутри кристаллов чипов, постепенно уменьшается количество работоспособных элементов и нарушается их нормальный порядок работы.

Эффект электромиграции действует постоянно, но особенно сильно проявляется при большом нагреве чипов в условиях воздействия сильного электрического поля. При этом в полупроводниках происходит интенсивный нежелательный перенос (дрейф) веществ вместе с ионами. Он проявляется тем сильнее, чем меньший техпроцесс использовался при производстве полупроводников.

Это явление имеет накопительный эффект, так как на возникающие в результате электромиграции маленькие островки со временем осаждается все больше микрочастиц. Поначалу эти микроучастки слабо влияют на работу чипов, хотя их рабочие характеристики (возможность разгона) постепенно падают из-за возникновения паразитных емкостей и нежелательных соединений. Постепенно они увеличиваются, возникают большие бугорки (очаги) с повышенной плотностью тока и нагревом, которые постепенно приводят к частичному или полному разрушению полупроводникового элемента.

Возникновение бугорков(Hillock) и пустот (Void) в полупроводниковом элементе в результате электромиграции:

Появление пустот приводит к пропаданию полезных контактов, а возникновение бугорков – к появлению нежелательных контактов и коротких замыканий.

Особенно сильно эффект электромиграции проявляется у алюминия, который широко применяется при изготовлении микросхем. Для борьбы с этим эффектом в радиодеталях используют добавки меди (добавление 2-4% меди уменьшает эффект электромиграции в 50 раз). Если в качестве проводника используется чистая медь, то допустимая плотность тока возрастает в разы, что также увеличивает надежность элементов. Поэтому в вопросах долговечности и надежности работы памяти немаловажную роль играет качество изготовления. Если в проводящих элементах больше меди, то они могут выдержать большую плотность тока и меньше нагреваются, что увеличивает их долговечность.

Вследствие деградации полупроводников постепенно увеличиваются задержки сигнала и падает их быстродействие. Чипы еще могут работать, но для этого нужно снижать частоту и корректировать рабочее напряжение в сторону уменьшения. Из-за этого эффекта видеокарты даже с качественной памятью GDDR5 фирмы Самсунг, которая держала разгон до 2100 МГц, через 1-2 года майнинга устойчиво держат частоты порядка 1900 МГц, а память Elpida, итак с трудом работавшая на частотах до 1950 МГц, скатывается до уровня 1800 МГц.

READ  Как задействовать две видеокарты amd

У памяти GDDR6, изготовленной по более компактной технологии, чем GDDR5, эффект деградации проявляется быстрее. По опыту автора, чипы производства фирмы Micron, державшие разгон в +800 МГц через 6-8 месяцев эксплуатации при температурах порядка 59 градусов уже не могут держать стабильный разгон более +500 МГц. Естественно, это привело к падению хешрейта при майнинге на алгоритме Ethash с 31,5 до 29,5 mh/s.

Явление деградации полупроводниковых элементов проявляется тем сильнее, чем более миниатюризированный технологический процесс используется при их изготовлении. Процессоры и память, изготовленные 15-20 лет назад по 45-90 нм процессу с успехом работают и поныне. При этом они сохраняют работоспособность даже при кратковременном перегреве до высокой температуры.

Проблема электромиграции стала сильно проявляться уже при 28-нм процессе. Современные чипы, изготовленные по 7-10 нм технологии, не могут проработать долгий промежуток времени в неблагоприятных условиях из-за очень близкого расположения активных элементов. Они обречены на быстрое старение, если им не обеспечить хорошие условия эксплуатации, особенно охлаждение.

Деградация чипов (в особенности памяти) является очень нежелательным явлением. Такие чипы уже невозможно восстановить, можно только немного улучшить условия их работы, прочистив систему охлаждения и заменив термопрокладки. Эксплуатировать их все равно уже придется при более низких частотах.

Что можно сделать для снижения деградации памяти при майнинге?

Усиленная нагрузка на полупроводниковые элементы памяти и (видео)процессоры при майнинге (высокоинтенсивных вычислениях) неизбежно приводит к их повышенному нагреву, что ускоряет старение чипов.

Для новых видеокарт можно существенно увеличить срок производительной работы полупроводниковых элементов памяти с помощью эксплуатации при более низких температурах и (по возможности) меньшем вольтаже.

Этого невозможно сделать при использовании некачественной системы охлаждения видеокарт и недостаточном вентилировании мест установки ригов.

Для продления срока службы чипов желательно периодически проверять систему охлаждения GPU на предмет правильной установки термопрокладок и обеспечение отвода тепла от зоны с микросхемами памяти. Этому может помочь и установка теплопроводящего бекплейта.

Кроме того, необходимо максимально снижать напряжение на ядре видеокарт для уменьшения их общей температуры. Нужно помнить, что каждый лишний градус на чипах памяти уменьшает срок их плодотворной (скоростной) жизни.

Заключение

Чем новее технология, которая применяется при производстве полупроводниковых элементов, тем меньше расстояния между кристаллами в них. Из-за этого увеличивается влияние температурного фактора, который неизбежно приводит чипы к износу/выходу из строя чипов памяти.

Эксплуатация видеокарт с загрязненной системой охлаждения при высоких температурах, использование некачественных термопрокладок, плохая вентиляция – все эти факторы приводят к ускоренной деградации полупроводниковых приборов и быстрому проявлению эффекта электромиграции. В связи с этим со временем чипы памяти не могут работать с разгоном, начинают сбоить даже на штатных частотах.

Чтобы как можно дольше использовать чипы памяти на высоких частотах, нужно обеспечивать для них благоприятный температурный режим – порядка 40-50 градусов.

Так как при майнинге относительно низкая температура видеокарты возможна только при использовании очень хорошего охлаждения, то деградация чипов видеопамяти практически гарантирована уже после нескольких месяцев майнинга.

Из-за этого не стоит покупать видеокарты с одним/двумя кулерами, особенно б/у, которые долгое время использовались при высоких температурах. По крайней мере, не стоит рассчитывать на их работоспособность при разгоне по памяти.

READ  Видеокарта для ноутбука паккард белл

Источник

Деградация чипа видеокарты что это

Совсем недавно представители Ютуб-канала Testing Games выпустили любопытное видео, в котором рассказали о деградации графического чипа после майнинга. Якобы в среднем шахтёрская версия GeForce RTX 2080 Ti от 10 до 20% медленнее аналогичной версии, которая использовалась исключительно в геймерских ценах. Столь смелое утверждение не могло остаться незамеченным.

реклама

Сегодня эксперты Tomshardware обсудили данную тему, пояснив несоответствия в методике. Согласно легенде, ребята из Testing Games получили в руки майнерскую видеокарту после полутора лет неустанного труда на неизвестной ферме. Далее они где-то раздобыли ещё одну такую же, а после запустили в играх обе модели. Результат доступен на видео, но мы вам уже рассказали, что деградация графического чипа составила до 20%, что отразилось на снижении производительности.

По мнению Tomshardware, проблема в том, что Testing Games просто проигнорировали стандартную процедуру замены термопасты и банальную очистку от пыли. На видео видно, что майнерская карта имеет температуру на 16 градусов больше, а значит виновницей обнаруженной деградации стала неверная методика и полное отсутствие предварительной подготовки.

Всем читателям эксперты советуют всегда проводить простые процедуры замены термопасты на купленных с рук видеокартах. Если вы не имеете нужных навыков, хотя бы очистите пыль, или попросите помощи специалистов. Ну а в данном случае никакой деградации нет, а значит при правильном обслуживании видеокарта ещё долго может служить вам верой и правдой.

Источник

Степень прожарки: видеокарты с вторичного рынка, что брать, что нет

На почве падения доходности майнинга и выхода, мягко говоря, не совсем удачных видеокарт младшей линейки в сериях Radeon 6xxx и RTX 30 ожила тема покупки видеокарт на вторичном рынке (читай — барахолках Авито и Olx). К достоинствам новой видеокарты конечно относится в первую очередь нулевой «пробег», во вторую — новые технологии, пусть и не в полной мере доступные на младших линейках. Но и уже прилично поработавшие карты при дальнейшем снижении цен могут оказаться привлекательными, особенно старшие карты линеек 80/80ti Nvidia. Но если все проблемы с новой картой решает гарантия (на самом деле не все и не всегда, но это тема отдельного разговора), то при покупке видеокарты на вторичном рынке есть куча подводных камней, а степень «честности» многих продавцов и вовсе превращает ее в лотерею. Но не все билеты в ней одинаковы, и далее мы рассмотрим — какие и почему.

реклама

На первом месте в списке «не трогать» с припиской «даже длинной палкой» — Radeon RX Vega 64/56.

Почему? Во-первых, потому что эти видеокарты имеют на борту память HBM2, расположенную на одной подложке с графическим процессором. HBM2 — в принципе память горячая, еще и расположенная в миллиметре от мощного процессора, который уж сколько раз называли то «кипятильником», то «электрообогревателем». Мало того, чипы HBM2, как и сам GPU, по большей части удерживаются на месте органическим компаундом, так как прочность BGA-пайки кремния к подложке — невеликая в силу самой технологии осаждения «пятаков» на кремний. Смещение чипа с нарушением контакта в BGA и приводит к знаменитым отвалам чипов, а в Vega их три на одной подложке, так что вспоминаем теорию вероятности и получаем на порядок больший шанс неисправности на подложке, при которой видеокарта сгодится только как донор платы или деталей VRM. Во-вторых, Vega 64 и 56 были и остаются рабочими лошадками в майнерских фермах, в первую очередь из-за той же HBM2, и приличная их часть майнит уже лет 5. Ну и в третьих, 300 Вт энергопотребления для этой карты — не предел, как и 90 градусов на чипах памяти. Второе место — также за AMD, в этот раз RX 5700 XT, которые хоть и обошлись без HBM, тем не менее с завидной регулярностью умеют показывать 90 градусов на хотспоте (самая горячая точка чипа) при средней по больнице в районе 75. Так же, как и Vega, RX 5700 и 5700XT массово закупались в фермы, и если проблемами с памятью они не страдают, то сравнительно небольшой 7-нм чип (всего на 10 мм 2 больше, чем GP106 в 1060) в некоторых моделях (да что там, во всех кроме Nitro) страдает от малой тепловой инерции и сравнительно малой площади контакта с радиатором. И по крайней мере в настоящий момент с 99% вероятностью абсолютно все продаваемые 5700 XT будут проблемными в районе чипа, а то и по-быстрому погретыми термовоздушкой, чтобы хоть пару недель протянул, слишком уж эта карта удачна для майнинга.

READ  Как восстановить удаленные антивирусом файлы на флешке

Третье место — карты RTX 2080/2080ti первых поколений. Третье потому, что уж слишком мало их выжило, и проблемными были в основном Founders Edition и прочие платы референсной разводки, у которых дорожки питания во внутренних слоях платы, расширяясь при нагреве, поднимали чипы памяти, приводя к тому, что назвали «Space Invaders Fault» из-за сходства артефактов со спрайтами в той самой древней игре. Шанс попасть на выживший реф минимален, но если оно еще не умерло, то обязательно это сделает, так что при возникновении острого желания купить б/ушную 2080/2080ti полезно будет нагуглить расшифровки серийных номеров различных вендоров и обходить стороной карты, выпущенные до декабря 2018 года. Причем от условий эксплуатации и бренда это никак не зависит, например фото ниже — с умершей картой в Alienware Aurora R8, недешевой брендовой сборке.

реклама

По RTX 30 Series пока информации мало, но можно уверенно сказать, что карты с памятью GDDR6X сейчас находятся где-то вот здесь на четвертом месте, и делят его с ветеранами 1080ti. Проблема — горячая «X» память и привлекательность для майнеров из-за широких шин памяти (а 1080ti еще и нещадно разгоняют по ядру, кто не верит — почитайте майнерские форумы). В дальнейшем, конечно, 30хх карты вылезут наверх, так как температуры под 100 на памяти не очень ей полезны. Даже принимая во внимание отсутствие термоциклирования припоя (при перепадах температуры бессвинцовый припой склонен к образованию хрупких интерметаллидов), высокие температуры ускоряют диффузию легирующих материалов в кремний, приводящую к постепенной деградации p-n переходов. Да и одно-единственное выключение видеокарты, проработавшей многие месяцы в стабильном температурном режиме, может привести к проблемам в BGA из-за разности КТР текстолита, припоя и электронных компонентов. Те же 1080Ti с горелым VRM (и прожженым в связи с этим текстолитом), которых сейчас навалом, умирали в основном по схеме «выключил, потом включил, пошел дым».

Ну и немного теории и общих положений.

реклама

В целом, капитан очевидность напоминает, что чем меньше энергопотребление карты, тем более она надежна, потому что физика.

Расхожее мнение «майнеры гонят память и душат по лимитам чип» верно (не всегда), но неприменимо к надежности видеокарт. Закоротившая банка памяти может точно так же выжечь один из мосфетов VRM, либо убить один канал или весь контроллер памяти в чипе, поэтому при отказе банки памяти отделаться 3-5 тысячами рублей за замену одной банки выйдет хорошо если в 50% случаев.

Любые видимые изменения цвета паяльной маски, желтизна на пайке, следы флюса — разворачиваемся и уходим.

Если видим объявление «не майнила» на Авито — смотрим профиль, в объявлениях, особенно завершенных, часто обнаруживаются райзеры, киловаттные БП и прочие немайнерские железки. Не то чтобы майнерская карта — это 100% плохо, геймерские и похуже бывают, но иметь дело с человеком, который врет сразу — незачем.

реклама

Проверяем карты при закрытых приложениях оверклокинга, вроде Afterburner и Radeon Control Center. Там можно сбавить частоты ставшей нестабильной памяти или прикрутить лимит мощности/поддать газу на вентиляторы, чтобы не дать карте греться до температур, где проявляются проблемы.

В заключение могу сказать, что весь этот текст написан «на будущее», так как сейчас покупка абсолютно любой видеокарты выглядит неразумно, кроме тех случаев, когда вам абсолютно некуда больше деть деньги.

Источник

Smartadm.ru