Что делать при сбое оперативной памяти. Анамнез и методы лечения

    Оперативная память – такая деталь системы, которая реже всех выходит из строя. Но спонтанные перезагрузки системы с BSOD и без него, вылеты игр или программного обеспечения, некорректные результаты обработки заданий в тяжёлом софте – всё это и многое другое может быть симптомами проблем именно с ней. На самом деле, такие проблемы возникают довольно часто и являются в основном следствием некорректной настройки самим пользователем, хотя исключать аппаратные проблемы всё же, нельзя. В этом материале мы познакомимся с актуальными модулями памяти для настольных систем, расскажем о возможных проблемах в их работе и причинах, по которым они возникают, а также поможем с диагностикой. Отчего ещё и почему могут возникать сбои в работе памяти? Что в итоге делать или не делать? Отвечая на эти вопросы, пытать мозг новичков мы не будем – расскажем всё простым языком для максимального понимания.



    Из чего состоит модуль памяти?


    Оперативная память с точки зрения схемотехники является очень простым устройством, если сравнивать с остальными электронными комплектующими системы и не брать в расчёт вентиляторы (в некоторых ведь есть простейший контроллер, реализующий PWM управление). Из каких компонентов собраны модули?

    1. Сами микросхемы – ключевые элементы, которые определяют скорость работы памяти.
    2. SPD (Serial Presence Detect) – отдельная микросхема, содержащая информацию о конкретном модуле.
    3. Ключ – прорезь в печатной плате, чтобы нельзя было установить модули одного типа в платы, их не поддерживающие.
    4. Сама печатная плата.
    5. Разного рода SMD компоненты, расположенные на печатной плате.



    Конечно, набор составляющих далеко не полный. Но для минимальной работы памяти этого достаточно. А что ещё может быть? Чаще всего – радиаторы. Они помогают остудить высокочастотные микросхемы, функционирующие на повышенном напряжении (правда, не всегда на повышенном), а также при разгоне памяти пользователем.



    Кто-то скажет, что это маркетинг и всё такое. В некоторых случаях – да, но не HyperX. Модули Predator с тактовой частотой 4000 МГц без труда прогревают радиаторы до отметки 43 градусов, что мы выяснили в материале о них. К слову, о перегреве сегодня ещё пойдёт речь.



    Далее – подсветка. Какие-то производители устанавливают таковую определённого цвета, а какие-то – полноценную RGB, да ещё и с возможностью настройки как при помощи переключателей на самих модулях, так при помощи подключаемых кабелей, а также программного обеспечения материнской платы.



    Но, к примеру, инженеры HyperX пошли дальше – они реализовали на плате инфракрасные датчики, которые требуются для полной синхронизации работы подсветки.



    Углубляться мы в это не будем – материал не об этом, да и рассказывали о них ранее, поэтому, если кому интересно – знакомимся с видео ниже и читаем материал по делу дальше.



    Чему быть – тому не миновать


    Выбирая бюджетную память от малоизвестных производителей, вы получаете кота в мешке – такие модули могут быть собраны «на коленке в подвале дядюшки Ляо» и даже не знать, что такое контроль качества. Иными словами – проблемы могут быть и при первом включении. Память ValueRAM от Kingston, конечно же, к таковой не относится, хоть и ценники на неё близки к минимальным. Учитывая предыдущую главу, некоторые пользователи могут сказать, что чем больше компонентов, тем выше шанс их поломки. Логично, опровергнуть это нельзя. Но уверенность HyperX в своей продукции (в частности – модулях Predator RGB) такова, что на неё распространяется пожизненная гарантия! Но так всё равно – что может выйти из строя? Всякие светодиоды и прочие подобные элементы дизайна в расчёт мы не берём.

    Повреждение ячеек памяти.

    Каждая микросхема памяти содержит огромное количество таких ячеек, в которые записывается и из которых считывается колоссальное количество информации. В случае записи данных в повреждённую ячейку, они искажаются, что вызывает сбой работы системы или приложения.

    Переразгон, неправильные тайминги и напряжение.

    Каждый из нас когда-либо пробовал или хочет попробовать разогнать память. Допускается увеличение частоты памяти не на всех платформах, но, если вы уже обзавелись поддерживающей разгон материнской платой, то можете встретить на своём пути определённые проблемы. В современных реалиях разгон памяти зависит не только от самих микросхем, но и от встроенного в процессор контроллера памяти и разводки линий на материнской плате. Два последних аспекта влияют на разгон в меньшей степени, нежели используемые микросхемы памяти. Чем больше вы увеличиваете тактовую частоту модулей памяти, тем более вероятно появление ошибок в их работе. С таймингами – наоборот. Их снижение может приводить к нестабильной работе. Улучшить стабильность работы разогнанной памяти может помочь увеличенное на неё напряжение, что влечёт больший нагрев и снижение ресурса работы в целом, так же как и потенциальную возможность выхода из строя в любой момент. В общем, если система работает нестабильно, то первым делом возвращайте все настройки к заводским.

    Перегрев.

    Да, высокие температуры памяти тоже могут влиять на стабильность работы системы. Поэтому, выбирая высокочастотные комплекты, стоит позаботиться об их охлаждении. Как минимум, они должны обладать радиаторами. То же самое касается и низкочастотных модулей, подверженных разгону с вашей стороны. Хотите установить набор быстрой памяти в рабочую систему, в которой производятся вычисления с её помощью? Не верите, что современная DDR4 с рабочим напряжением 1.2 В может сильно греться? Полюбуйтесь! Температура микросхем модулей, не оборудованных радиаторами, практически достигает 85 градусов, что является пределом для большинства микросхем. Впечатляет, не правда ли?



    Механические повреждения
    Любое неаккуратное движение – и вы можете повредить модуль памяти. Сколоть микросхему, SPD или в печатной плате лопнут дорожки. При некоторых повреждениях память ещё может работать, но с критическими ошибками. К примеру, скол SPD, что изображён на фото ниже, сделал модуль полностью неработоспособным. К разговору о радиаторах – они позволяют снизить практически до ноля вероятность механического повреждения памяти, если, конечно, вы чай или кофе на него не прольёте…



    Другие источники проблем работы памяти, но когда память ни при чём.

    Отдельно надо сказать, что память может нестабильно работать и не из-за описанных выше причин. Проблемы могут заключаться ещё в процессоре или материнской плате. Контроллер памяти в современных процессорах реализован непосредственно в самом процессоре. И он может «плохо себя вести» по разным причинам, особенно – при разгоне. А бывает так, что даже если вы сбросите настройки к номинальным, то, например, «умерший» канал памяти уже не оживёт. Соответственно, замена модуля ни к чему не приведёт. Физические повреждения процессорного разъёма или материнской плате (перегибы или иные внешние/внутренние воздействия) также могут быть причинами некорректной работы памяти. Поэтому мы не перестанем уговаривать вас проверить все компоненты отдельно, прежде чем идти покупать новый комплект памяти, что может оказаться пустой тратой денег. А компания Kingston пошла дальше – она предлагает конфигуратор, по которому можно просто и удобно найти подходящие под определённые системы модули памяти! Найти его можно по адресу https://www.kingston.com/ru/memory/searchoptions.

    Бережёного…

    Немногие знают, что существуют три буквы, способные упростить подбор компонентов системы – QVL. Расшифровка звучит как Qualified Vendors List, что на русском звучит как список совместимости. В него входят те комплектующие, с которыми производитель материнской платы проверил своё изделие и гарантирует корректную работу. По понятным причинам, проверить сотни наименований может не каждый. Но каждый уважающий себя производитель предлагает достаточно обширный список в нашем случае моделей оперативной памяти.

    Синие экраны смерти, зависания и перезагрузки – неисправность точно в…

    Из какого минимального набора электронных компонентов состоит ПК/ноутбук/моноблок? Из материнской платы, процессора, накопителя, блока питания и оперативной памяти. Все эти компоненты связаны между собой, поэтому если один из них работает нестабильно, то это вызывает сбои всей системы. Самым правильным путём диагностики будет тестирование каждого из этих компонентов в другой системе. Таким образом, методом исключения мы сможем определить «самое слабое звено» и заменить его. Но не всегда можно найти другую систему для таких действий. К примеру, далеко не каждый из ваших знакомых может обладать платой для проверки модулей с тактовой 4000 МГц или около того. Допустим, проблему выявили, и она заключается в памяти. Проверили несколько раз в разных слотах и на паре материнских плат — а она начала стабильно работать. Магия? Как говорится во вселенной Marvel, магия — это всего лишь неизученная технология, секрет которой в нашем случае очень прост. Контакты на модулях памяти со временем окисляются, что приводит к невозможности их корректной работы, а когда вы достаёте и возвращаете несколько раз, они немного шлифуются, после чего всё начинает работать нормально. На самом деле, окисление контактов — это самая распространенная проблема сбоев работы оперативной памяти (и не только), поэтому возьмите за правило — если возникли какие-либо проблемы с платформой, то вооружитесь обычным канцелярским ластиком и аккуратно протрите контакты с двух сторон. Это актуально как раз в тех случаях, когда проблемы возникают при работе памяти в её номинальном режиме, если до этого она месяцами или годами работала без сбоев.



    Если ластик не помог

    Что делать дальше? Если система работает с катастрофическими сбоями, то только проверять комплектующие на заведомо рабочей платформе. Если же подозрение именно на память, работающую в номинальном режиме, то можно выполнить несколько тестов. Существуют бесплатные и платные версии программ, некоторые работают из Windows/Linux, а некоторые из DOS или даже UEFI.

    Начнём с того, что есть у каждого пользователя Windows 7 и новее. Как ни странно, встроенный в Windows тест памяти работает весьма эффективно и способен выявить ошибки. Запускается он двумя способами – из меню «Пуск»:



    Или через Win+R:



    Результат нас ждёт один:



    Если базовый или обычный тесты не выявили ошибок, то обязательно стоит провести тестирование в режиме «Широкий», который включает в себя тесты из предыдущих режимов, но дополнен MATS+, Stride38, WSCHCKR, WStride-6, CHCKR4, WCHCKR3, ERAND, Stride6 и CHCKR8.



    Просмотреть результаты можно в приложении «Просмотр событий», а именно – «Журналы Windows» — «Система». Если событий много, то проще всего будет найти нужный нам журнал через поиск (CTRL+F) по названию MemoryDiagnostics-Results.



    Для проверки памяти рекомендуется использовать программы, функционирующие до загрузки ОС. Таким образом мы сможем проверить максимально доступный свободный объём памяти, что увеличит шанс выявления ошибок, если таковые будут. Очень распространённой программой является MemTest86. Она существует в двух вариантах – для устаревших (Legacy BIOS) систем и для UEFI-совместимых платформ. Для последних – программа платная, хоть есть и бесплатный вариант с ограниченным функционалом. Если заинтересованы, то сравнительная таблица редакций доступна на официальном сайте производителя — https://www.memtest86.com/features.htm.

    Данная программа является лучшим решением для поиска ошибок работы памяти. Она обладает достаточным количеством настроек и выводит результат в понятном виде. Сколько тестировать память? Чем больше – тем лучше, если вероятность появления ошибки мала. Если же какая-либо микросхема памяти явно проблемная, то результат не заставит себя долго ждать.



    Существует также MemTest для Windows. Использовать тоже можно, но смысла будет меньше – он не тестирует ту область памяти, которая выделена для ОС и запущенных в фоне программ.



    Так как эта программа не новая, то энтузиасты (в основном – азиаты) пишут для неё дополнительные оболочки, чтобы можно было удобно и быстро запускать сразу несколько копий для тестирования большого объёма памяти.



    К сожалению, обновления этих оболочек, чаще всего, остаются на китайском языке.



    А вот наши энтузиасты пишут свой софт. Яркий пример – TestMem5 от Serj.



    В целом, можно и linpack ещё в список тестов привести, но для его работы потребуется и полная нагрузка на процессор, что чревато его перегревом, особенно, если используются AVX инструкции. Да и это не совсем подходящий для проверки памяти тест, скорее – для прогрева процессора с целью изучения эффективности системы охлаждения. Ну и на циферки посмотреть. В целом, это не для домашнего использования бенчмарк, у него совсем другое предназначение.

    Быстрое решение всех проблем


    А вот такого, к сожалению, нет. Если только вы не владелец толстого кошелька, который позволит вам отдать свой ПК на диагностику и ремонт. Да и то – быстро даже за деньги не получится, если только попросту набор новых комплектующих не купить. Отвечая на поставленные в самом начале статьи вопросы, можно сказать следующее. Причин возникновения сбоев системы по вине оперативной памяти может быть несколько. И не все они относятся непосредственно к модулям памяти, всему виной может быть ещё как процессор, так и материнская плата. Если говорить непосредственно о памяти, то на стабильность работы также влияет разгон в любом его проявлении, а полностью убить модуль можно случайно физически – статикой или неаккуратным движением руки. Если исключить плату с процессором, убедиться в надлежащем температурном режиме, убрать разгон и проверить модули в другой системе, а они не перестанут выдавать ошибки – тогда уже придётся идти в гарантийный отдел или, если все сроки вышли, покупать новые модули. Исправить проблему сами смогут лишь единицы пользователей – для этого потребуется найти неисправную микросхему и заменить её на новую, а также, если требуется, внести правки в SPD. Сложно, но можно. И не забывайте про ластик – возможно, проблема решается очень быстро :)



    Для получения дополнительной информации о продуктах HyperX и Kingston обращайтесь на сайты компаний.
    Kingston Technology
    84,37
    Компания
    Поделиться публикацией

    Комментарии 14

      0
      Информацией по изменению записей в SPD после замены на модуль от другого производителя не поделитесь?)))
        +3
        Очень объёмная статья, суть которой сводится к одной строке: подозреваем, что проблема в памяти -> memtest86 -> меняем память на новую.
        Между прочим, я несколько лет вполне нормально жил с битой планкой памяти в компе. Определил с помощью memtest86 в какой из четырёх планок и в каком диапазоне адресов находится проблемный чип, поставил эту планку последней и урезал используемую виндой память так, чтобы верхняя граница не доходила до проблемных адресов:
        bcdedit set {current} truncatememory 31138512896
        Таким образом, я мог пользоваться примерно половиной объёма памяти на «битой» планке и не иметь при этом никаких BSODов и зависаний.
          +1
          Сейчас вам объявят иск за недополученную прибыль.
            0
            Только наверное дуал канал работать не будет, пропускная способность памяти соответственно упадет.
            +1
            Смотрел недавно как хостер проверяет свои сервера. мемтест86 хорошо но standalone. не может экспортировать отчёт. есть платная версия которая умеет складывать отчёт но на диск, а диск (файловая система) не всегда есть в сервере.
            Но больше понравилось тестирование процессора. Собственно в результате решение было построено вокруг программки по поиску простых чисел Мерсена, особенно понравилось как стресстест проработал и не выявил поврежденную ножку проца, а поиск простых чисел — упал.
              0
              Если сбойный участок не сильно большой, то можно его залочить при помощи bcd {badmemory}.
              Если плохой памяти слишком много, например 10-20-30 мегабайт, то могу посоветовать эту утилиту (не реклама, не моя). Она загружает драйвер, который как можно раньше пытается зарезервировать плохие физические адреса и не дать их использовать кому-то еще.
                +1
                Я как-то вычислил на своем компьютере битую память, после того как sha1 хеши у крупных файлов перестали совпадать. Считаешь хеш — получаешь новое значение. Такой «протечки абстракций» я даже представить себе не мог.
                  +1
                  Память ValueRAM от Kingston, конечно же, к таковой не относится


                  Одна такая ValueRAM DDR3 на 2 гига в прошлом году ни с того ни с сего вдруг выдала 6000 ошибок за 5 минут мемтеста.

                  Конечно, ValueRAM — не такая. Все дешевые плашки дерьмо, но ValueRAM — не такая.

                  Ни на что не намекаю, брак есть у всех, но осадочек остался.
                    0
                    Ключ – прорезь в печатной плате, чтобы нельзя было установить модули одного типа в платы, их не поддерживающие.

                    Как показывает реальная практика, помогает сей ключ не всегда.

                      0
                      Когда у меня в основном рабочие сервера были на FreeBSD, лучшим рецептом было запустить make world в цикле. Круга 4 прошло => память достаточно целая. GCC ну очень активно гонял данные в памяти.
                      По эффективности это было сравнимо с где-то неделей memtest86.
                      Под другими Unix системами можно просто собирать GCC или Clang по кругу с тем же результатом.
                        0
                        Модули Predator с тактовой частотой 4000 МГц без труда прогревают радиаторы до отметки 43 градусов, что мы выяснили в материале о них. К слову, о перегреве сегодня ещё пойдёт речь.


                        Ага, и, если я правильно помню, так и не было ответа на вопрос о максимальной рабочей паспортной температуре чипов — ибо что-то подсказывает мне, что она сильно выше как 43 градусов, так и той температуры, что достижима при снятых радиаторах.

                        Поставьте уже простой эксперимент: планка с радиатором, планка без, и вперед. Я даже деньги готов поставить на очевидный резулоьтат — что разницы для пользователя не будет.
                          0
                          разница будет через 5 лет непрерывной работы
                          0
                          >> Любое неаккуратное движение – и вы можете повредить модуль памяти. Сколоть микросхему, SPD или в печатной плате лопнут дорожки.

                          Меня как сборщика компьютеров очень волнует вопрос — нафига вы эти мелкие элементы пихаете в самое опасное место — возле разъема? и не обеспечиваете минимальную защиту — лака капнуть или еще что-то сделать?
                            0
                            Про теории заговора и запланированное устаревание слышали? Короче если сборщик сколупнёт SPD, то это только порадует производителя — вам придётся ещё раз бежать за покупкой.

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое