Как стать автором
Обновить

Эмпирический анализ аппаратных сбоев на миллионе ПК

Время на прочтение2 мин
Количество просмотров2.1K
Компания Microsoft провела первое в истории крупномасштабное исследование аппаратных сбоев на миллионе персональных компьютеров (PDF). Выявилось несколько интересных фактов.

В отличие от распространённого мнения о тривиальности аппаратных сбоев, на самом деле они встречаются довольно редко, причём 99% сбоев являются повторными. К примеру, машина с накопленными 30+ сутками работы CPU за период 8 месяцев имеет вероятность сбоя 1/190 из-за ошибки в подсистеме CPU. Если такое случилось, то вероятность повторного сбоя на этой машине составляет 1/2,9.



Если первый сбой произошёл в течение пяти суток работы CPU, то 84% таких компьютеров демонстрируют повторный сбой в течение 10 дней, а 97% — в течение месяца.

Оверклокинг CPU повышает вероятность сбоя в 4-19 раз, в зависимости от марки процессора.



Вероятность сбоя DRAM при оверклокинге повышается в пять раз.



С другой стороны, работа процессора на пониженной частоте повышает надёжность оборудования.



В рамках исследования подсчитана вероятность сбоев CPU, DRAM и дисковой подсистемы, на настольных компьютерах и ноутбуках, на компьютерах известных брендов и самостоятельной сборки. Показана зависимость количества сбоев от возраста компьютера, объёма памяти, производительности CPU.



Ещё один интересный факт: оказывается, ноутбуки обычно работают надёжнее настольных компьютеров.



Методология
Анализ проведён в 2008 году на базе краш/статус-репортов, присылаемых системой Windows Error Reporting в случаях обычных сбоев или после перезагрузки Windows (соответственно, две выборки: RAC и ATLAS). В краш-репортах указан период работы без сбоя. Исследование считается консервативным, потому что в нём не учтены случаи, когда краш-репорты не высылаются из-за слишком высокой частоты сбоев.

Собрана информация с 950 тыс. компьютеров.
Теги:
Хабы:
Всего голосов 43: ↑38 и ↓5+33
Комментарии75

Публикации