Для мониторинга аппаратных проблем в 64-разрядных сборках Linux удобно использовать пакет mcelog, анализирующий MCE (Machine Check Exception) состояние в CPU AMD и Intel, которое может указать на проблемы с памятью и с кэшем CPU, ошибки обмена данными между CPU и чипсетом материнской платы.
Если в /var/log/messages
, /var/log/syslog
появляются ошибки типа:
kernel: [Hardware Error]: Machine check events logged
Нужно ставить пакет mcelog
и анализировать сообщения в /var/log/mcelog
apt-get install mcelog