Доброго дня! Конфигурация сервера (2008R2): Не домен, установлены файловые службы и службы удаленных рабочих столов, SQL сервер, на VirtualBox, Kerio раздает интернет в локальной сети, две сетевые карты. (До этого был настроен Vmware, данные ошибки сохранились после перехода на VB). Постоянно (по 20-40 в день) в журнале событий появляются предупреждения «Устраненная аппаратная ошибка WHEA-Logger»
Предупреждения фиксируются только в рабочее время, в выходные и ночью их нет, ошибки отсутствуют.
Произошла устраненная аппаратная ошибка.
Сообщивший компонент: ядро процессора
Источник ошибки: Исправленная ошибка проверки компьютера Тип ошибки: Неизвестная ошибка ИД процесса: 6 Дополнительные сведения содержатся в подробном представлении этой записи.»
Помогите вычиcлить причину предупреждения и устранить его?
Изменен тип Petko Krushev Microsoft contingent staff, Moderator 22 сентября 2017 г. 7:52
Все ответы
Это событие означает проблему с железом.
В данном случае имеет место событие 19, это означает Corrected machine check error.
Данные которые записываются при этом описаны тут:
К сожалению почти все значения не установлены, а типа ошибки 12 в списке нет.
Впрочем, это скорее всего ничего не изменило бы, проблема все равно решается манипуляциями с железом.
Можно начать с замены блока питания на заведомо исправный. Далее замена процессора и матплаты. Конечно до этого не повредит сбросить настройки БИОС в самые надежные.
This posting is provided «AS IS» with no warranties, and confers no rights.
Если предположить, что проблема действительно в железе, то как тогда объяснить факт ее проявления только в рабочее время? Сервер работает круглосуточно, обновляется сам по выходным, ночью обновляются база консультанта и программы документооборота (на SQL сервере), постоянно работает виртуальная машина т.е. задействованы и сетевые карты и процессор и блок питания и прочее железо, но предупреждений нет с 19.00 вечером до 8.00 утра и по выходным дням.
Ну а если предположить что проблема не в железе, то как бы вы это объяснили? Ведь сервер работает круглосуточно и так далее.
This posting is provided «AS IS» with no warranties, and confers no rights.
Ну а если предположить что проблема не в железе, то как бы вы это объяснили? Ведь сервер работает круглосуточно и так далее.
This posting is provided «AS IS» with no warranties, and confers no rights.
Заметил еще одну закономерность, время всех предупреждений заканчивается на 10 секунд.
Иными словами, в рабочее время происходит нечто что вызывает проблему. Это совершенно логичное объяснение. Почему вы считайте что оно не подходит для аппаратной проблемы?
Почему я считаю что проблема аппаратная? Очень просто: WHEA (Windows Hardware Error Architecture) рапортует именно об аппаратных проблемах.
В данном случае ошибка была отрапортована процессором и устранена им же. Например, нарушение данных в кэш памяти было устранено за счет избыточного кодирования (просто пример, не ваш случай).
Выяснение что именно провоцирует проблему скорее всего никак не поможет ее устранить. Ну допустим что это работа с SQL, вы же не сможете перестать его использовать, так? А может быть это просто нагрузка на процессор, а не какое то конкретное приложение или железный компонент. Скажем, вздулись конденсаторы на матплате, как только возрастает нагрузка возникают определенные сбои, пока что незначительные и исправимые.
Таким образом остается тестировать железо методом замены пока проблема не будет устранена.
Как всегда в случаях проблем с железом следует рассмотреть такие факторы:
— С чего это началось, например был ли установлен какой либо новый компонент? Возможно он несовместим.
— Каково состояние железа, например сколько ему лет. Рано или поздно железо начнет отказывать, обычно после 3-5 лет.
— Каково состояние окружающей среды, например каково качество питания и поддержания температуры. Может когда все приходят в офис напряжение в сети проседает или появляются помехи от других нагрузок.
Можно и ничего не делать, ведь ошибка исправляется самим железом, во всяком случае пока.
This posting is provided «AS IS» with no warranties, and confers no rights.
Иными словами, в рабочее время происходит нечто что вызывает проблему. Это совершенно логичное объяснение. Почему вы считайте что оно не подходит для аппаратной проблемы?
Почему я считаю что проблема аппаратная? Очень просто: WHEA (Windows Hardware Error Architecture) рапортует именно об аппаратных проблемах.
В данном случае ошибка была отрапортована процессором и устранена им же. Например, нарушение данных в кэш памяти было устранено за счет избыточного кодирования (просто пример, не ваш случай).
Выяснение что именно провоцирует проблему скорее всего никак не поможет ее устранить. Ну допустим что это работа с SQL, вы же не сможете перестать его использовать, так? А может быть это просто нагрузка на процессор, а не какое то конкретное приложение или железный компонент. Скажем, вздулись конденсаторы на матплате, как только возрастает нагрузка возникают определенные сбои, пока что незначительные и исправимые.
Таким образом остается тестировать железо методом замены пока проблема не будет устранена.
Как всегда в случаях проблем с железом следует рассмотреть такие факторы:
— С чего это началось, например был ли установлен какой либо новый компонент? Возможно он несовместим.
— Каково состояние железа, например сколько ему лет. Рано или поздно железо начнет отказывать, обычно после 3-5 лет.
— Каково состояние окружающей среды, например каково качество питания и поддержания температуры. Может когда все приходят в офис напряжение в сети проседает или появляются помехи от других нагрузок.
Можно и ничего не делать, ведь ошибка исправляется самим железом, во всяком случае пока.
This posting is provided «AS IS» with no warranties, and confers no rights.
Не смог найти по продукт и вендор ID, что это за устройство, предполагаю где-то чипсет, но не могу понять.
Что было сделано.
Обновлены все драйвера сперва с официального сайта Asus, все установлено без ошибок. Не помогло
Далее были скачаны все официальные последние драйвера с сайтов производителей.
Видеокарту с GeForce, Чипсет HM170 с сайта Intel и остальное так же. Так же без ошибок, все обновилось.
Но проблема не решена.
Насколько обращать внимание на это? Стоит ли парится и искать решение или из текста Logger, значит что то пытается слогировать но не получается, может и черт с ним, пускай не логирует?
Если надо решить, не прошу мне решить проблему вам, просто направьте в нужно русло!