Мониторинг smart zabbix windows

Ещё один блог сисадмина

воскресенье, 30 августа 2020 г.

Контроль параметров S.M.A.R.T. накопителей SSD через Zabbix

В этой статье описывается доработка шаблона Zabbix из статьи Контроль параметров S.M.A.R.T. жёстких дисков через Zabbix. Имеющийся шаблон пригоден только для контроля жётских дисков, а в этой статье я опишу доработки, которые позволят контролировать как состояние жёстких дисков, так и накопителей SSD Micron 5200 MAX. Этот шаблон может подойти и для других моделей накопителей, если они поддерживают необходимые атрибуты S.M.A.R.T., но на других накопителях не тестировался.

Попутно в шаблон были внесены доработки, аналогичные описанным в статье Контроль в Zabbix параметров SMART дисков, подключенных к аппаратному RAID-массиву. Вместо общего порога для всех дисков по количесвту перемещённых секторов и секторов, ожидающих перемещения, на этот раз в шаблоне предусмотрена индивидуальная настройка порогов для каждого из дисков.

Атрибуты S.M.A.R.T. и коэффициент усиления записи

С точки зрения контроля состояния накопителей SSD наиболее интересны следующие атрибуты:

Идентификатор атрибута Название атрибута Пояснение
202 Percent_Lifetime_Used Процент использования ресурса диска (100% — полностью изношен)
246 Total_Host_Sector_Write Количество записанных секторов
247 Host_Program_Page_Count Количество записанных страниц
248 Bckgnd_Program_Page_Cnt Количество страниц, записанных контроллером

На твердотельных накопителях единицей чтения и записи является страница, размер которой обычно больше логического размера сектора диска. По мере повторных перезаписей страница изнашивается и запись на неё становится всё менее надёжной. Количество гарантированных производителем успешных перезаписей страницы называется ресурсом. Чтобы снизить вероятность потери информации, контроллер накопителя ведёт учёт количества операций перезаписи каждой страницы. При любом изменении информации в логическом секторе диска контроллер выбирает из всех имеющихся свободных страниц наименее изношенные и копирует данные на неё. Контроллер имеет возможность посчитать изношенность всего накопителя в целом и отражает это значение в атрибуте Percent_Lifetime_Used.

Также производитель регламентирует в технических характеристиках накопителя гарантированный объём записанных на диск данных — TBW, Total Bytes Written. Например, исходя из технических характеристик накопителей, указанных на странице Micron 5200 series of SATA SSDs, на SSD Micron модели 5200 MAX 480Gb можно записать 4.38 петабайт данных. Контроллер накопителя ведёт учёт количества записанных 512-байтных секторов в атрибуте Total_Host_Sector_Write.

Страницы группируются в блоки. Для того, чтобы записать в страницу новое содержимое, необходимо выполнить операцию очистки всего блока. Из-за этого перезапись одного логического сектора может приводить к перезаписи в несколько раз большего объёма данных на SSD. Отношение реально записанного объёма данных к объёму, который просила записать операционная система, называется коэффициентом усиления записи (Write Amplification Factor). Посчитать его можно воспользовавшись значениями атрибутов S.M.A.R.T. Host_Program_Page_Count и Bckgnd_Program_Page_Cnt по следующей формуле:

Доработка конфигурации агента Zabbix

Во-первых, нам полезно определять тип накопителя: жёсткий диск или твердотельный накопитель.

Для этого я воспользовался полем Rotation Rate, в котором содержится частота вращения диска в оборотах в минуту. Если это поле не содержит числа, то будем считать накопитель твердотельным. В таком случае частота вращения диска равняется нулю. Добавим в файл конфигурации Zabbix-агента /etc/zabbix/zabbix_agentd.conf «пользовательский параметр» для определения частоты вращения диска:
Для контроля процента использованного ресурса, объёма записанных данных и коэффициента усиления записи добавим в конфигурацию Zabbix-агента /etc/zabbix/zabbix_agentd.conf ещё три «пользовательских параметра»:
После внесения изменений в конфигурацию Zabbix-агента, не забудьте его перезапустить:

Доработка шаблонов для Zabbix

Я обновил два шаблона, описанных ранее, для контроля параметров S.M.A.R.T. твердотельных накопителей. Взять их можно по прежним ссылкам:

  • Template_App_SMART.xml — шаблон с элементами данных типа «Zabbix-агент»,
  • Template_App_SMART_Active.xml — шаблон с элементами данных типа «Zabbix-агент (активный)».

В обоих шаблонах имеется элемент данных для низкоуровневого обнаружения, который находит все имеющиеся в системе диски, поддерживающие S.M.A.R.T.:

Есть прототипы элементов данных, с помощью которых контролируется: статус здоровья диска, количество перемещённых секторов, секторов, ожидающих перемещения, температура жёсткого диска. Значения этих данных для каждого из жёстких дисков снимаются раз в 10 минут. Раз в час для каждого жёсткого диска запрашивается модель и серийный номер — они могут пригодиться, когда понадобится заменить один из жёстких дисков:

Имеется три прототипа триггеров, который будут созданы для каждого обнаруженного жёсткого диска. Самый главный триггер срабатывает в том случае, когда S.M.A.R.T. явным образом сообщает о неисправности диска. Два других триггера срабатывают при превышении лимита неисправных секторов или секторов, ожидающих перемещения:

Лимиты для двух последних триггеров можно задать через соответствующие макросы — <$SMART_REALLOCATED_LIMIT>и <$SMART_PENDING_LIMIT>:

На картинке заданы нулевые лимиты, поэтому триггеры будут срабатывать при появлении хотя бы одного подозрительного сектора на диске. Если вы посчитали, что проблемных секторов не так уж и много, то можно задать новые значения макросов индивидуально в самом наблюдаемом узле Zabbix.

При срабатывании триггера вида «/dev/sda: Количество перемещённых секторов 13 > 0» можно переопределить значение макроса для конкретного диска. Чтобы погасить этот триггер, на уровне узла можно определить макрос <$SMART_REALLOCATED_LIMIT:"/dev/sda">со значением 13. Порог срабатывания триггеров на других жёстких дисках останется прежним — будет использоваться значение по умолчанию, взятое из шаблона.

Наконец, снимаемые данные в случае упомянутых твердотельных накопителей Micron SSD 5200 MAX выглядят следующим образом:

Zabbix: LLD-мониторинг дисков без UserParameter и скриптов на агентах

В предыдущей статье я описал низкоуровневый мониторинг дисков для Windows-машин. Считаю, что статья получилась достаточно успешная. Поэтому пришло время ее фактически уничтожить. Ниже будет описан универсальный прием для Windows- и Linux-машин, для которых вообще не нужны скрипты и UserParameter’ы.

Идея простая: все необходимое от smartmontools Zabbix-сервер будет получать через внешнюю обработку и zabbix_get, парсить и передавать далее в зависимые элементы (появились в Zabbix 3.4). Такие образом не только сокращается количество обращений к наблюдаемому серверу, но и не расходуются его ресурсы, так как парсинг происходит на стороне Zabbix-сервера.

Одно ограничение на данный момент: мониторинг дисков только формата /dev/sd*. Формат /dev/csmi*,* (Intel Matrix RAID) не поддерживается ввиду того, что zabbix_get считает запятую вторым аргументом. Поправьте меня, если я ошибаюсь.

Что понадобится для реализации:

Настройка агента

Единственное, что заслуживает здесь внимания, это необходимость раскомментировать строку EnableRemoteCommands = 1, иначе агент не сможет принимать команды.

Smartmontools

Установка тривиальна и рассматриваться не будет, однако для Linux есть одна необходимость: для того, чтобы запуск проходил без sudo, необходимо установить бит SUID на файл smartctl. Для Ubuntu это — sudo chmod u+s /usr/sbin/smartctl.

Скрипт

В зависимости от вашего файла конфигурации zabbix_server.conf этот скрипт нужно положить в соответствующую директорию на Zabbix-сервер. По умолчанию для Ubuntu это — /usr/lib/zabbix/externalscripts. Не забывайте дать на файл права на выполнение — sudo chmod 775 /usr/lib/zabbix/externalscripts/smartctl.sh.

Шаблон

Шаблон экспортирован из версии 3.4.4.
В шаблоне уже присутствуют следующие элементы: модель, семейство, серийный номер, объем диска, статус SMART; а также значения SMART 3, 5, 7, 9, 10, 190(194), 196, 197, 198 ,199. Есть и 3 триггера: два оповещают о высоких температурах и еще один о плохом SMART’е.

Ниже я постараюсь подробно описать что же происходит на каждом этапе.
Первый этап: обнаружение доступных дисков sd* с помощью внешней проверки smartctl.sh с ключами и discovery. В ответ сервер получает JSON с дисками, на которых активирована функция SMART. Диски без SMART’а или не sd* не выводятся.

Этап второй: получение для каждого из найденных дисков двух элементов — Info и Attr. Info — информация о диске, Attr — атрибуты SMART. «Почему не запросить smartctl -a /dev/sd* ?» — спросите вы. Такой вывод получается не полный для части дисков, теряются атрибуты и так далее. Пришлось изобретать на ходу.

Третий этап: Info и Attr разбираются на зависимые элементы с помощью предобработки регулярными выражениями. Это самая простая часть. Собственно, вам только останется подогнать под себя «регулярку».

Вот и все. Не нужно держать в голове что и куда положить, отключить ли политику выполнения скриптов PS, отслеживать ту же версию PS. А в случае необходимости все изменения производятся на самом Zabbix’е в веб-интерфейсе.

Читайте также:  Настройка vpn линукс минт

В итоге хотелось бы просто сказать спасибо Алексею alexvl и его команде за качественный продукт, который не перестает радовать новым функционалом. Особенно за предобработку. Жизнь с ней администратору станет гораздо легче.

Настройка мониторинга SMART жесткого диска в zabbix

Я рассмотрел на своем сайте много вариантов использования заббикс для наблюдения за различными метриками. Сейчас хочу рассказать, как настроить мониторинг SMART параметров жесткого диска с помощью Zabbix. Я давно использую это решение, но не писал статью, так как информация полностью мной заимствована. Но для полноты картины решил все же опубликовать на своем сайте.

Введение

Когда мне понадобилось настроить мониторинг жестких дисков, в частности, SMART параметров в Zabbix, я сразу же нашел готовое решение на share.zabbix.com. Рекомендую туда заглядывать периодически в поисках интересных приемов для мониторинга.

В данном случае практически не пришлось ничего менять или допиливать. И скрипты, и шаблон готов к использованию в оригинальном исполнении. Расскажу подробно, как я на основе этой информации настраиваю мониторинг smart у себя.

Я буду работать на сервере CentOS 7, но в данном случае, как обычно с заббиксом, это не имеет принципиального значения. Все скрипты и шаблоны подойдут для практически любого дистрибутива linux. Если у вас еще нет своего сервера для мониторинга, то рекомендую свои материалы на эту тему:

То же самое на Debian 9, если предпочитаете его:

Настраивать будем по этапам:

  1. Сначала настроим агент и все необходимые скрипты.
  2. Импортируем шаблон на сервер и применим к нужному хосту.
  3. Проверим полученные данные.

Приступим к настройке zabbix для наблюдения за смартом дисков.

Подготовка zabbix agent

Мониторинг значений SMART жесткого диска будет выполняться с помощью smartmontools. Установить их можно следующей командой для CentOS:

Либо аналогично в Debian/Ubuntu

Далее нам понадобится скрипт на perl для автообнаружения дисков и вывода информации о них в JSON формате, который понимает заббикс. Создадим такой скрипт.

Сохраняем скрипт и делаем исполняемым.

Выполняем скрипт и проверяем вывод. Должно быть примерно так с двумя дисками.

В данном случае у меня 2 физических диска — sda и sdb. Их мы и будем мониторить.

Настроим разрешение для пользователя zabbix на запуск этого скрипта, а заодно и smartctl, который нам понадобится дальше. Для этого запускаем утилиту для редактирования /etc/sudoers.

Добавляем в самый конец еще одну строку:

Сохраняем, выходим 🙂 Это если вы умеете работать с vi. Если нет, то загуглите, как работать с этим редактором. Именно он запускается командой visudo.

Проверим, что пользователь zabbix нормально исполняет скрипт.

Вывод должен быть такой же, как от root. Если вам не хочется разбираться с этими разрешениями, либо что-то не получается, можете просто запустить zabbix-agent от пользователя root и проверить работу в таком режиме. Сделать это не трудно, данный параметр закомментирован в конфигурации агента. Вам достаточно просто снять комментарий и перезапустить агент.

После настройки скрипта автообнаружения, добавим необходимые UserParameters для мониторинга SMART. Для этого создадим отдельный конфигурационный файл. Для версии 3.2 и ниже он будет выглядеть вот так.

Версия настроек для агента 3.4

Сохраняем файл и перезапускаем zabbix-agent.

Проверяем, как наш агент будет отдавать данные. Ключ uHDD.discovery будет одинаковый для обоих версий агента.

Вы должны увидеть полный JSON вывод с информацией о ваших диска. Теперь посмотрим, как передаются информация о smart. Запросим температуру дисков для версии 3.2.

Все в порядке. Можете погонять еще какие-нибудь параметры из смарта, но скорее всего все будет работать, если хотя бы один параметр работает. На этом настройка на агенте закончена, переходим к настройке сервера мониторинга.

Настройка мониторинга SMART параметров диска

На сервере нам никаких особенных настроек делать не придется. Достаточно будет загрузить готовый шаблон и применить его к интересующему нас хосту для мониторинга за диском.

Шаблон можно взять у меня — zabbix-smart-template.xml. Я уже точно не помню, изменял ли я что-нибудь в нем, по сравнению с оригинальным или нет. Но даже если и изменял, то незначительно, скорее всего только интервалы обновления итемов. Это шаблон я экспортировал со своего сервера версии 3.2. Оригинальные шаблоны вы можете взять у авторов по ссылке в начале поста.

Для сервера zabbix версии 3.4 используйте обновленный шаблон автора.

Интервал обновления правил автообнаружения в шаблоне 30 минут, поэтому придется подождать примерно пол часа, прежде чем какие-то новые данные по мониторингу смарта появятся на сервере. Во время отладки можете изменить этот параметр вручную в шаблоне.

Тут же, в прототипах элементов данных, можете посмотреть остальные айтемы, их параметры и интервалы обновления. Возможно, что-то вам будет не нужно и вы отключите.

Может быть вам будет полезно чаще, чем раз в 10 минут мониторить температуру жесткого диска. В соседнем разделе посмотрите прототипы триггеров. Некоторые из них вычисляемые и начнут работать только после того, как накопится определенное количество данных. До этого они будут показывать ошибки, имейте это ввиду.

После того, как правило автообнаружения сработает и будут получены первые данные, можно их проверять в «Последние данные». Это будут значения температуры.

Мониторинг SMART и температуры диска в Windows

Изначально в статье было рассказано только о мониторинге в системах linux. Со временем появилась необходимость настроить то же самое, только в Windows, поэтому решил не начинать новую статью, а дополнить текущую. Смысл дальнейших действий точно такой же, как и на linux. Для мониторинга за жесткими дисками, в том числе за температурой в windows, будем использовать smartmontools под windows. Скрипт для автообнаружения и формирования выдачи в zabbix будет работать на powershell.

Устанавливаем smartmontools. После установки рекомендую сразу проверить работу. Для этого открываем командную строку, переходим в директорию C:\Program Files\smartmontools\bin и выполняем:

Вы должны увидеть список всех дисков в системе. Дальше можете посмотреть информацию о дисках, например так:

Если все в порядке, информация о дисках выводится, продолжаем. Нам нужен скрипт для парсинга вывода. Я не стал придумывать свой, к тому же на powershell писать практически не умею, взял за основу готовый, который реализует тот же функционал, что описанный выше для linux.

Я немного изменил оригинал скрипта, автор почему-то использует smartctl-nc.exe. У меня он вообще ничего не выводит, я не понял, что это за экзешник. Я использовал обычный smartctl.exe. Сохраните скрипт и проверьте его работу. Для того, чтобы система разрешила выполнять неподписанные powershell скрипты, необходимо запустить консоль powershell от администратора и выполнить команду:

Если этого не сделать, будете получать ошибку при запуске скрипта на тему того, что выполнение скриптов запрещены для данной системы. Я сохранил скрипт в директорию C:\zabbix\windows.hdd.ps1. Проверим его работу. Запускаем консоль powershell и сам скрипт с разными параметрами.

Все в порядке. Скрипт возвращает список дисков для автообнаружения и различные параметры для запроса. Теперь добавим в конфиг агента UserParameter.

Не забудьте увеличить таймаут получения данных. По-умолчанию в zabbix стоит 3 секунды. Этого может не хватать. Я обычно ставлю 15 секунд.

Перезапускаем службу агента и идем на сервер.

На сервере делать ничего не надо, так как все сделал за вас я 🙂 Предлагаю готовый шаблон — zabbix-smart-win-template.xml. Скачиваете и импортируете в свой сервер. У меня он работает на версии сервера 3.4.6. В шаблоне настроено автообнаружение дисков, создание итемов и триггеров. Все немного похоже на то, что есть для линукса, но тем не менее отличается, так как делалось в разное время и с разным настроением. В линуксе все более заморочено — сложные триггеры и итемы, которые добавил автор шаблона. Со временем понял, что это не особо надо и не стал заморачиваться с виндой, сделал все по проще, но тем не менее весь основной функционал присутствует.

Более того, в версию с windows я добавил триггер, который срабатывает, если диск исчезает из системы. У меня был один такой диск, который мог просто пропасть. Пришлось сделать оповещение. В linux у меня диски никогда не пропадали просто так, поэтому не догадался с свое время до такого триггера. Ниже список items шаблона.

И тут же триггеры.

И вот такую картинку вы получите на выходе, когда все диски и итемы к ним появятся на хосте и начнут собирать данные.

Читайте также:  Быстрая загрузка windows uefi

В общем и целом ничего сложного. Настроить мониторинг SMART и температуры дисков в windows не на много сложнее, чем в linux. Хорошо, что есть одинаковый интерфейс с одним и тем же синтаксисом для обоих дисков. В windows 10 ко всему прочему, есть полноценная система ubuntu, можно было бы и без powershell обойтись, но получилось бы не универсальное решение. Данный способ работает на всех версиях windows, начиная с XP.

Заключение

Мониторинг smart значений жесткого диска достаточно полезная штука, но не стоит ей слепо доверять. У меня были ситуации, когда диски с Bad Sector Count работали годами. Тут важно смотреть на динамику и на статус сервера. Если он критичный, то при малейших признаках неисправности, я бы менял диск. Если это обычая файлопомойка с рейдом, то если диск не деградирует со временем, можно его не трогать.

Еще важный нюанс — подобный мониторинг жестких дисков возможен только если вы не используете raid контроллер. Если же он у вас есть, то чаще всего вы не сможете увидеть параметры smart дисков. Нужно будет использовать утилиты производителя raid контроллера и настраивать мониторинг через них.

Онлайн курс по Linux

Помогла статья? Подписывайся на telegram канал автора

Автор Zerox

95 комментариев

В zabbix_agentd.conf
1. Добавляем строчку Timeout=15
2. Добавляем строчку UserParameter=ZScript[*],powershell -File C:\zabbix\windows.hdd.ps1 «$1» «$2»
( У меня c:\Program Files\Zabbix Agent\script_smartctl.ps1)

Для windows информация полностью актуальна. Только что настроил мониторинг обычных дисков по ней.

Все пункты появились, но данные не получает. Последний скрин это же с Monitoring>Latest Data ? Вообще всё по нулям.

Привет, попробовал на 4.2 и на 4.4 и откатился до 3.4 но везде одно и то же

# zabbix_agentd -t uHDD[sda,Temperature_Celsius]
uHDD[sda,Temperature_Celsius] [m|ZBX_NOTSUPPORTED] [Unsupported item key.]

и соответственно в логах сервера
«Comp:uHDD.discovery[«<$SMARTCTL_STATIC_DISKS>«]» became not supported: Item does not allow parameters.

в вэб интерфейсе Item does not allow parameters

может есть какие то идеи?

Я конечно поздновато, но вдруг кто-то будет искать. У меня была точно такая же ошибка на версии агента 4.0.4

Решилось просто тем, что я прописал в настройках заббикс агента параметр:

UserParameter=uHDD[*],sudo smartctl -A /dev/$1| grep -i «$2″| tail -1| cut -c 88-|cut -f1 -d’ ‘

Просто в этой статье для zabbix_agent 3.4 этот параметр не прописан и я слепо следовал инструкции, думая, что так и надо 🙂

возрадуемся же милости высших сил, ибо озарило нас лучами небесными, развеяло тьму и увидели мы свет
хотя может об этом уже всем известно, но вдруг кто не в курсе 🙂
в общем сегодня ставил smartmontools и вот, там появился параметр -j, выводит все в json, и вместо перлового скрипта
можно использовать строку:
smartctl —scan -j | sed ‘s/»name»/»<#DISKNAME>«/g’ | sed ‘s/»devices»/»data»/g’

надо в Windows попробовать

День добрый.
Делаю всё как описано выше, работает.
Но когда повторяю тоже самое на серверах где стоит NVME диск (OS WinS 2019), при выполнении .\windows.hdd.ps1 discovery получаю ответ

Хотя когда проверяю в cmd
C:\Program Files\smartmontools\bin>smartctl —scan-open /dev/sda -d nvme # /dev/sda, NVMe device /dev/sdb -d nvme # /dev/sdb, NVMe device

софт их видит.
Вопрос, в чем может быть проблема и куда копать?
На всех остальных серверах с той же OS, но не NVME — всё ок!

Вывод для nvme дисков наверно другой немного, вот он и не парсится скриптом так, как надо. Посмотрите скрипт и подредактируйте под вывод информации со своих дисков.

я не силён в powershell(((
но с того что я понимаю суть тут
$items = c:\»Program Files»\smartmontools\bin\smartctl —scan-open | where <$_ -match "/dev/sd">

write-host -NoNewline » <"
write-host -NoNewline «»data»:[«

форма где всё работает
/dev/sda -d ata # /dev/sda, ATA device
/dev/sdb -d ata # /dev/sdb, ATA device

форма где не работает
/dev/sda -d nvme # /dev/sda, NVMe device
/dev/sdb -d nvme # /dev/sdb, NVMe device

со скрипта вижу, что идёт поиск совпадений <$_ -match "/dev/sd">
что в обычных, что в NVME глобально начало одинаковое
что именно нужно подправить?
подскажите, если есть возможность, буду ооочень благодарен

Вот тут https://github.com/v-zhuravlev/zbx-smartctl свежая версия шаблона и скриптов под мониторинг всех современных дисков. Советую попробовать, может получится настроить.

Разобрался.
Суть:
В скрипте идет поиск девайсов, потом проверка на включенный смарт, а потом только он отдает список девайсов.
По скольку в NVME нет смарта, то и ответа нет, и совершенно другой метод сбора инфы.
Я поправил скрипт и темплейт под NVME, всё чудно заработало.
Кому если нужно, могу без проблем поделиться!

не могли бы вы поделиться сценарием?
Я не знаю, правильно ли это написано, я бразилец ..

Если можно, поделитесь скриптом, а то Samsun 970 evo + никак не отдаётся, а в скриптах я не силён ((
Заранее благодарен.

PS: В идеале нужен скрипт для всех винтов сразу HDD + SSD nVME + SAS

А под ESXi есть скрипт собирающий состояние nvme ??

Скрип не экспортировался на сервер пока не поменял в нем версию скрипта на свою. Стоит 3.0, но при экспорте вылетает ошибка Invalid tag «/zabbix_export/templates/template(1)»: unexpected tag «httptests». Что это может быть, как поправить ? Или этот скрипт не работает и его надо переделывать для 3.0?

Не могу нормально импортировать шаблон в 4.4, ошибок нет, шаблон появляется, но элементы данных и триггеры пусты

Только что проверил, нормально импортируется в 4.4. В элементах данных и триггерах пусто, потому что тут используются правила обнаружения.

Добрый день! Всё настроил, за исключением финального этапа. данные не попадают в базу. версия 4.0
zabbix_get всё принимает и показывает. А на этом же сервере находится заббикс сервер. вот он данные полученные из скрипта просто не принимает в свою базу. Пустота.
Пинг и прочие стандартные параметры в базу заббикса попадают

Сам отвечу. 3 дня мудохался. Но нашел то, что мешало. Прочитал логи сервера заббикса и увидел что действительно не получает данные заббикс, хотя команды выполняются. Был небольшой таймаут в логах сервера. Поставил на максимум. Перезапустил сервер. И заработало.

Таймаут штука опасная. Я тоже часто зависал над такими проблемами. Теперь всегда слежу за таймаутами везде.

Доброго времени суток.
А есть возможность мониторить смарт на хосте VMWARE ESX(i)? Единственное что нашел это некое решение для серверов HP с их контроллерами, а у меня все на SuperMicro ..

Не знаю, не разбирался. С учетом того, что обычно ESXI ставят на железные рейды, инфу надо брать с них ту, что они могут отдавать. По идее, надо ставить драйвер контроллера для VMWARE, тогда вся информация по дискам будет в панели управления гипервизором. Оттуда уже ее можно забирать. ESXI вроде по snmp умеет отдавать информацию. Точно не знаю, я очень мало знаком с ESXI, надо разбираться.

В целом статья рабочая. Только что настроил по ней пачку windows серверов. Причем мониторятся диски, собранные в intel raid на материнской плате. Их имена не /dev/sda, /dev/sdb, а /dev/csmi0,0 /dev/csmi0,1 и т.д. Из-за запятой в названии, добавляется неудобство, но я в итоге все настроил, изменив скрипт на клиенте. Если кому-то нужно, обращайтесь, дам измененный скрипт.

Содержимое этого файла /etc/zabbix/zabbix_agentd.d/smart.conf для zabbix-agent 4.2.3 есть у кого?
Никак не могу настроить 🙁

Поделитесь пожалуйста исправленным скриптом, очень сильно доставляет неудобство наличие запятой в названии при мониторинге csmi дисков.

Здравствуйте. Настраивал zabbix почти весь по Вашей статье, дошел до установки скрипта мониторинга на сервере у меня такой расклад- C:\Program Files\smartmontools\bin>smartctl —scan-open
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device
Подскажите, что нужно подправить в Вашем скрипте, я так понял, там проблемы с запятыми в диcках? Спасибо!

Вот он с работающего сервера — https://yadi.sk/d/SlseG8AM32iqQA
Единственное, только не понимаю, почему с одного компьютера при открытии в файле нормальное форматирование, а с другого куча лишних пустых строк появляются.

zabbix_get -s 192.168.1.78 -k ZScript[sda,capacity]
Получаю вот такое.
Не удается загрузить файл C:\asu\smart_hdd.ps1, так как выполнение скриптов запрещено для данной системы. Введите «get-help about_signing» для получения дополнительных сведений.
строка:1 знак:21
+ C:\asu\smart_hdd.ps1 Zerox

Какие тут еще идеи нужны, если прямым текстом написано: «Не удается загрузить файл C:\asu\smart_hdd.ps1, так как выполнение скриптов запрещено для данной системы.» Нужно решать эту проблему.

Читайте также:  Команда для linux sudo

а если напрямую писать?

UserParameter=ZScript[*],powershell -NoProfile -ExecutionPolicy UnRestricted -File C:\zabbix\scripts\windows.hdd.ps1 $1 $2

Alex, спасибо. Так заработало!

Более простое и элегантное решение этой задачи тут:
«Zabbix: LLD-мониторинг дисков без UserParameter и скриптов на агентах»
https://habr.com/post/344548/

Да, на вид все гораздо проще и удобнее. Надо будет проверить при случае.

Добрый день Владимир. Проверяли ли вы работоспособность решения, описанного в этой статье: «Zabbix: LLD-мониторинг дисков без UserParameter и скриптов на агентах» https://habr.com/post/344548/ и если да то поделитесь Вашей оценкой. Дело в том, что данный способ мне подходит больше поскольку ПК агентов имеют слабые характеристики. При применении это способа мониторинга смарта шаблон активный но не создает itemы. Ваше решение работает отлично.

прошу прощения за «Аноним»

Да, я проверил и постоянно использую, но немного для других метрик, хотя принцип тот же. Мне понравился метод без агентов.

Для того чтобы ошибка «Value should be a JSON object» исчезла и данные по «Windows-дискам» начали поступать в систему мониторинга, прошу автора данной статьи внести следующие коррективы в раздел «Мониторинг SMART и температуры диска в Windows».

1. После слов «Timeout=15» добавить текст:
«Теперь нужно внести коррективы в строку «PATH» системных переменных. Для этого открываем «Панель управления – Система и безопасность – Система – Дополнительные параметры – Переменные среды» и переходим в «Системные переменные» (нижняя часть). Далее ищем там строку под названием «PATH» и добавляем (двойной щелчок или нажимаем кнопку «Изменить») в конец следующие параметры «%systemroot%\System32\WindowsPowerShell\v1.0\;» и «C:\Program Files\smartmontools\bin» разделяя их (без пробелов. ) точкой с запятой!

В итоге у нас ВСЯ строка будет выглядеть так:
%SystemRoot%\system32;%SystemRoot%;%SystemRoot%\System32\Wbem;%systemroot%\System32\WindowsPowerShell\v1.0\;C:\Program Files\smartmontools\bin

Для того чтобы изменения вступили в силу – нужно перезагрузить «машину» (компьютер/ноутбук).

Далее идем на сервер Zabbix и проверяем предоставление Zabbix-агентом результатов работы нашего PowerShell-скрипта. Для этого запускаем терминал и вводим следующие команды:

sudo zabbix_get -s «192.168.25.11» -k ZScript[sda,status]

sudo zabbix_get -s «192.168.25.11» -k ZScript[sda,capacity]

где 192.168.25.11 – адрес нашего клиентского компьютера под ОС «Windows», на котором мы только что настроили Zabbix-агент.

Результатом успешного выполнения приведённых выше команд будет отображение статуса и объёма Вашего диска клиентского компьютера.

2. Далее заменяем предложение «На сервере делать ничего не надо, так как все сделал за вас я.» на «После этого заходим в веб-интерфейс управления Zabbix-сервера и импортируем нужный нам шаблон.»

Сам бился над этой проблемой не одну неделю. Потом ввёл в терминале Zabbix-сервера команды:
sudo zabbix_get -s «192.168.25.11» -k ZScript[sda,status]

sudo zabbix_get -s «192.168.25.11» -k ZScript[sda,capacity]

В результате они постоянно выдавали мне непонятные «крякозябры». Чтобы понять, в чём же дело, перенаправил их вывод в отдельный текстовый файл. Затем скопировал его на компьютер с ОС «Windows» и с помощью программы «AkelPad» подобрал правильную кодировку – ею оказалась кодировка «OEM-866». В итоге получил такой текст «»powershell» не является внутренней или внешней командой, исполняемой программой или пакетным файлом.»

Так что НИКАКИХ изменений ни в шаблон и ни PowerShell-скрипт для «мониторинга SMART и температуры диска в Windows» вносить НЕ НУЖНО, Необходимо лишь добавить только два параметра в строку «PATH» «Системных переменных» (см. выше).

Спасибо за понимание!

Спасибо, была такая же ошибка, помогло ваше решение

Спасибо всем за отличную статью.
Использую скрипт уважаемого SnowBars

При запуске скрипта ошибки такого вида:
\SmartScanZabbixAgent.ps1:7 char:22
+ $items = $smartctl —scan-open | where <$_ -match "/dev/sd">
+

Unexpected token ‘scan-open’ in expression or statement.
At SmartScanZabbixAgent.ps1:14 char:17
+ if (($smartctl -i -d sat $obj.substring(0,8) | where <$_ -match "SMART support .
+

Unexpected token ‘-i’ in expression or statement.
At SmartScanZabbixAgent.ps1:14 char:20
+ if (($smartctl -i -d sat $obj.substring(0,8) | where <$_ -match "SMART support .
+

Unexpected token ‘-d’ in expression or statement.
At SmartScanZabbixAgent.ps1:14 char:19
+ if (($smartctl -i -d sat $obj.substring(0,8) | where <$_ -match "SMART support .
+

Missing closing ‘)’ in expression.
At SmartScanZabbixAgent.ps1:14 char:23
+ if (($smartctl -i -d sat $obj.substring(0,8) | where <$_ -match "SMART support .
+

Unexpected token ‘sat’ in expression or statement.
At SmartScanZabbixAgent.ps1:14 char:23
+ if (($smartctl -i -d sat $obj.substring(0,8) | where <$_ -match "SMART support .
+

Missing closing ‘)’ after expression in ‘if’ statement.
At SmartScanZabbixAgent.ps1:13 char:26
+ foreach ($obj in $items) <
+

Missing closing ‘>’ in statement block.
At SmartScanZabbixAgent.ps1:6 char:5
+ try <
+

Missing closing ‘>’ in statement block.
At SmartScanZabbixAgent.ps1:14 char:94
+ . t is: Enabled»>) -ne $null) <
+

The Try statement is missing its Catch or Finally block.
At SmartScanZabbixAgent.ps1:5 char:25
+ if ($1 -eq «discovery») <
+

Missing closing ‘>’ in statement block.
Not all parse errors were reported. Correct the reported errors and try again.
+ CategoryInfo : ParserError: (:) [], ParentContainsErrorRecordException
+ FullyQualifiedErrorId : UnexpectedToken

Кто-нибудь с таким ?

Скорее всего что-то с путями, потому что эти ошибки говорят о том, что Posh не может запустить утилиту samrtctl. Соответственно, все ее ключи так же вызывают ошибки. Смотрите, откуда запускается smartmontools и куда обращается скрипт powershell.

Спасибо за отличную статью!

Внес немного правок
1) Поскольку в пути к з\а есть пробел, моя строка в userparameter файле выглядит так:
UserParameter=ZScript[*],powershell.exe -file «C:\Program Files\Zabbix_Agent\scripts\windows.hdd.ps1» «$1» «$2»

2) Дабы всё работало, когда агент запущен под «local system», чуть поправил ps1 файл:
в начале объявим «$smartctl=’C:\Program Files\smartmontools\bin\smartctl.exe'»
а после заменим все вхождеия «smartctl» на «& smartctl»
ИМХО это сделало скрипт чуть более универсальным.

Ну и для удобства дебагинга в отловке ошибок «catch » вместо «catch «.
Тогда и стало понятно, что local system не видит systemctl.

Отлично, спасибо за замечания по существу.

После примерно недели танцев с бубном я-таки запустил это. Но:
1) в userparameter файла zabbix_agetnd.cinf надо вписывать не ту строку, как указано, а
ZScript[*],powershell -File [путь к файлу-скрипту *.ps1] «$1» «$2»
Иначе это не работает.
2) одного скрипта мне было недостаточно, так как он не может работать не с ata дисками, чтобы он умел работать с sat дисками, его надо скопировать, и добавить в команды к smartctl ключ -d sat, иначе он их просто не найдет. Так же можно сделать еще и для scsi дисков, но скорее всего они будут в raid, и до них все равно не достучаться, так что это избыточность. После чего надо добавить в userparameter еще один скрипт новой строкой и рестартануть службу zabbix agent. У себя я использовал для всего этого Kix.
3) переменная path не нужна, если: в скрипте поменять smartctl на полный путь к файлу c:\smartmontools\smartctl.exe к примеру. И в этом случае можно просто скриптом раскидать на все нужные ПК папку с дистрибутивом smartmontools x32 версии и обращаться к ней в скрипте. у меня в сети есть как х32 так и х64 ОСи, так что я взял распакованную х32 прогу и стартовым скриптом рассовал ее по всем машинам.
4) шаблон так же надо скопировать, переименовать и переделать для sat дисков. Для этого можно открыть его блокнотом и автозаменой пройтись по ZScript заменив на ZScript_sat к примеру. Так же в шаблоне косяк с триггерами, у них нет выражения восстановления. То есть если они сработали, то они не исчезнут до тех пор, пока не будет отключен хост и не будут удалены его данные по таймауту, указанному в прототипе элемента данных. Прототипы триггреов независимы, даже на один и тот же элемент данных. Это все тоже пришлось править. Мелочи, но когда из прототипов будут делаться элементы и триггеры их придется править вручную, а если хостов, как у меня в сети, 700 штук — это уже проблема.
5) чтобы диски начали обнаруживаться, надо хосты прицепить к шаблонам (это и так понятно, но мало ли). В виртуалках это не будет работать по понятным причинам отсутствия raid в виртуальных дисках. С raid-контроллерами smartmontools так же работать не умеет, что логично. У меня она даже статус smart не смогла считать. Тут можно прикрутить к Заббиксу мониторинг ssh, но это совершенно другая история

Спасибо за полезную инфу. Такого рода настройки никогда не работают из коробки для всех. Очень много нюансов. Это скорее план к действию с чужим опытом. А на месте уже вносятся свои правки.

Конечно! Я потому и отписал все свои злоключения, чтобы кому-то помочь и упростить жизнь.
BTW, спасибо за статью.

Уважаемый SnowBars!
Поделитесь, пожалуйста своими рабочими (модифицированными) скриптами и шаблоном!

Оцените статью