FATALnv Jun 30 2014 at 08:39

Zabbix 2.2: Мониторинг температуры процессора Windows машины

4 min

133K

Programming*

From sandbox

+17

Comments 22

blind_oracle Jun 30 2014 at 09:44

А через IPMI не проще сливать эти данные? В наше время любой нормальный сервер имеет разновидность out-of-band мониторинга.
Тем более заббикс его из коробки умеет, а в последних версиях даже дискретные сенсоры.

FATALnv Jun 30 2014 at 09:54

Речь как раз идет о рабочих станциях. Ведь предприятие не на одни серверах держится. Мне например важно знать состояние рабочих станций в бухгалтериях от и до.

blind_oracle Jun 30 2014 at 10:17

А, звиняюсь, пропустил. Я просто как-то не заморачиваюсь мониторингом десктопов — юзер сам хороший мониторинг :)

FATALnv Jun 30 2014 at 10:29

Система должна работать так что бы дать юзеру работать продуктивно и избежать простоя в рабочее время. О том что компьютер волшебным образом приведен в порядок, знает журнал выполненных работ и видеонаблюдение. Ведь дороги наиболее продуктивно ремонтируют в двух случаях: когда перекрыта вся дорога или когда работа выполнена ночью в самое разгруженное от трафика время.

Insspb Jun 30 2014 at 09:55

ТУт вроде идея мониторить рабочие станции.

dcvetkov Jun 30 2014 at 15:26

А разве у разных моделей CPU не разные рабочие диапазоны температур? Не получится наложить один шаблон на все наблюдаемые машины с триггерами на превышение нормальных значений. Придется готовить разные шаблоны для каждой модели CPU.

FATALnv Jun 30 2014 at 15:59

Согласен, нужно будет еще немного потрудиться. Настройка триггеров это очень индивидуальное занятие и рекомендуется её продумывать самостоятельно.Здесь находится список максимальных температур. Для начала я предлагаю сделать проверку раз в час. Судя по инвентаризации моих организации большинство пк на процессоре intel в соотношений 1 к 20. Если на протяжении 4 таких измерений температура выше 61, то выставляется предупреждение. Если за 3 измерения 70 уже критическое.

evg_krsk Jul 1 2014 at 01:35

Получится. Можно например параметризировать пороги срабатывания с помощью пользовательских макросов (один в шаблоне и опционально индивидуальный для хоста).

dcvetkov Jul 1 2014 at 01:56

Про макросы согласен. Но проблема остается — я к тому, что очень уж трудоемка следить за парком машин от 1000шт.
В идеале нужно, чтобы программа агент по модели CPU сама решала, перегрелся он уже или нет, и на сервер мониторинга сообщала не температуру, а статус — OK, WARN, CRIT…

Himari Jul 1 2014 at 06:23

В идеале нужно, чтобы программа агент по модели CPU сама решала, перегрелся он уже или нет, и на сервер мониторинга сообщала не температуру, а статус — OK, WARN, CRIT…
Идиотский подход который часто любят пользователи nagios. Решения должны приниматься сервером мониторинга, это даёт гораздо большую управляемость.
Если у вас кондиционер отрубило, а порог срабатывания вы слишком низкий поставили, будете по каждой машине лазить и править его? А потом обратно? Вместо того чтобы изменить значение на сервере мониторинга.

dcvetkov Jul 1 2014 at 06:34

Если наша цель — не допустить перегревания процессора, то в случае выхода из строя кондиционера нужно, как я понимаю, не пороги поднимать, а чинить кондиционер, либо выключать компьютеры.

grundic Jun 30 2014 at 18:32

Проверить не могу, но вдруг это решение окажется для вас удобнее.

grundic Jun 30 2014 at 18:36

Поспешил, температуру он не показывает :(

timsoid Jun 30 2014 at 19:50

А не подскажите вы SMART пробовали мониторить?

linjan Jun 30 2014 at 20:16

SMART на Windows-машинах проверял при помощи консольной smartmontools. Попробуйте.

cawaleb Jul 1 2014 at 03:32

Не большая проблема, похоже не во всех процессорах/материнках есть датчик CPU Package. проверил на 2 компьютерах нету. Напишите в личку результат работы скрипта у вас, попробую переделать скрипт и проверить на разных ОС и процессорах.

FATALnv Jul 1 2014 at 06:14

Я сей час нахожусь в отпуске и кроме виртуальных машин и своего ноутбук ничем не располагаю. Я так же заметил, что на некоторых пк OpenHardwareMonitor определяет скорость вентилятора, но не у меня. Вы хотите сказать, что у вас вообще не считывает температуру процессора или именно CPU Package. Попробуйте заменить в бат файле «CPU Package :» на «CPU Core #1 :» в надежде на то что первое ядро есть в любом процессоре. Вернусь из отпуска, дополним статью подробностями экспериментов.

cawaleb Jul 1 2014 at 10:04

Попробовал переделать батник (терпеть не могу батники, уж очень язык мало-функциональный), и вот что у меня получилось:

@echo off

for /F "usebackq tokens=7-10" %%a in (`C:\OpenHardwareMonitor\OpenHardwareMonitorReport.exe`)  do echo %%b %%c %%d| findstr .*lpc.*\/temperature\/0>nul && set temper=%%a

echo %temper%

Попробовал на нескольких машинах с разными мат. платами, ОС (XP, 2003, 2008, 7) и процессорами ( i5, i7, Fx8350), попробовал сделать более менее универсальным, работает на всем что проверял. Но наверное найдутся платы на которых придётся переделать параметр: tokens=7-10.
Приятно встретить земляка.

Necotyan Jun 5 2015 at 06:41

Не сработало на двухпроцессорной системе. Пришлось выводимые параметры echo "%%b %%c %%d" взять в двойные кавычки. Что собственно правильнее со стороны echo :)

po3dno Sep 16 2014 at 06:58

Можно получать следующим образом через powershell:

param($cpuid)
(Get-WmiObject -Namespace Root\OpenHardwareMonitor -Class sensor | ?{$_.identifier -eq "/intelcpu/0/temperature/$cpuid"}).value

В zabbix_agentd.conf
UserParameter=cpu.temperature[*],powershell.exe C:\scripts\cpuid.ps1 $1

po3dno Sep 16 2014 at 07:07

Как вариант универсального скрипта:

В скрипте:
param($hw, $hwid, $sensor, $sensorid)
(Get-WmiObject -Namespace Root\OpenHardwareMonitor -Class sensor | ?{$_.identifier -eq "/$hw/$hwid/$sensor/$sensorid"}).value

В zabbix_agentd.conf
UserParameter=system.sensor[*],powershell.exe C:\scripts\cpuid.ps1 $1 $2 $3 $4

В zabbix
В item:
key = system.sensor[intelcpu,0,temperature,0]

Весь список можно посмотреть:
(Get-WmiObject -Namespace Root\OpenHardwareMonitor -Class sensor ) | ft Identifier,name,SensorType,Value

ilmenshik Jun 24 2015 at 19:52

Если экранировать и переместить findstr то работает в разы быстрее и не вешает машины:

for /F «usebackq tokens=7-10» %%a in (`OpenHardwareMonitorReport.exe ^| findstr .*lpc.*\/temperature\/0`) do echo %%a