Cpu jumps zabbix что это

Cpu jumps zabbix что это

Задача: разобрать как поставить на мониторинг сам сервер на котором развернута система мониторинга Zabbix

http://IP&DNS/ — авторизуюсь под Административной учетной записью:

Login:admin

Password:zabbix

после ConfigurationHosts – Выделяем текущий хост он же сам сервер где сейчас установлено приложение Zabbix и обращаем внимание на колонку Status, сейчас выставлен статус не мониторить ( Not monitored)

Поправляю это дело:

Нажимаем левой кнопкой мыши на Not monitored – на запрос Включить хост — отвечаю OK

После чего статус примет вид — поставлено на мониторинг и уже с учетом дефолтных настроек начнется сбор статистических данных : ( если же страница не приняла вид который ниже, просто следует немного подождать и обновить содержимое страницы нажатием функционнальной клавиши F5)

ConfigurationsHosts — статус у хоста поменялся на (Availability — Z)

Проверить, что сбор осуществляется:

Monitoring – Graphs —

Group: выбираю Zabbix servers

Host: Zabbix server

Graph: CPU jumps (к примеру)

и уже сейчас наблюдаю строящийся график по собираемым данным.

, как видно даже после установки и активации хоста можно собирать некоторые данные и самое главное отображаться их в более наглядном выражении, а именно график. Ни что так не увеличивается полезность, как графическое представление собираемых статистических данных. Работает.

Чтобы увеличить количество собираемых метрик, можно для текущего хоста применить шаблон ( Template) который содержит различные указания на мониторинг тех или иных метрик.

К примеру, для текущего хоста Zabbix добавлю шаблон:

ConfigurationHost Groups – нахожу Zabbix servers и щелкаю по Хост группе Zabbix servers ( ниже специально выделил)

Теперь, добавляю к Хост группе дополнительные шаблоны

После проверяю, какие виды графиков доступы. И их стало намного больше чем было до этого, посмотреть которые можно следующим образом:

Читайте также:  Gtx 660 ti boost

Monitoring – Latest data

Group: выбираю Zabbix servers

Host: выбираю Zabbix server и ниже вижу категории (к примеру: CPU,Filesystems,General,Memory и т.д) развернув которые можно видеть, что включено, а также с последующем представлением, как в виде простой истории, так и в виде графика:

Допустим разверну категорию Memory и сформирую график по Available memory

В последующих заметках я буду знакомить, а также самостоятельно разбираться как настраивать, устранять ошибки в данной системе мониторинга, как Zabbix. Мне лично данная система больше нравиться чем Nagios, кою я использовал много много лет тому назад в одной интересной конторе. Так вот сейчас я потихоньку перехожу на новый уровень и хоч у расписать все шаги настройки сервисов установленных на мониторинг применительно к Zabbix и решению своих потребностей с целью предотвращения проблем в будущем. А пока все, до встречи с уважением автор блога — ekzorchik.

Используйте прокси ((заблокировано роскомнадзором, используйте vpn или proxy)) при использовании Telegram клиента:

Поблагодари автора и новые статьи

будут появляться чаще 🙂

Карта МКБ: 4432-7300-2472-8059
Yandex-деньги: 41001520055047

Большое спасибо тем кто благодарит автора за практические заметки небольшими пожертвованиями. С уважением, Олло Александр aka ekzorchik.

I have the following default chart in zabbix, but I have no idea how to interprete these values. Can anyone explain?

1 Answer 1

An OS is a very busy thing, particularly so when you have it doing something (and even when you aren’t). And when we are looking at an active enterprise environment, something is always going on. (From Wikipedia: zabbix "is designed to monitor and track the status of various network services, servers, and other network hardware.")

Читайте также:  Assassin origin системные требования

Most of this activity is "bursty", meaning processes are typically quiescent with short periods of intense activity. This is certainly true of any type of network-based activity (e.g. processing PHP requests), but also applies to OS maintenance (e.g. file system maintenance, page reclamation, disk I/O requests). I won’t even get into modern power saving technologies.

If you take a situation where you have a lot of such bursty processes, you get a very irregular and spiky CPU usage plot.

PS As “500 – Internal Server Error” says (love that handle!), the high number of context switches are going to make the situation even worse.

PPS The physics nerd in me just has to mention that this is a very common phenomenon in situations where you have a somewhat large number of bursty events (say particle collisions or atomic decay). Once you get into an extremely large number of such events (think Avogadro’s Number), things smooth out.

Приведу пример мониторинга использования каждого ядра процессора используя Zabbix.

Допустим на высоконагруженном NAT сервере основная нагрузка от softirq, присутствует один процессор с 8 ядрами, а также на сервере установлен Zabbix агент.
И чтобы увидеть равномерно ли распределены прерывания сетевого адаптера по ядрам процессора, создадим элементы данных на Zabbix сервере, в которых укажем:
Тип: Zabbix агент
Тип информации: Числовой (с плавающей точкой)
Единица измерения: %
А также ключ:

Где 0 — номер процессора, softirq — тип нагрузки, avg5 — средняя нагрузка за 5 минут. Аналогично создадим элементы данных для других ядер процессора с ключами, а также добавим их на один график:

Вместо softirq можно указать idle, nice, user (по умолчанию для Linux), system (по умолчанию для Windows), iowait, interrupt, softirq, steal, guest, guest_nice.
А вместо avg5 можно указать: avg1 (среднее за одну минуту, по умолчанию) или avg15 (среднее за 15 минут).

Читайте также:  Hyperx predator rgb ddr4 2933 32gb

Чтобы не указывать ядра процессоров вручную, можно создать правило обнаружения:

И указать в нем элемент данных, например:

Также можно создать триггер, чтобы узнать когда значение будет больше 90:

Ниже приведу примеры элементов данных, которые отображают различную информацию о CPU, кстати эти элементы данных по умолчанию присутствуют в шаблоне «Template OS Linux».

Processor load (1 min average per core):

Processor load (5 min average per core):

Processor load (15 min average per core):

Interrupts per second:

Context switches per second:

CPU interrupt time:

CPU iowait time:

CPU softirq time:

CPU system time:

Смотрите другие мои статьи в категории Zabbix.

Ссылка на основную публикацию
Adblock detector