check_mem (linux)

Agregamos el plugin a la configuracion

 

Creamos el script:

check_load (linux)

Este script, se ejecuta mediante SSH. Es decir, hay que ponerlo en la maquina que queremos monitorear, y luego crear (como fue explicado aquí mismo) y nuevo service check  de check by ssh y ejecutar este script.

ESXi

ESXTOP

Primero daremos una introducción de como parsear la salida del plugin ESXTOP para ESXi.

El comando ESXTOP nos da muchísima información. Pero no lo vamos a ver acá más de lo que voy a nombrar, ni muy en profundidad.

Minimizar salida del esxtop

Basicamente lo que hacemos es pasarle un archivo de config al esxtop que nos dice que queremos extraer.

https://mbrownnyc.wordpress.com/2013/08/23/minimizing-esxtop-output-for-targetted-stats-captures/

http://serverfault.com/questions/303471/limiting-output-of-esxtop-in-batch-mode

Para el llegado caso, vamos a mostrar lo menos posible. Entramos al esxtop y para cada vista, sacamos todo. (apretando f en cada vista). Y guardando con W

Archivo de config

The first eight lines contain lowercase and uppercase letters to specify which fields appear in which order on the CPU, memory, storage adapter, storage device, virtual machine storage, network, interrupt, and CPU power panels. The letters correspond to the letters in the Fields or Order panels for the respective esxtop panel.

Las que estan en minuscula no aparecen, las mayus si.

  • En servidor ESXi

NOTA:  Aunque reduzcamos la info mostrada, la cantidad de columnas base no se puede reducir,es decir, vamos a tener siempre un minimo.

  • En servidor esxi

[root@esxi-01:] esxtop -b -c /tmp/esxcfglight -d 5 -n 1 > /tmp/esxcfglight.csv

Este último te genera un csv, que si lo abrimos en excel tiene esta pinta

captura-de-pantalla-de-2017-01-17-114816

  • Nos copiamos el archivo a nuestra pc, y lo abrimos con excel, y vemos el numero de columna que nos interesa y la extraemos con:

“\IG100\Physical Cpu Load\Cpu Load (1 Minute Avg)”

“0.33”

“\IG100\Physical Cpu Load\Cpu Load (5 Minute Avg)”

“0.36”

“\IG100\Physical Cpu Load\Cpu Load (15 Minute Avg)”

“0.34”

“\IG100\Memory\Machine MBytes”

“130943”

NOTA: Las posiciones estas acá arriba no van a ser siempre las mismas, por ejemplo si el srv tiene 24 cores o 32, cambian.

Por ejemplo en vez de 83,86 y 95. Pasara a a ser 107 , 110, 123

  • Hacemos los scripts que listamos más abajo, probamos y luego añadimos el servicio que ejecuta este script mediante ssh, como se explico en el post:

 

MEMORY OK – Total: 130943 MB – Used: 38466 MB – 29% used – Swap: 0 MB used

MEMORY WARNING – Total: 49141 MB – Used: 41749 MB – 84% used – Swap: 0 MB used

MEMORY OK – Total: 49141 MB – Used: 30657 MB – 62% used – Swap: 0 MB used

  • Hacemos los service checks, y los agregamos a los monitores de los hosts (como explicamos en otra post: Opsview: tareas

REQUISITO

Tener la llave RSA en el servidor monitoreado. En este ejemplo, voy a monitorear 3 servidores.

En el servidor donde corremos opsview:

 

MONITOREAR DISCOS

Discos

https://exchange.nagios.org/directory/Plugins/Operating-Systems/Linux/Check-all-system-disks-via-ssh-with-check_disks/details

Explique como agregarlo en el post: Opsview-Nagios : Plugins y algunas tareas.

Plugin check_esx_load.sh

 

Plugin check_esxi_mem_24cpu.sh

 

Plugin check_esxi_mem_32cpu.sh