Hay una frase que repetimos mucho en el NOC: si tu cliente te avisa que el servicio está caído, tu monitoreo ya falló. La diferencia entre un proveedor amateur y uno profesional no es que nunca se le caiga nada — es quién se entera primero.

Por qué Zabbix

Existen decenas de herramientas de monitoreo, pero Zabbix sigue siendo nuestra elección para infraestructura: open source, maduro (más de 20 años de desarrollo), escala desde 10 hasta decenas de miles de dispositivos y monitorea prácticamente cualquier cosa: servidores Linux y Windows con agente, equipos de red por SNMP, servicios web, certificados SSL, bases de datos.

Los tres niveles del monitoreo

1. Disponibilidad

Lo básico: ¿el equipo responde? ¿El servicio escucha? Es lo primero que se configura y lo que corta el 80% de los papelones.

2. Rendimiento y tendencias

CPU, memoria, disco, tráfico de interfaces. Acá aparece el verdadero valor: ver que un disco se llena antes de que se llene, o que un enlace viene saturando todos los días a las 20hs.

3. Alertas inteligentes

El arte está en alertar lo justo: escalamiento (primero al técnico de guardia, después al responsable), dependencias (si se cae el router de la sucursal, no quiero 40 alertas de los equipos detrás) y ventanas de mantenimiento.

Errores comunes que vemos

  • Monitorear todo con la misma criticidad: termina todo en rojo y nadie mira el tablero.
  • Alertas sin acción asociada: si una alerta no implica que alguien haga algo, es ruido.
  • No monitorear el monitoreo: ¿quién te avisa si Zabbix se cae?

Si querés montar esto en tu empresa o tu ISP, en el curso presencial de Zabbix armamos un sistema completo desde cero: agentes, SNMP sobre equipos MikroTik reales, templates, alertas por Telegram y dashboards de NOC.