Alertmanager¶
- Que es: el enrutador de alertas.
- Para que sirve: recibe alertas de Prometheus, las agrupa y decide a que receiver ir.
- Donde corre: stack
/opt/stacks/observabilityen el VPS. - Contenedor asociado:
obs-alertmanager. - Red Docker:
obs-observability-internal. - Volumenes asociados:
obs_alertmanager_data,alertmanager.yml,entrypoint.shy secretoalertmanager_smtp_password. - Puertos:
9093/tcpinterno, no publicado al host. - Depende de:
obs-prometheuspara recibir alertas y del secreto SMTP si se quiere correo real. - Quien depende de el: toda la capa de alertas O3/O4.
- Que metricas aporta: metricas propias de Alertmanager en
job=alertmanager. - Que alertas lo protegen:
PrometheusTargetDownsi deja de responder a Prometheus. - Que dashboards lo usan:
Service AvailabilityyExecutive Overviewdependen indirectamente de que la capa de alertas siga sana; no hay dashboard dedicado solo a Alertmanager. - Como validar que esta bien: consultar
/-/readyy/api/v2/status. - Que hacer si falla: revisar logs, el archivo generado por
entrypoint.sh, el secreto SMTP y el volumenobs_alertmanager_data.
Realidad actual importante¶
- Hoy puede arrancar en modo
local-nullsi falta el secreto SMTP real. - Eso significa que la tuberia de alertas existe, pero el canal externo puede seguir pendiente.
Recovery corto¶
Si falla solo el correo, no hace falta tirar abajo todo O4. Primero confirmar
si el receiver activo sigue siendo local-null o si el problema es el secreto
SMTP.