Saltar a contenido

Alertmanager

  • Que es: el enrutador de alertas.
  • Para que sirve: recibe alertas de Prometheus, las agrupa y decide a que receiver ir.
  • Donde corre: stack /opt/stacks/observability en el VPS.
  • Contenedor asociado: obs-alertmanager.
  • Red Docker: obs-observability-internal.
  • Volumenes asociados: obs_alertmanager_data, alertmanager.yml, entrypoint.sh y secreto alertmanager_smtp_password.
  • Puertos: 9093/tcp interno, no publicado al host.
  • Depende de: obs-prometheus para recibir alertas y del secreto SMTP si se quiere correo real.
  • Quien depende de el: toda la capa de alertas O3/O4.
  • Que metricas aporta: metricas propias de Alertmanager en job=alertmanager.
  • Que alertas lo protegen: PrometheusTargetDown si deja de responder a Prometheus.
  • Que dashboards lo usan: Service Availability y Executive Overview dependen indirectamente de que la capa de alertas siga sana; no hay dashboard dedicado solo a Alertmanager.
  • Como validar que esta bien: consultar /-/ready y /api/v2/status.
  • Que hacer si falla: revisar logs, el archivo generado por entrypoint.sh, el secreto SMTP y el volumen obs_alertmanager_data.

Realidad actual importante

  • Hoy puede arrancar en modo local-null si falta el secreto SMTP real.
  • Eso significa que la tuberia de alertas existe, pero el canal externo puede seguir pendiente.

Recovery corto

Si falla solo el correo, no hace falta tirar abajo todo O4. Primero confirmar si el receiver activo sigue siendo local-null o si el problema es el secreto SMTP.