Saltar a contenido

O9.6 - Executive Infrastructure Board

Fecha de ejecucion: 2026-06-01

Objetivo

Dejar una pantalla ejecutiva unica en Grafana para saber rapido si la infraestructura esta bien, usando solo el datasource oficial Thanos.

Dashboard provisionado

  • titulo: Executive Infrastructure Board
  • archivo: infra/observability/grafana/dashboards/10-executive-board/o96-executive-infrastructure-board.json
  • carpeta Grafana: 10 - Executive Board
  • datasource: Thanos
  • uid: o96-executive-infrastructure-board

Que muestra

  • Estado VPS
  • CPU
  • RAM
  • Disco /
  • Docker
  • OpenClaw
  • Knowledge Portal
  • Grafana
  • Portainer
  • Prometheus
  • Thanos
  • Alertmanager
  • Alertas activas
  • Targets UP
  • Targets DOWN
  • Certificados SSL - minimo dias restantes
  • Servicios publicados OK
  • Servicios internos protegidos OK
  • Contenedores vistos
  • tendencias de recursos
  • serie corta de servicios publicados e internos

Fuente de datos usada

Consultas reales sobre metricas existentes en Thanos:

  • host: up{job="node-exporter"}, node_cpu_seconds_total, node_memory_MemAvailable_bytes, node_memory_MemTotal_bytes, node_filesystem_avail_bytes, node_filesystem_size_bytes
  • Docker: up{job="cadvisor"}, container_last_seen
  • servicios internos: up{job="prometheus"}, up{job="alertmanager"}, up{job=~"thanos-query|thanos-sidecar|thanos-storegateway|thanos-compactor"}
  • probes publicas: probe_success, probe_ssl_earliest_cert_expiry
  • alertas: ALERTS{alertstate="firing"}

Ajuste necesario para cubrir servicios publicados

Para que el tablero muestre tambien Knowledge Portal, Grafana y Portainer publicados sin inventar metricas, se amplia la configuracion real de blackbox-http en:

  • infra/observability/prometheus/targets/blackbox-http-targets.json

Targets publicos medidos:

  • https://openclaw.alpuntodeventa.com.ar/
  • https://doc.alpuntodeventa.com.ar/
  • https://grafana.alpuntodeventa.com.ar/
  • https://portainer.alpuntodeventa.com.ar/

El probe local de admin de NPM se mantiene aparte como target interno.

Reglas y limites

  • no conecta Grafana directo a Prometheus
  • no publica Prometheus, Thanos Query ni Alertmanager
  • no agrega secretos al repo ni al dashboard
  • no inventa metricas fuera de las ya observadas

Pendientes explicitos

  • el tablero no muestra costo, negocio ni transacciones porque no existen metricas de ese tipo en O9
  • el estado de Portainer del tablero refleja la URL publica por blackbox y el runtime local por cadvisor; no modela login exitoso

Validacion esperada en VPS

  1. copiar o sincronizar desde Git los archivos de infra/observability/
  2. recargar Prometheus para tomar los nuevos targets
  3. recrear o reiniciar Grafana si hace falta reprovisionar dashboards
  4. abrir: https://grafana.alpuntodeventa.com.ar/
  5. confirmar:
  6. datasource Thanos en OK
  7. dashboard visible en 10 - Executive Board
  8. paneles renderizando sin error de datasource