O4 - Plataforma Definitiva de Observabilidad¶
Arquitectura objetivo implementada en repo al 2026-06-01.
Objetivo¶
Consolidar una plataforma que sirva hoy para el VPS actual y mañana para OpenClaw, Orchestrator, WooCommerce, BI, finanzas y multiples nodos sin rediseñar Grafana ni perder historico.
Flujo rector¶
Grafana -> Thanos Query -> (Thanos Sidecar + Thanos Store Gateway) -> Prometheus + Objstore local
Componentes¶
Prometheus: scrape, reglas y hot data localThanos Sidecar: expone StoreAPI y sube bloques al objstoreThanos Query: capa unica de consulta para GrafanaThanos Store Gateway: rehidrata historico desde el objstoreThanos Compactor: compacta y aplica retencion al objstoreGrafana: visualizacion y carpeta permanente 01-10Alertmanager: notificacion real por SMTP corporativoNode Exporter,cAdvisor,Blackbox Exporter: captura base del host y servicios
Decisiones cerradas¶
- Grafana no consulta
Prometheusdirecto - el historico se construye desde el primer dia
- la retencion local de
Prometheusqueda corta y economica - Decision inicial
2026-06-01: Opcion A con historico local persistente en el VPS - el volumen
obs_thanos_objectstore_dataes la verdad historica inicial - la organizacion Grafana se versiona en Git
- secretos y credenciales quedan fuera del repo
Persistencia¶
obs_prometheus_dataobs_grafana_dataobs_alertmanager_dataobs_thanos_storegateway_dataobs_thanos_compactor_dataobs_thanos_objectstore_data
Objstore inicial¶
Implementacion inicial cerrada:
- tipo:
FILESYSTEM - volumen Docker:
obs_thanos_objectstore_data - ruta dentro de
Thanos:/var/thanos/objstore - archivo de config versionado:
infra/observability/thanos/filesystem-bucket.yml
Bucket recomendado a futuro¶
Clase esperada:
S3 compatible- versionado recomendado
- credenciales tecnicas dedicadas
- lifecycle controlado por politicas del proveedor y Thanos Compactor
El repo incluye un ejemplo en:
infra/observability/thanos/bucket-config.example.yml
Retencion¶
- local Prometheus:
2dy8GBpor default, ajustable por.env - Thanos raw:
90d - Thanos 5m:
365d - Thanos 1h:
1825d
Escalabilidad prevista¶
Para agregar nuevos nodos o Prometheus:
- desplegar exporters o Prometheus adicional
- sumar
external_labelsunicos - conectar su
sidecaral mismo bucket - agregar nuevo
--store=athanos-query
Grafana no cambia de arquitectura.
Operacion¶
- acceso humano:
Grafanapor127.0.0.1:3000o tunel SSH - acceso maquina a maquina:
solo
obs-observability-internal - fuente de dashboards: Git
- fuente de historico: objstore local de Thanos
Riesgos conocidos¶
- si se pierde el VPS sin backup externo reciente, se pierde el historico de
Thanos - Opcion A no reemplaza un storage externo durable
- sin secreto SMTP real,
Alertmanagerno puede enviar correo cAdvisormantiene mounts sensibles del host- la carpeta 03-09 arranca con dashboards semilla y debe poblarse a medida que entren exporters y metricas de negocio