Saltar a contenido

Regression Matrix

Pregunta rectora: si cambio X, que debo probar.

Cambio OpenClaw

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager
  • riesgos: auth degradada, health en rojo, rotura de proxy interno, perdida de persistencia o de la UI publica
  • tests obligatorios: TEST-OPENCLAW-HEALTH-001, TEST-OPENCLAW-AUTH-001, TEST-OPENCLAW-HTTPS-001, TEST-NPM-UPSTREAM-001, TEST-WEBSOCKET-001
  • evidencia requerida: salida de openclaw health --json, agente main, curl HTTPS y upstream
  • criterio PASS/FAIL: PASS si health, auth, upstream y HTTPS quedan verdes; FAIL si cualquiera falla o queda sin evidencia

Cambio NPM

  • servicios impactados: svc-nginx-proxy-manager, svc-openclaw
  • riesgos: caida de TLS, proxy host roto, headers X-Forwarded-* inconsistentes, upstream inaccesible
  • tests obligatorios: TEST-NPM-HTTPS-001, TEST-NPM-UPSTREAM-001, TEST-OPENCLAW-HTTPS-001, TEST-DNS-DOMAIN-001, TEST-WEBSOCKET-001
  • evidencia requerida: curl -I https://openclaw.alpuntodeventa.com.ar/, docker exec nginx-proxy-manager curl -I http://openclaw-gateway:18789/ y resolucion DNS si el cambio toca dominio
  • criterio PASS/FAIL: PASS si NPM sigue entregando HTTPS y alcanza el backend; FAIL si se rompe TLS, dominio o upstream

Cambio DNS

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager
  • riesgos: dominio apuntando al host equivocado, certificados no renovables, downtime publico
  • tests obligatorios: TEST-DNS-DOMAIN-001, TEST-NPM-HTTPS-001, TEST-OPENCLAW-HTTPS-001
  • evidencia requerida: resolucion DNS a 46.202.151.32 y HTTP/2 200 por HTTPS
  • criterio PASS/FAIL: PASS si resuelve al VPS correcto y HTTPS sigue operativo; FAIL si no

Cambio Docker

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: incompatibilidades de runtime, redes rotas, volumenes no montados, Portainer caido
  • tests obligatorios: TEST-OPENCLAW-HEALTH-001, TEST-NPM-UPSTREAM-001, TEST-PORTAINER-HTTPS-001, TEST-RESTORE-STAGING-001
  • evidencia requerida: salud de OpenClaw, reachability de upstream, HTTPS local de Portainer y restaurabilidad vigente de los datos
  • criterio PASS/FAIL: PASS si los tres servicios siguen operativos y el plano de datos queda restaurable; FAIL si se pierde cualquiera de esas garantias

Cambio Ubuntu

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: reboot inesperado, runtime Docker degradado, puertos o mounts sin recuperar, disco insuficiente para el cambio
  • tests obligatorios: TEST-UBUNTU-UPDATES-001, TEST-OPENCLAW-HEALTH-001, TEST-NPM-HTTPS-001, TEST-PORTAINER-HTTPS-001, TEST-DISK-CAPACITY-001, TEST-BACKUP-RECENCY-001
  • evidencia requerida: backup reciente, capacidad de disco, salud post-update de OpenClaw, NPM y Portainer
  • criterio PASS/FAIL: PASS si el host vuelve sano y los servicios criticos siguen operativos; FAIL si el update deja cualquier servicio caido o sin evidencia

Cambio Portainer

  • servicios impactados: svc-portainer
  • riesgos: incompatibilidad con Docker, perdida de acceso admin, drift entre metadata y runtime real
  • tests obligatorios: TEST-PORTAINER-UPDATE-001, TEST-PORTAINER-HTTPS-001, TEST-DOCKER-UPDATE-001, TEST-BACKUP-RECENCY-001
  • evidencia requerida: version previa, version final, backup del volumen y HTTPS local operativo
  • criterio PASS/FAIL: PASS si Portainer sigue accesible y compatible con Docker; FAIL si no

Cambio Imagen Docker

  • servicios impactados: segun imagen afectada: svc-openclaw o svc-portainer o svc-nginx-proxy-manager
  • riesgos: regresion funcional, drift de configuracion, incompatibilidad con datos persistidos
  • tests obligatorios: para OpenClaw: TEST-OPENCLAW-HEALTH-001, TEST-OPENCLAW-AUTH-001, TEST-OPENCLAW-HTTPS-001 para NPM: TEST-NPM-HTTPS-001, TEST-NPM-UPSTREAM-001 para Portainer: TEST-PORTAINER-HTTPS-001
  • evidencia requerida: version observada, salud del servicio y smoke tests del flujo impactado
  • criterio PASS/FAIL: PASS si la imagen nueva conserva salud, acceso y persistencia; FAIL si no

Cambio Backup

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: artefactos incompletos, hashes faltantes, falso sentido de recuperabilidad
  • tests obligatorios: TEST-BACKUP-ARTIFACTS-001, TEST-BACKUP-HASH-001, TEST-RESTORE-STAGING-001
  • evidencia requerida: listado de artefactos, SHA256SUMS, manifest.txt y staging de extraccion
  • criterio PASS/FAIL: PASS si los artefactos se generan, integran y extraen; FAIL si falta cualquiera de esos tres pilares

Cambio Restore

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: orden de restauracion incorrecto, rutas divergentes, runbooks obsoletos
  • tests obligatorios: TEST-RESTORE-STAGING-001, TEST-BACKUP-ARTIFACTS-001, TEST-GOV-DOC-COMPLETE-001
  • evidencia requerida: staging de restore, runbooks alineados y referencias cruzadas consistentes
  • criterio PASS/FAIL: PASS si el restore sigue siendo demostrable y la documentacion refleja el procedimiento real; FAIL si no

Cambio Red Docker

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: upstream roto, aislamiento incorrecto, puertos internos inaccesibles
  • tests obligatorios: TEST-NPM-UPSTREAM-001, TEST-OPENCLAW-HEALTH-001, TEST-PORTAINER-HTTPS-001
  • evidencia requerida: reachability entre contenedores, salud de gateway y acceso local a Portainer
  • criterio PASS/FAIL: PASS si las relaciones de red siguen operativas; FAIL si se rompe conectividad esperada

Cambio Dominio

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager
  • riesgos: DNS incorrecto, TLS roto, dominio no documentado
  • tests obligatorios: TEST-DNS-DOMAIN-001, TEST-NPM-HTTPS-001, TEST-OPENCLAW-HTTPS-001, TEST-GOV-DOC-COMPLETE-001
  • evidencia requerida: resolucion DNS, respuesta HTTPS y catalogos actualizados
  • criterio PASS/FAIL: PASS si el dominio resuelve, sirve HTTPS y queda trazado en Governance; FAIL si no

Revision de vulnerabilidades

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: parches omitidos, puertos administrativos sin justificar, SSL vencido o drift entre exposicion real y documentada
  • tests obligatorios: TEST-SEC-VULN-REVIEW-001, TEST-EXPOSED-SERVICES-001, TEST-PUBLIC-PORTS-001, TEST-SSL-EXPIRY-001, TEST-BACKUP-RECENCY-001
  • evidencia requerida: checklist de seguridad, mapa de exposicion y estado SSL
  • criterio PASS/FAIL: PASS si los riesgos quedan clasificados y con accion clara; FAIL si hay hallazgos sin responsable ni plan

Cambio Cleanup o liberacion de espacio

  • servicios impactados: svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: borrar datos criticos, dejar sin rollback o limpiar artefactos aun necesarios
  • tests obligatorios: TEST-DISK-CAPACITY-001, TEST-BACKUP-RECENCY-001, TEST-GOV-DOC-COMPLETE-001
  • evidencia requerida: objetivo del cleanup, confirmacion de que no es dato critico y estado final del disco
  • criterio PASS/FAIL: PASS si se libera espacio sin tocar datos criticos; FAIL si se compromete restore, configuracion o evidencia

Alta de servicio nuevo

  • servicios impactados: el nuevo svc-*, mas cualquier servicio del que dependa o al que exponga
  • riesgos: falta de inventario, sin backup, sin restore, sin matriz de regresion y sin trazabilidad de red/dominio
  • tests obligatorios: TEST-GOV-DOC-COMPLETE-001 mas los tests especificos de conectividad, health, dominio, backup y restore que apliquen al servicio nuevo
  • evidencia requerida: ficha de servicio, catalogos actualizados, backup, restore y mapeo de pruebas
  • criterio PASS/FAIL: PASS si el servicio nace con documentacion y validacion completas; FAIL si falta cualquiera de esos bloques

Cambio Observabilidad O1

  • servicios impactados: svc-observability-o1, y de forma indirecta svc-openclaw, svc-nginx-proxy-manager, svc-portainer
  • riesgos: targets caidos, dashboards vacios, probe HTTPS falso positivo o crecimiento inesperado de disco
  • tests obligatorios: TEST-O1-PROMETHEUS-TARGETS-001, TEST-O1-GRAFANA-DATASOURCE-001, TEST-O1-GRAFANA-DASHBOARDS-001, TEST-O1-ALERTMANAGER-001, TEST-O1-BLACKBOX-OPENCLAW-HTTPS-001, TEST-O3-PROMETHEUS-RULES-001, TEST-O3-ALERTMANAGER-ROUTING-001, TEST-BACKUP-ARTIFACTS-001
  • evidencia requerida: targets de Prometheus, datasource y dashboards de Grafana, probe HTTPS de OpenClaw, reglas O3 cargadas sin falsos positivos y evidencia de backup O1
  • criterio PASS/FAIL: PASS si el stack O1 queda operativo, privado y con evidencia documental; FAIL si cae un target clave, falta provisioning o no queda cubierto por backup