Alpha — Em desenvolvimento ativo

Um
sistema nervoso
autônomo para Linux

O HOSA detecta, contém e estabiliza colapsos do sistema em milissegundos — antes que seu monitoramento sequer perceba. Resiliência endógena para cada nó.

O Intervalo Letal

Seu servidor colapsa em 2 segundos. Seu monitoramento detecta em 100. Esse gap é onde sistemas morrem — e o HOSA vive.

💀 Sem HOSA

  • Memory leak começa. Prometheus faz scrape a cada 15s — não vê nada.
  • OOM-Killer dispara em t=40s. Serviço de pagamento morre no meio da transação.
  • CrashLoopBackOff. Clientes recebem erros 502.
  • Alerta dispara em t=100s — 60 segundos após o primeiro crash.

🛡 Com HOSA

  • Memory leak começa. HOSA detecta aceleração da anomalia em 1 segundo.
  • Aplica contenção memory.high em t=2s. Nenhum processo morto.
  • Sistema degradado mas vivo. Todas as transações preservadas.
  • Operador recebe webhook com contexto dimensional completo em t=2s.

Timeline de um Colapso — Memory Leak @ 50MB/s

t=0s

Leak Começa

Memory leak começa no payment-service. Taxa: ~50MB/s.

mem: 61% DM = 1.1 Nível 0

Prometheus fez último scrape 8s atrás. Próximo scrape em 7s. Dados mostram: "saudável."

t=1s

HOSA Detecta

DETECTADO EM 1s

Distância de Mahalanobis cruza o limiar de vigilância. Taxa de amostragem aumentada de 100ms para 10ms.

DM = 2.8 dDM/dt = +1.6 Nível 0→1

Prometheus: nenhum scrape neste intervalo. Zero consciência.

t=2s

HOSA Contém

CONTIDO EM 2s

Contribuidor dominante identificado: /kubepods/pod-payment-service-7b4f. Ação: memory.high reduzido de 2G → 1.6G. Webhook disparado.

DM = 4.7 d²DM/dt² = +0.5 Nível 1→2

Prometheus: próximo scrape em 5s. Ainda mostrando dados obsoletos de t=-8s.

Intervalo Letal: 2 segundos

O HOSA detectou e conteve a anomalia antes que qualquer sistema de monitoramento externo pudesse coletar seu primeiro ponto de dado pós-leak.

t=4s

Contenção Sustentada

Derivada desacelerando — contenção está funcionando. Nenhuma escalação necessária.

dDM/dt = +1.2 ↓ d²DM/dt² = −0.45

Prometheus: faz scrape agora. Vê mem=1.47GB. Regra diz >1.8GB por 1m. Resultado: OK (!)

t=8s

Sistema Estabilizado

ESTÁVEL

Memória em 74% — platô atingido. Derivada próxima de zero. Sistema degradado mas funcional. Todas as transações preservadas. Nenhum processo morto.

DM = 6.2 dDM/dt ≈ 0 Nível 2
Contrafactual — o que acontece sem o HOSA
t=40s

OOM-Kill

💀 CRASH

payment-service morto no meio da transação. Dados corrompidos. CrashLoopBackOff começa. Clientes recebem erros 502.

t=100s

Alerta do Prometheus Dispara

⚠ TARDE DEMAIS

Alerta dispara 60 segundos após o primeiro crash. A condição for 1m é finalmente satisfeita. Engenheiro de plantão notificado. Postmortem começa.

Resiliência Autônoma Bio-Inspirada

Como o arco reflexo humano — sua medula espinhal retrai sua mão do fogo em milissegundos, depois notifica seu cérebro. O HOSA faz o mesmo para seus servidores.

🧬

Detecção Multivariada

Sem thresholds estáticos. O HOSA aprende o perfil comportamental do seu nó — como CPU, memória, I/O e rede se correlacionam — e detecta desvios usando a Distância de Mahalanobis. Ele vê padrões que alertas por métrica individual não conseguem.

Coleta em Kernel-Space

Métricas coletadas via probes eBPF conectadas diretamente a tracepoints do kernel. Sem polling, sem scraping, sem agentes-chamando-agentes. Dados fluem por ring buffers com latência de microssegundos.

📈

Derivadas Preditivas

O HOSA não mede apenas onde você está — ele calcula velocidade e aceleração do desvio. Ele detecta que você está caminhando para o colapso, não apenas que chegou nele.

🛡️

Resposta Graduada

Seis níveis de resposta, da observação passiva à quarentena autônoma. Proporcional à severidade. Sem chaves binárias de kill. Throttle primeiro, contenção depois, isolamento apenas como último recurso.

🔌

Zero Dependências Externas

Sem TSDB, sem message broker, sem API cloud necessária para sua função primária. A comunicação com orquestradores é oportunística — usada quando disponível, nunca necessária.

📋

Decisões Auditáveis

Toda ação autônoma é registrada com sua justificativa matemática — valor DM, derivada, limiar cruzado, cgroup alvo, ação tomada. Transparência total. Sem caixas pretas.

Seis Níveis de Ação Autônoma

Inspirado na resposta biológica a ameaças. Força proporcional — da observação silenciosa ao isolamento de rede.

NívelNomeAçãoReversibilidade
0 Homeostase Nenhuma. Suprime telemetria redundante. Apenas heartbeat.
1 Vigilância Aumenta taxa de amostragem. Log local. Sem intervenção. Automática
2 Contenção Suave renice processos não essenciais. Notificação via webhook. Automática
3 Contenção Ativa Throttling de CPU/memória via cgroups. Load shedding parcial via XDP. Auto c/ histerese
4 Contenção Severa Throttling agressivo. Bloqueia tráfego inbound exceto healthchecks. Congela cgroups não críticos. Recuperação sustentada
5 Quarentena Isolamento de rede. Congela processos não essenciais. Modo de recuperação ciente do ambiente. Manual

O Ciclo Perceptivo-Motor

Três camadas — sensorial (eBPF), córtex (matemática), motora (cgroups/XDP) — operando em loop contínuo com transições kernel↔user em microssegundos.

Espaço Kernel eBPF
📡

Probes Sensoriais

  • Tracepoints (sched, mm, net)
  • Kprobes
  • Hooks PSI

Atuadores

  • XDP (filtragem de pacotes)
  • Controllers de cgroup (cpu, memória)
  • Sinais de processo
eBPF Ring Buffer
BPF Maps
Espaço Usuário Go
🧠

Córtex Preditivo

  1. Receber eventos do ring buffer
  2. Atualizar vetor de estado x(t)
  3. Atualizar μ e Σ incrementalmente (Welford)
  4. Calcular DM(x(t)) — Distância de Mahalanobis
  5. Aplicar suavização EWMA → M(t)
  6. Calcular dD̄M/dt e d²D̄M/dt²
  7. Avaliar contra limiares adaptativos
  8. Determinar nível de resposta (0–5)
  9. Enviar comando de atuação via BPF maps → de volta ao Kernel
📡

Comunicação Oportunística

Webhooks Métricas Prometheus Log de auditoria local

Usada quando disponível. Nunca necessária.

Em Breve

Estamos construindo ativamente a primeira release pública.
Dê uma estrela no repositório para ser notificado quando sair.

🚧

Em Construção

O HOSA está atualmente em desenvolvimento alpha. Instruções de instalação, binários pré-compilados e guias de início rápido estarão disponíveis aqui assim que a primeira release pública estiver pronta.

Acompanhar no GitHub

Mergulho Profundo

Dos conceitos aos detalhes de implementação.