Gestão e manutenção

Monitorização de uptime: saber antes do cliente que o site caiu

Quase ninguém descobre que o site caiu pela monitorização. Descobre pelo cliente, no WhatsApp, às 21h de domingo. A diferença entre "respondi em 5 minutos" e "respondi na segunda de manhã" não é técnica — é ter um alerta configurado e testado uma vez.

Este guia mostra o que monitorizar, que ferramentas usar (a maioria tem plano grátis útil), e como evitar transformar uptime numa fonte de stress permanente com alertas falsos.

Uptime não é só "o site responde"

A definição simplista de uptime — o servidor devolve 200 OK — esconde os problemas reais. O site responde mas o checkout está partido. A homepage carrega mas a base de dados não. O HTTPS expirou mas o HTTP ainda vai. Tens de monitorizar camadas:

  1. Resolução DNS — o domínio resolve para o IP certo?
  2. Conectividade TCP — o servidor aceita ligações na porta 443?
  3. Resposta HTTP — devolve 200 e não 5xx?
  4. Conteúdo — a página contém uma palavra esperada (ex.: "carrinho")?
  5. SSL — o certificado é válido e não expira em <14 dias?
  6. Performance — tempo de resposta razoável (<2s)?
  7. Fluxos críticos — checkout, login, formulário de contacto.

Monitorizar só 1+2 é o erro mais comum. Camadas 3-5 são o mínimo razoável.

Que ferramentas usar

Para PME portuguesa, três opções cobrem 95% dos casos:

UptimeRobot — o standard grátis

UptimeRobot tem plano grátis com 50 monitores, intervalo de 5 minutos, alertas por email ilimitados. Para a maioria das PMEs chega. Pago (~7€/mês) baixa intervalo para 1 minuto e adiciona SMS.

Bom para: monitorizar disponibilidade básica do site, alertas simples por email. Limitação: status page é genérica, não monitoriza fluxos complexos.

BetterStack (ex-Better Uptime) — o equilíbrio

BetterStack Uptime tem plano grátis com 10 monitores e 3 minutos. Pago começa em ~20€/mês mas inclui status page personalizada com domínio próprio, on-call scheduling, integração com Slack/Telegram/Discord, e check de 30 segundos.

Bom para: equipas com on-call rotativo, sites que precisam de status page profissional. Limitação: preço escala com features rápido.

Cloudflare — se já o usas

Se tens Cloudflare à frente do site, ativa os Health Checks (Pro+). Mais 5€/mês adicionais e tens monitorização de origem com failover automático.

Bom para: quem já paga Cloudflare e quer monitorização integrada com proxy. Limitação: só funciona via Cloudflare.

Que escolher:

  • Site institucional simples: UptimeRobot grátis.
  • Loja online ou site de negócio crítico: BetterStack.
  • Quem já está em Cloudflare: usar Cloudflare Health Checks.

Configuração mínima recomendada

Para um site institucional típico:

  • Monitor 1: HTTPS GET na homepage, verifica status 200 e palavra-chave do título.
  • Monitor 2: HTTPS GET em /contacto, verifica 200.
  • Monitor 3: SSL check do domínio (aviso 14 dias antes de expirar).
  • Intervalo: 5 minutos chega. 1 minuto para lojas.

Para uma loja online:

  • Tudo o acima.
  • Monitor 4: HTTPS GET no carrinho, verifica conteúdo.
  • Monitor 5: Endpoint da API de pagamento (se tiveres) — verifica que ifthenpay ou Stripe responde.
  • Monitor 6: Página de produto popular (ajuda a detetar problemas de cache).

Não monitorizes 50 páginas. Monitoriza o caminho crítico do dinheiro. Se o utilizador não consegue chegar ao botão "Comprar", o resto é decoração.

Alertas — onde a maioria estraga

O erro tipo: configurar alerta por email para todas as falhas, receber 200 emails por mês, ignorar, perder o real. Para evitar:

  • Threshold de confirmação. UptimeRobot e BetterStack permitem exigir 2-3 falhas seguidas antes de alertar. Reduz falsos positivos para <5%.
  • Canais por gravidade. Email para warnings. Push (Telegram/Slack/SMS) só para downtime confirmado. Não inverter.
  • Quiet hours só para warnings. Downtime real notifica sempre.
  • Escalation. Se primeiro contacto não responde em 10 min, escala para segundo. Mesmo em estruturas pequenas, isto vale ouro.

Testa o alerta. Põe o site offline 2 minutos. Recebeste o aviso? Recebeste no canal certo? Em quanto tempo? Esta verificação é a única que importa.

Status page — vale a pena?

Para a maioria das PMEs, não. Status page é útil quando:

  • Tens clientes B2B que perguntam "está em baixo?" e tens de responder muitas vezes.
  • Vendes SLA contratual.
  • A tua loja online é grande o suficiente para gerar tweets reclamatórios quando cai.

Para o restaurante de bairro ou advogado solo, não precisas. Para uma loja com 200 encomendas/dia, faz diferença. Custo BetterStack: ~20€/mês incluindo status page com status.teusite.pt.

SLAs — o que é realista

SLA (Service Level Agreement) é compromisso de disponibilidade. Os números reais:

  • 99% uptime = ~7h de downtime/mês permitidas. Standard de alojamento partilhado low-cost.
  • 99.9% uptime = ~43min/mês. Standard de alojamento gerido decente.
  • 99.95% uptime = ~22min/mês. Alojamento premium.
  • 99.99% = ~4min/mês. Infraestrutura redundante (multi-região, balanceadores).

A maioria dos providers em Portugal anuncia 99.9% e entrega 99.5-99.8%. Vê o histórico real, não a promessa de marketing. A escolha do alojamento determina 80% do teu uptime real — monitorização só te diz que correu mal, não impede.

O que fazer quando o alerta dispara

Em 90% dos casos a resposta é simples — mas só se estiver definida antes:

  1. Confirma do telemóvel. Não confies no alerta. Abre o site no 4G.
  2. Verifica camada DNS (dnschecker.org).
  3. Verifica painel do alojamento (estado do servidor).
  4. Última alteração recente? Plugin atualizado, deploy, mudança DNS — reverte primeiro, investiga depois.
  5. Comunica. Se demora >15 min e tens muitos clientes a notar, post nas redes ou status page.

Tens isto escrito num documento de 1 página com contactos? Não? Cria. O guia site em baixo, o que fazer tem o protocolo completo.

Monitorização sintética vs RUM

Há duas filosofias de monitorização:

Sintética — uma máquina em algum lado do mundo abre o teu site a cada 1-5 minutos e regista o resultado. É o que UptimeRobot e BetterStack fazem por padrão. Vantagens: deteta downtime mesmo sem visitantes; constante; barata. Limitações: não vê o que utilizadores reais experimentam (versões antigas de Chrome, redes 3G fracas, ISPs portugueses específicos).

RUM (Real User Monitoring) — JavaScript no site envia dados de cada visita real. Vês performance e erros como utilizadores experimentam. Cloudflare Web Analytics, Sentry Performance, Datadog RUM. Vantagens: realidade do utilizador. Limitações: não deteta downtime (se o site está em baixo, o RUM também não corre).

Combinação certa para PME: sintética para uptime (UptimeRobot), RUM básico para erros JS (Sentry plano grátis). Custo total: 0€ a 7€/mês.

Monitorizar APIs e integrações

Para lojas online, monitorizar só o site não chega. Falhas comuns:

  • Gateway de pagamento (ifthenpay, Stripe) responde lento ou rejeita pedidos.
  • API do CTT para etiquetas de envio cai.
  • Webhook do ERP para sincronização de stock falha em silêncio.
  • Email transacional para "fatura enviada" deixa de chegar (DKIM expirou, conta bloqueada).

Para cada integração crítica, define um monitor de heartbeat — um pedido periódico (a cada 15-60 min) que valida que a API responde como esperado. Se não responde, alerta antes de o cliente reclamar do "não recebi a fatura".

Quando o alerta é falso positivo

Os primeiros 30 dias de monitorização vão estar cheios de ruído. É normal. Trata:

  • Picos de latência que não são downtime real — sobe threshold ou ignora.
  • DNS lookup fail intermitente — culpa do resolver da ferramenta, não do teu site. Adiciona segundo monitor de outra região.
  • Falhas durante manutenção programada — agenda silêncio antes de tocar no site.

Um sistema com 1 alerta falso por semana é tolerado. Um com 5 por dia é ignorado. Calibra cedo.

Métricas que importam além de uptime

Uptime cobre disponibilidade. Não cobre lentidão. Sites lentos perdem clientes mesmo "estando online". Adiciona:

  • Tempo de resposta médio — UptimeRobot mostra. Se está a subir mês após mês, alerta.
  • Core Web Vitals — monitoriza com PageSpeed Insights ou Search Console mensalmente.
  • Erros JavaScript — Sentry plano grátis (5k events/mês) deteta o que parte para utilizadores reais.

Uptime perfeito com loja que demora 8s a carregar é "tecnicamente acima" — comercialmente partida.

Em resumo

Monitorização de uptime para PME portuguesa é simples e barata. UptimeRobot grátis chega para sites institucionais; BetterStack ~20€/mês resolve lojas online com on-call e status page. Configura monitorização em camadas (DNS, HTTPS, conteúdo, SSL), com alertas confirmados em canais por gravidade, testados pelo menos uma vez. Tens três monitores essenciais para um site, seis para uma loja — não 50. Define o protocolo de resposta em 1 página antes do primeiro incidente. E lembra-te que uptime sem performance é metade do trabalho.


No sitesfixe.pt entregamos sites e lojas com monitorização configurada e contrato de manutenção mensal que inclui resposta a incidentes em horário útil. Se não queres descobrir que o site caiu pelo cliente do WhatsApp, fala connosco. Sites desde 1.500€. Manutenção desde 80€/mês.

Lê também:

Fontes

Precisas de um site ou loja online?

Agência digital portuguesa. Sites e lojas online rápidos, otimizados para o Google e feitos para resultado.

Pedir orçamento