Fonctionnalité

Alertes

Règles threshold + anomaly, routage par sévérité, silences, fenêtres de maintenance.

Un évaluateur sans état tourne toutes les 30 secondes, évalue toutes les règles et déduplique les incidents par fingerprint (rule_id + labels d’échantillon). La machine à états pending → firing → resolved élimine le flapping. Webhooks signés, Slack, Telegram, e-mail. Une file de retry avec backoff 30s / 2m / 10m. Routage par sévérité avec chaîne de fallback.

Propriétés clés

  • Règles threshold + détection d’anomalie (avg + σ stddev)
  • Expressions PromQL ; le réécriture AST injecte organization_id
  • Routage par sévérité : critical et warning sur des canaux distincts
  • Silences (ad-hoc) + fenêtres de maintenance (RRULE)
  • Webhooks signés HMAC avec timestamp ±5min

Fonctionnalités liées