Fonctionnalité
Alertes
Règles threshold + anomaly, routage par sévérité, silences, fenêtres de maintenance.
Un évaluateur sans état tourne toutes les 30 secondes, évalue toutes les règles et déduplique les incidents par fingerprint (rule_id + labels d’échantillon). La machine à états pending → firing → resolved élimine le flapping. Webhooks signés, Slack, Telegram, e-mail. Une file de retry avec backoff 30s / 2m / 10m. Routage par sévérité avec chaîne de fallback.
Propriétés clés
- ✓Règles threshold + détection d’anomalie (avg + σ stddev)
- ✓Expressions PromQL ; le réécriture AST injecte organization_id
- ✓Routage par sévérité : critical et warning sur des canaux distincts
- ✓Silences (ad-hoc) + fenêtres de maintenance (RRULE)
- ✓Webhooks signés HMAC avec timestamp ±5min