Возможность

Алерты

Threshold + anomaly правила, per-severity routing, silences, maintenance windows.

Stateless evaluator тикает каждые 30 секунд, оценивает все правила, дедуплицирует инциденты по fingerprint (rule_id + sample labels). State machine pending → firing → resolved исключает blip-флэппинг. Подписанные webhook’и, Slack (incoming + bot), Telegram, email. Retry-очередь с backoff 30s / 2m / 10m. Per-severity routing с fallback chain.

Ключевые свойства

  • Threshold rules + anomaly detection (avg + σ stddev)
  • PromQL expressions, AST-rewrite инжектит organization_id
  • Per-severity routing: critical → PagerDuty, warning → Slack
  • Silences (ad-hoc) + maintenance windows (RRULE)
  • HMAC-подписанные webhook’и с timestamp ±5min

Связанные возможности