Возможность
Алерты
Threshold + anomaly правила, per-severity routing, silences, maintenance windows.
Stateless evaluator тикает каждые 30 секунд, оценивает все правила, дедуплицирует инциденты по fingerprint (rule_id + sample labels). State machine pending → firing → resolved исключает blip-флэппинг. Подписанные webhook’и, Slack (incoming + bot), Telegram, email. Retry-очередь с backoff 30s / 2m / 10m. Per-severity routing с fallback chain.
Ключевые свойства
- ✓Threshold rules + anomaly detection (avg + σ stddev)
- ✓PromQL expressions, AST-rewrite инжектит organization_id
- ✓Per-severity routing: critical → PagerDuty, warning → Slack
- ✓Silences (ad-hoc) + maintenance windows (RRULE)
- ✓HMAC-подписанные webhook’и с timestamp ±5min