Шаблоны дашбордов
SRE on-call
- 4 виджета сверху: error rate / p95 latency / RPS / saturation (USE метод)
- Variables: env=prod (static), service=label_values
- Авторефреш: 30s
Capacity planning
- 7-дневные графики CPU/RAM по парку
- Predict_linear для memory:
predict_linear(node_memory_used_percent[7d], 86400 * 30)— где будем через 30 дней - Authentication metrics: новые юзеры / активные / churn
Business KPI
- Revenue (custom метрика)
- Signups / day
- Funnel: visits → signup → trial → paid
Embed для клиентов
- 1-2 виджета: success rate + latency
- Public share с TTL 30 дней