База знаний/Best practices

Шаблоны дашбордов

SRE on-call

  • 4 виджета сверху: error rate / p95 latency / RPS / saturation (USE метод)
  • Variables: env=prod (static), service=label_values
  • Авторефреш: 30s

Capacity planning

  • 7-дневные графики CPU/RAM по парку
  • Predict_linear для memory: predict_linear(node_memory_used_percent[7d], 86400 * 30) — где будем через 30 дней
  • Authentication metrics: новые юзеры / активные / churn

Business KPI

  • Revenue (custom метрика)
  • Signups / day
  • Funnel: visits → signup → trial → paid

Embed для клиентов

  • 1-2 виджета: success rate + latency
  • Public share с TTL 30 дней