Логирование, метрики, трейсинг и алертинг для платформы AIOps.
Компоненты
| Компонент | Назначение |
|---|---|
| Логи | Централизованный сбор логов (например, Loki); в приложениях — структурированное логирование (structlog). Без PII и секретов в логах. |
| Метрики | Prometheus / Victoria Metrics — сбор метрик с сервисов и инфраструктуры (RPS, задержки, ошибки, использование ресурсов). |
| Трейсинг | OpenTelemetry / Tempo — распределенная трассировка запросов между сервисами. |
| Алерты | Правила в Prometheus/Grafana Alertmanager; уведомления в каналы и в систему вызова on-call (PagerDuty и т.п.). |
| Дашборды | Grafana — визуализация метрик и логов для сервисов и инфраструктуры. |
Ссылки на подразделы
- Logging — политика логирования
- Metrics — ключевые метрики
- Tracing — трассировка
- Alerting — алерты и эскалация
Связанные страницы
- Infrastructure Overview — где развернут стек observability
- Operations / Runbooks — использование логов и метрик при инцидентах
- Backend Overview — инструменты в сервисах (structlog, prometheus-client, OpenTelemetry)