Политика логирования в сервисах и сборе логов платформы AIOps.
Принципы
- Структурированные логи — JSON (structlog в Python, zap в Go); поля с едиными именами для поиска и агрегации.
- Уровни — DEBUG в dev, INFO в prod по умолчанию; WARNING/ERROR для сбоев и неожиданных ситуаций.
- Контекст — в каждый лог добавляются request_id, user_id (если есть), service_name, trace_id для связи с трейсингом.
- Без PII и секретов — пароли, токены, персональные данные не логируются в открытом виде; при необходимости маскирование (PII sanitizer).
Сбор и хранение
- Логи из подов/контейнеров собираются централизованно (например, Loki или аналог); retention по политике (например, 30 дней в hot storage).
- Доступ к логам — по ролям; аудит доступа при необходимости для compliance.
Использование при инцидентах
- Поиск по request_id, user_id, времени и уровню; связь с метриками и трейсами для диагностики.
- Runbook’и содержат примеры запросов и фильтров к логам для типовых сценариев.
Связанные страницы
- Observability — обзор наблюдаемости
- Metrics — метрики
- Tracing — трассировка
- Runbooks — использование логов при инцидентах
- Backend / Error Handling — логирование ошибок