Monitoring

Метрики: Victoria Metrics, Prometheus, Grafana, Alertmanager. Папка: infra/k8s/monitoring/.

Описание

Victoria Metrics — TSDB для долгосрочного хранения (90 дней). Prometheus — сбор метрик (ServiceMonitor/PodMonitor). Grafana — дашборды. Alertmanager — алерты с Telegram.

Возможности

Централизованный сбор метрик
Remote write Prometheus → Victoria Metrics
Алерты для кластера, Postgres, Kafka и др.
Pre-installed Kubernetes dashboards

Конфигурация

Namespace: tech-monitoring
Victoria Metrics: 45Gi PVC, 90 дней retention.
Node Exporter: Запущен на всех 10 нодах кластера (включая control-plane) с приоритетом system-node-critical и минимальными ресурсами (30Mi RAM) для предотвращения эвикции.
Grafana: admin/admin (сменить при первом входе).

Оптимизация Prometheus

Для снижения потребления памяти Prometheus (high cardinality) настроено переопределение метрик (metricRelabelings) для Longhorn: отбрасываются тяжелые гистограммы задержек (longhorn_rest_client_..._bucket).

Базовый порядок установки

cd infra/k8s
make monitoring-install-prometheus
make monitoring-install-victoria-metrics
make monitoring-install-grafana
make monitoring-create-telegram-secret
make monitoring-status

Можно использовать и единый запуск: make monitoring-install-all.

Команды

Команда	Описание
`make monitoring-install-all`	Полная установка monitoring-стека
`make monitoring-install-prometheus`	Prometheus stack (включая CRD)
`make monitoring-install-victoria-metrics`	VictoriaMetrics
`make monitoring-install-grafana`	Grafana
`make monitoring-create-telegram-secret`	Telegram секрет для Alertmanager
`make monitoring-status`	Проверить все компоненты
`make monitoring-port-forward-grafana`	Локальный доступ к Grafana

Связанные страницы

Authentik Logging

На странице

Описание Возможности Конфигурация Оптимизация Prometheus Базовый порядок установки Команды Связанные страницы