AI-Ops Documentation

Управление изменениями в инфраструктуре и приложениях: деплой, откаты и коммуникация.

Принципы

Изменения в production проходят через контролируемый процесс: ревью, тесты, пошаговый деплой (dev → stage → prod).
Критичные изменения (миграции БД, смена контрактов, отключение сервисов) согласуются и при необходимости выполняются в окно обслуживания.
Перед деплоем проверяется готовность: тесты, runbook’и отката, уведомление заинтересованных сторон при необходимости.

Типы изменений

Рутинный деплой — новая версия сервиса по pipeline; автоматические проверки и при необходимости ручной approval для prod.
Инфраструктурное изменение — изменение конфигурации кластера, сетевых правил, секретов; по чек-листу и при необходимости с откатом.
Миграция данных — выполнение миграций БД; резервная копия до миграции, план отката при сбое.

Откат

Критерии отката задаются заранее (метрики ошибок, задержка, недоступность).
Процедура отката описана в runbook’ах; при срабатывании — откат без ожидания длительного разбора.
После отката — постмортем и исправление причины.

Связанные страницы

Release Process — процесс релизов
Runbooks — процедуры деплоя и отката
Incident Management — инциденты при неудачном изменении

Ранбуки Непрерывность бизнеса

На странице

Принципы Типы изменений Откат Связанные страницы