Управление изменениями в инфраструктуре и приложениях: деплой, откаты и коммуникация.
Принципы
- Изменения в production проходят через контролируемый процесс: ревью, тесты, пошаговый деплой (dev → stage → prod).
- Критичные изменения (миграции БД, смена контрактов, отключение сервисов) согласуются и при необходимости выполняются в окно обслуживания.
- Перед деплоем проверяется готовность: тесты, runbook’и отката, уведомление заинтересованных сторон при необходимости.
Типы изменений
- Рутинный деплой — новая версия сервиса по pipeline; автоматические проверки и при необходимости ручной approval для prod.
- Инфраструктурное изменение — изменение конфигурации кластера, сетевых правил, секретов; по чек-листу и при необходимости с откатом.
- Миграция данных — выполнение миграций БД; резервная копия до миграции, план отката при сбое.
Откат
- Критерии отката задаются заранее (метрики ошибок, задержка, недоступность).
- Процедура отката описана в runbook’ах; при срабатывании — откат без ожидания длительного разбора.
- После отката — постмортем и исправление причины.
Связанные страницы
- Release Process — процесс релизов
- Runbooks — процедуры деплоя и отката
- Incident Management — инциденты при неудачном изменении