Skip to content

Жизненный цикл сервиса в инфраструктуре SafeBlock

Мотивация

Данный документ вызван необходимостью выравнять ожидание участников команды по эксплуатации, а также описать процесс ввода в эксплуатацию новых приложений для обеспечения требуемого кровня качества надежности (reliability) и наблюдаемости (observailty).

Этапы жизненного цикла сервиса/приложения

  1. Разработка.
  2. Ввод в эксплуатацию.
  3. Эксплуатация.
  4. Вывод из эксплуатации.

1. Разработка

TBD

2. Ввод в эксплуатацию

Процессы:

  1. Создание паспорта сервиса который включает:
  2. Формирование требований сервиса по ресурсам, коннектам к базам, выходам наружу.
  3. Проверка сервиса на соответствие требованием Reability & Observability
  4. Формирование SLA
  5. Выявление целевой критичности
  6. Формирование требований по backup/репликации/РФ
  7. Описание процесса тестирования, конфигурация на стади ввода
  8. Формирование особых критериев приемки сервиса
  9. Формирование метрик (список) и критерии алертинга
  10. Оценка рисков
  11. Формирование ожиданий по нагрузке
  12. Создание нагрузочных скриптов
  13. Описание требований к HA и масштабированию
  14. Создание приемочных тестов
  15. Инфраструктурные изменения:
  16. создание helm charts (при необходимости)
  17. Проставлены nodeAffinity со значением worker, пример (позволяет планировать Поды на подходящие для этого воркер-ноды);
  18. Проставлены podAntiAffinity(Повышает отказоустойчивость приложения за счет развертывания экземпляров приложения на разных Нодах);
  19. Проставлены требование по ресурсам
  20. Создать helm test
  21. Cоздание release-ного файла и файла с переменными окружения.
  22. Учет connection pool к базам данных
  23. Добавление секретов и настроек
  24. Раскатка
  25. Изменений конфигурации стенда production
  26. Deploy на stage1
  27. Тестирование на stage1
  28. Деплой на production
  29. Настройка сбора метрик, дашборда и алертов
  30. Тестирование и приёмка.
  31. Проверка алертинга
  32. Нагрузочное тестирование
  33. Приемочные тесты
  34. Ссылки на дашборды метрик, алерты и логи сохраняются в паспорт сервиса.

Критичность сервиса на этой стадии: Не выше OP (другими словами как получится)

3. Эксплуатация

TBD

Процессы:

  1. Контроль бакапов.
  2. Тюнинг алертов и ресурсной политики

Критичность сервиса на этой стадии: Целевая

4. Вывод из эксплуатации

TBD

Критичность сервиса на этой стадии: Целевая

Приложения

Оценка нагрузки Postgesql при вводе сервиса в эксплуатацию

Приложение Частота запросов на insert Частота запросов на update Частота запросов на select Трафик на запись (Mb) Трафик на чтение (Mb)
blockberry
archiver