Описание должности
Ключевые обязанности
- Развертывание обновлений и исправлений для обеспечения стабильности и производительности наших сервисов, включая контроль версий, тестирование и процедуры отката.
- Мониторинг состояния системы и поддержание высокой доступности путем активного выявления и устранения потенциальных рисков.
- Оказание технической поддержки уровня 2 для решения эскалированных проблем, а также готовность быть на связи для срочных запросов команды DevOps во время простоев в производственной среде.
- Разработка и поддержка инструментов, автоматизирующих обнаружение ошибок, сокращающих ручное вмешательство и повышающих общую операционную эффективность.
- Проектирование и реализация решений для интеграции внутренних бэкенд-систем, обеспечивая совместимость и согласованность данных между платформами.
- Проведение анализа первопричин производственных ошибок, документирование результатов и предложение профилактических мер для предотвращения повторения.
- Исследование и устранение сложных технических проблем, включая конфигурацию системы, сетевое подключение и узкие места в производительности приложений.
- Создание и доработка скриптов для автоматизации задач визуализации, таких как обработка данных, отчетность и генерация дашбордов.
- Разработка стандартизированных процедур для диагностики системы, технического обслуживания и реагирования на инциденты для обеспечения согласованности и масштабируемости.
- Сотрудничество с кросс-функциональными командами для согласования технических решений с бизнес-целями и требованиями пользователей.
- Постоянная оптимизация рабочих процессов системы и инфраструктуры для повышения надежности, безопасности и пользовательского опыта.
- Отслеживание новых технологий и лучших практик отрасли для внедрения инноваций в управление системами и автоматизацию.
Требования к кандидату
- Подтвержденный опыт работы в DevOps с успешным опытом поддержания высокой доступности системы и устранения критических проблем.
- Продвинутые знания в области системного администрирования, инструментов автоматизации (например, Ansible, Puppet) и облачных платформ (например, AWS, Azure).
- Отличные навыки решения проблем и способность анализировать сложные технические сценарии для выявления первопричин и реализации эффективных решений.
- Владение скриптовыми языками (например, Python, Bash) для автоматизации и задач визуализации, включая интеграцию API и обработку данных.
- Глубокое понимание жизненного цикла разработки программного обеспечения с опытом интеграции приложений с внутренними бэкенд-системами.
- Способность разрабатывать и документировать стандартизированные процедуры для технического обслуживания системы, диагностики и управления инцидентами.
- Отличные коммуникативные навыки для сотрудничества с командами и объяснения технических решений нетехническим заинтересованным сторонам.
- Желательно: опыт работы с CI/CD-конвейерами, технологиями контейнеризации (например, Docker, Kubernetes) и инструментами мониторинга (например, Prometheus, Grafana).
- Способность работать как самостоятельно, так и в команде, с проактивным подходом к выявлению возможностей для улучшения.
- Высокая внимательность к деталям и приверженность предоставлению высококачественных, надежных технических решений, соответствующих бизнес-целям.
- Желательно: знакомство с ITIL-фреймворками и лучшими практиками управления инцидентами.
- Способность адаптироваться к развивающимся технологиям и непрерывно улучшать производительность системы и протоколы безопасности.
