Описание должности
Ключевые обязанности
- Ответственность за эксплуатацию и техническое обслуживание бизнеса компании, повышение стабильности бизнеса и инженерной эффективности, поддержание эффективной коммуникации с бизнес-сторонами и установление хороших партнерских отношений.
- Ответственность за эксплуатацию middleware, повышение сервисных возможностей и стабильности базовых компонентов и платформ.
- Ответственность за планирование, строительство и разработку платформы эксплуатации, создание и совершенствование стандартизированной системы сервисного обслуживания.
- Ответственность за расследование серьезных онлайн-проблем, обработку аварийных ситуаций и последующий анализ и оптимизацию инцидентов.
- Постоянное содействие улучшению качества бизнеса: SLA, мультиактивное аварийное восстановление, тренировки по отработке сбоев, мониторинг и оповещения, управление мощностями.
- Проектирование высокой доступности и оптимизация производительности серверной архитектуры бизнеса для обеспечения эффективных и надежных бизнес-итераций.
Требования к должности
- Профессиональное владение эксплуатацией систем с акцентом на стабильность бизнеса и инженерную эффективность.
- Опыт управления middleware, способность повышать сервисные возможности и стабильность ключевых компонентов и платформ.
- Знание разработки платформ эксплуатации, включая планирование, строительство и стандартизацию сервисных систем.
- Способность расследовать онлайн-проблемы, обрабатывать чрезвычайные ситуации и проводить пост-инцидентный анализ для оптимизации.
- Навыки улучшения качества бизнеса: управление SLA, стратегии аварийного восстановления, тренировки по отработке сбоев, мониторинг и оповещения, планирование мощностей.
- Экспертиза в проектировании высокой доступности и оптимизации производительности серверной архитектуры для надежных бизнес-итераций.
- Отличные навыки коммуникации и сотрудничества для эффективной работы с кросс-функциональными командами и стейкхолдерами.
- Профессиональное владение решением проблем и аналитическим мышлением для преодоления сложных операционных вызовов.
- Способность расставлять приоритеты и управлять несколькими задачами одновременно в динамичной среде.
- Глубокое понимание фреймворков управления IT-услугами и лучших отраслевых практик.
- Опыт работы с облачными платформами и инструментами автоматизации для эффективных операций.
- Знание протоколов безопасности и стандартов соответствия для обеспечения целостности системы и защиты данных.
- Способность документировать процессы и предоставлять четкие отчеты о производительности системы и улучшениях.
- Профессиональное владение скриптовыми языками (например, Python, Bash) для автоматизации и устранения неполадок.
- Опыт работы с инструментами мониторинга и оповещений (например, Prometheus, Grafana) для оперативного контроля системы.
- Знание методологий планирования мощностей для обеспечения масштабируемых и устойчивых операций.
- Способность руководить и координировать команды для реализации планов аварийного восстановления и непрерывности бизнеса.
- Высокая внимательность к деталям и приверженность поддержанию высоких стандартов обслуживания.
- Опыт работы с практиками DevOps для оптимизации рабочих процессов разработки и эксплуатации.
- Способность адаптироваться к развивающимся технологиям и непрерывно улучшать операционные процессы.
