運用・保守エンジニア at dappOS

Full Time2ヶ月前
Employment Information
職務内容
オペレーションエンジニアとして、スケーラブルでセキュアなインフラストラクチャソリューションの設計、実装、保守において重要な役割を担います。Amazon AWSやAlibaba Cloudなどのクラウドコンピューティングプラットフォームにおける実務経験を活かし、システムの最適なパフォーマンスと信頼性を確保します。VPC、CDN、S3、ECS、EKS、ELB、MySQL、Redis、ElastiSearchなどの複雑なクラウドリソース管理を担当するとともに、クロスファンクショナルチームと連携し、技術戦略とビジネス目標の整合を図ります。運用プロセスの継続的改善、反復タスクの自動化、システムヘルスの積極的な監視を通じて、ダウンタイムを防止し、シームレスなユーザー体験を実現します。
主な責任
  • Amazon AWSおよびAlibaba Cloudにおけるクラウドインフラストラクチャリソースの作成と管理を主導し、VPCネットワークの設計・設定、CDNパフォーマンスの最適化、S3などのオブジェクトストレージソリューションの管理を行います。コンテナオーケストレーションフレームワーク(ECS、EKS)を実装し、スケーラブルなアプリケーションのための効率的なリソース割り当てを確保します。
  • 開発チームと協力してコードビルドプロセスを効率化し、CI/CDパイプラインの最適化とコンテナオーケストレーションツールとのシームレスな統合を実現します。Docker、Kubernetes、オーケストレーションプラットフォームを使用したコンテナ自動運用機能の開発・維持により、手作業を削減しデプロイ効率を向上させます。
  • 重要システムの高可用性ソリューションを設計・実装し、フォールトトレランスと最小限のダウンタイムを確保します。AWS CloudTrail、Alibaba Cloud Security Center、SIEMプラットフォームなどのツールを使用した包括的なセキュリティ監視メカニズムを構築します。災害復旧計画や定期的なインシデント対応訓練を含む障害回復メカニズムを開発・実行し、システムの耐障害性を検証します。
  • Prometheus、Grafana、ELKスタックなどのツールを使用してシステムパフォーマンスとセキュリティメトリクスをリアルタイムで監視します。ログとアラートを分析して潜在的な問題を特定し、リスク軽減のための予防措置を実施します。インフラ設定、セキュリティプロトコル、運用手順に関するドキュメントを維持し、ナレッジ共有と業界標準への準拠を確保します。
  • オンコールチームと連携してインシデント管理とトラブルシューティングを支援し、本番環境障害時の重大な問題を解決します。根本原因分析を実施してシステムの脆弱性を特定し、再発防止のための恒久的なソリューションを導入します。新興クラウド技術と業界ベストプラクティスを継続的に学び、運用能力を向上させます。
求めるスキル
  • Amazon AWSおよびAlibaba Cloudにおける3年以上のクラウド運用実務経験。ネットワーク、ストレージ、データベースソリューションを含む複雑なクラウドアーキテクチャの設計・管理能力。
  • コンテナ技術(Docker、Kubernetes)とCI/CDパイプライン開発の高度なスキル。Terraform、Ansible、Jenkinsなどの自動化ツールを使用したインフラプロビジョニングとデプロイプロセスの効率化経験。
  • 高可用性、災害復旧、セキュリティのベストプラクティスに関する深い理解。AWS Auto Scaling、Alibaba Cloud Load Balancer、SIEMなどのセキュリティ監視プラットフォームを使用したシステム信頼性とデータ保護の確保。
  • 複雑なシステム問題のトラブルシューティング能力。パフォーマンスボトルネックを特定し、データ駆動型ソリューションを導入してシステムを最適化する分析力。
  • 最小限の監督下で高速な環境で作業できる能力。開発者、セキュリティチーム、ステークホルダーと協力しながら技術プロセスを文書化し、ソリューションを提示する強いコミュニケーションスキル。
  • クラウドコンピューティング(AWS認定ソリューションアーキテクト、Alibaba Cloud ACA)およびコンテナオーケストレーション(CKA、AWS認定Kubernetes)の認定資格を有する場合は優遇。DevOpsプラクティスとInfrastructure-as-Code(IaC)手法に精通していることが望ましい。