주요 업무
인프라 설계 및 운영
- Terraform, Kubernetes, Helm 등을 활용하여 다양한 환경에서 안정적이고 생산적인 플랫폼을 구축하고 운영합니다.
- 멀티 클라우드(AWS, NCP) 및 멀티 리전 환경을 운영하며 글로벌 확장을 고려한 인프라 아키텍처를 설계합니다.
- 시스템의 가용성과 확장성을 고려하여 모니터링 및 자동화 시스템을 구축하고 운영합니다.
특수 목적 인프라 개발 및 유지
- AI 언어 모델 학습 및 배포를 위한 GPU 기반의 특수 목적 인프라를 개발하고 최적화합니다.
- 온디맨드 리소스 오케스트레이션을 통해 고객에게 필요한 시점에 최적화된 컴퓨팅 자원을 제공합니다.
보안 및 인증 관리
- CSAP 등 각종 보안 인증 취득 및 유지보수를 담당합니다.
- 서비스 및 인프라 전반의 보안 정책을 수립하고 운영하며, 보안 위협을 사전 대응합니다.
필요 역량
클라우드 및 인프라 자동화
- AWS, 네이버 클라우드 플랫폼(NCP) 등의 클라우드 환경에서 인프라를 설계 및 운영한 경험
- Kubernetes 및 컨테이너 오케스트레이션 관련 경험
- Terraform, Helm, ArgoCD 등의 IaC(Infrastructure as Code) 및 GitOps 활용 경험