[NAVER Cloud] GPUaaS Infra Engineer (경력)
NAVER · NAVER Cloud
[NAVER Cloud] GPUaaS Infra Engineer (경력)
NAVER
30
0
0
DEVOPSSYSTEM_ARCHITECTUREDEVOPSPYTHON
5년 이상
정규직
사무실 근무
상시 채용
✓ 진행중
성남시 분당구
30
0
0
정규직
사무실 근무
5년 이상
성남시 분당구
✓ 상시 채용
NAVER Cloud 팀 소속으로, 대규모 GPU 클러스터 및 AI 하드웨어 인프라의 설계, 구축, 운영과 성능 최적화를 담당합니다.
최신 AI 하드웨어 상품화와 GPU 서버 자원 모니터링, 장애 대응, 운영 자동화 도구 개발을 통해 인프라의 안정성과 확장성을 확보합니다.
Responsibilities
- •GPU 클러스터 및 AI 하드웨어 상품화 추진을 위한 설계, 구축, 운영
- •인프라 성능 및 안정성 향상을 위한 모니터링 및 장애 대응 체계 구축
- •운영 자동화를 위한 도구 개발 및 프로세스 개선
- •NCP GPU 인스턴스 표준 OS 및 SW 스택 개발, 유지보수, 최적화
- •최신 AI 하드웨어 BMT 및 상품화 진행
- •GPU 서버 자원 모니터링, 장애 대응 및 성능 튜닝
Qualifications
- •Linux 기반 서버 인프라 운영 경력 5년 이상
- •대규모 HPC 또는 AI 클러스터 환경 구축 및 운영 경험
- •Linux 시스템 관리 및 스크립트 작성 능력 (Shell, Python 등)
- •NVIDIA DGX/HGX 아키텍처 및 CUDA, NCCL, NVLink, RDMA 이해
- •NVIDIA DCGM 및 Prometheus, Grafana 모니터링 및 로깅 시스템 구축 경험
Preferred Qualifications
- •Infiniband 또는 RoCE 기반 고속 네트워크 기술 이해 및 운영 경험
- •KVM Hypervisor 가상화 환경 구축 및 운영 경험
- •장애 분석, 성능 튜닝, 안정화 프로젝트 수행 경험
- •AI/ML 연구 조직 협업 경험 및 MLOps 파이프라인 이해
- •NVIDIA Certified Professional 자격증 보유
ℹ️AI가 분류한 데이터입니다. 지원 전 기업 페이지에서 확인해주세요.
💬 질문 및 댓글
댓글 작성은 로그인이 필요합니다
아직 댓글이 없습니다. 첫 댓글을 남겨보세요!