소개
NAVER Cloud의 AI/ML 팀은 HyperCLOVA X 대규모 언어 모델의 학습 알고리즘 고도화와 안전성 향상, 추론 최적화 등 다양한 후처리 기술 연구개발을 수행합니다. 이 팀은 대규모 분산 학습 환경에서 데이터 합성, 평가 지표 개발 및 MLOps 기반 학습 파이프라인 구축을 통해 LLM 성능과 안전성을 극대화하는 미션을 담당합니다.
하는 일
- 고도화된 LLM 학습 알고리즘 연구 및 실험 수행 (SFT, Online/Offline RL, Reasoning, Function Call, Code Agent 등)
- 고퀄리티 데이터 합성, 필터링 및 정량적 평가 지표 개발
- 대규모 분산 학습 환경에서 LLM 학습 파이프라인 및 MLOps 개발
- LLM Safety 정책 정의, 데이터 제작 및 Rule-based Reward Model 강화학습 실험
- 추론 효율화를 위한 Inference 최적화 모델링 및 실험 수행 (Speculative Decoding, Knowledge Distillation 등)
지원 자격
- AI/ML 분야 박사 졸업자 또는 석사 졸업 후 관련 업무 경험 보유자
- 대규모 분산 GPU 환경에서 LLM 학습 및 추론 코드 개발 경험
- Data curation, synthesis, augmentation, refinement 관련 업무 및 연구 경험
- 자동화된 평가 지표 개발 및 ML 실험 설계, 결과 분석 경험
- Pytorch, Huggingface, DeepSpeed, FSDP, vLLM, trl, verl 등 LLM 관련 오픈소스 라이브러리 사용 및 개발 경험
우대 자격
- 7B~70B 규모 이상 LLM 분산 학습 경험 (DeepSpeed, FSDP, Megatron 등)
- 실제 제품/서비스에 적용된 LLM 학습 및 배포 경험
- ICML, ICLR, NeurIPS, ACL, EMNLP, NAACL 등 AI/NLP 분야 탑티어 학회 논문 발표 이력
사용 기술
- PyTorch, Huggingface, DeepSpeed, FSDP, vLLM