소개
NAVER Cloud의 HyperCLOVA X 팀은 대규모 Foundation 모델의 Pre-training 연구 및 개발을 담당하며, 네이버 내외부에 모델을 공급하고 LLM 성능과 플랫폼을 지속적으로 개선합니다. 이 팀은 대규모 데이터 ETL 분산처리와 모델 성능 향상을 위한 실험 및 분석을 수행하며, 관련 부서와 긴밀히 협업합니다.
하는 일
- 대규모 Pre-training을 위한 데이터 ETL 분산처리 및 최적화 수행
- 모델 성능 향상을 위한 실험 설계, 실행 및 결과 분석
- 대규모 학습과 데이터 상호 작용에 관한 연구 진행
- HyperCLOVA X 유관부서(모델, 인프라, Post-training)와 협업
지원 자격
- 관련 경력 1년 이상
- 데이터 및 ML 관련 문제 해결 소프트웨어 엔지니어링 기술
- Python 전문 지식 및 딥러닝 프레임워크(PyTorch, Tensorflow 등) 사용 경험
- 자연어 처리 및 대규모 머신러닝 친숙도
- 최신 AI/ML 논문 이해 및 구현 능력
- Pre-training 대규모 데이터 ETL 수집/구축 능력
우대 자격
- 인공지능, 기계학습, 데이터마이닝, 수학 등 관련 분야 석사 이상 학위
- 분산처리 및 최적화 소프트웨어 역량 보유
- GPU 인프라 최적화 및 분산시스템 학습, CUDA 등 이해
- Multi-modal (Text, Image 등) 대규모 Pre-training 경험
- 주요 AI/ML 학회 논문 게재 경험 (NeurIPS, ICML, ICLR, COLING, ACL, EMNLP 등)
- Kaggle 등 국내외 AI/ML 대회 우수 성적
사용 기술
- Python, PyTorch, TensorFlow, CUDA