소개
해당 조직은 생성형 AI 기술을 End-to-End로 개발하며, 대규모 언어 모델(LLM) 연구와 엔지니어링을 통해 AI 서비스의 성공을 지원합니다. 포지션은 LLM의 학습, 평가, 비용 및 속도 최적화 등 AI 서비스 전반에 걸친 문제 해결과 솔루션 개발을 담당합니다.
하는 일
- 신규 AI 서비스에 필요한 LLM의 End-to-End 개발
- 범용 및 서비스 벤치마크를 위한 LLM 학습, 평가 작업 및 데모 개발
- LLM의 비용 및 속도 최적화에 대한 연구 수행
지원 자격
- Python을 능숙하게 활용하실 수 있는 분
- Kubernetes(k8s), Airflow, Kafka, Hadoop, 데이터베이스 등 기본적인 엔지니어링 역량 보유
- AI 모델링 또는 엔지니어링 경험 5년 이상
우대 자격
- 시스템 엔지니어링, CUDA, C++ 개발 역량 우수
- 데이터 구축부터 모델 학습, 서빙까지 End-to-End LLM 파이프라인 구축 경험
사용 기술
- Python, Kubernetes, Airflow, Kafka, Hadoop