소개
데이터플랫폼팀은 우아한형제들의 데이터 기반 의사결정과 서비스 개발을 지원하기 위해 신뢰할 수 있고 확장 가능한 현대적 데이터 인프라와 분석 환경을 구축합니다. 이 팀은 데이터레이크, 분산 쿼리 엔진, 실시간 OLAP, 데이터 카탈로그 및 스트리밍 파이프라인 등 다양한 데이터 플랫폼과 인프라를 설계·운영하는 역할을 수행합니다.
하는 일
- Cloud-native 컨테이너 오케스트레이션 환경 구축 및 운영
- 분산 쿼리 엔진 및 실시간 OLAP 엔진 구축 및 최적화
- 모던 테이블 포맷 기반 데이터 레이크 아키텍처 설계 및 운영
- 워크플로우 오케스트레이션 및 데이터 변환 도구 개발 및 운영
- 데이터 카탈로그 시스템 및 디스커버리 서비스 개발 및 운영
- 자체 구축 로그 수집 시스템 개발 및 운영
지원 자격
- 위 업무내용(A~C) 중 1개 이상 역할을 3년 이상 수행한 경험
- Kubernetes 클러스터에서 애플리케이션 배포 및 운영 경험
- 분산 데이터 처리 기술 활용 경험
- Java 또는 Python 중 1개 이상의 언어 및 SQL 숙련자 (복잡한 쿼리 작성 및 최적화 경험)
우대 자격
- Kubernetes 플랫폼 엔지니어링 경험 (클러스터 운영, 성능 최적화, 트러블슈팅)
- 분산 쿼리 엔진 및 실시간 OLAP 엔진 운영 및 최적화 경험
- 모던 데이터 레이크 포맷 및 클라우드 매니지드 웨어하우스 활용 경험
- 데이터 카탈로그 및 메타데이터 관리 시스템 구축 경험
- 워크플로우 오케스트레이션 도구(Airflow) 개발 및 운영 경험 (Provider/Plugin 개발 및 커스터마이징 포함)
- 레거시 분산 처리 프레임워크에서 현대적 쿼리 엔진으로의 전환 경험
사용 기술
- Java, Scala, Spark, Python, Flink, Airflow, Spring, Redis, Elasticsearch, MongoDB, Kafka, AWS, SQL, Kubernetes