소개
우리 조직은 데이터 기반 의사결정과 개인화 서비스에 필요한 안정적이고 확장 가능한 데이터 인프라와 통합 데이터 플랫폼을 구축하며, 데이터 파이프라인과 인텔리전스 기술을 중심으로 운영합니다. 이 포지션은 대규모 분산 데이터 아키텍처 설계와 실시간 데이터 파이프라인 구축을 통해 타겟팅, 이상거래탐지 등 다양한 데이터 활용 부서에 필요한 플랫폼을 제공하는 역할을 담당합니다.
하는 일
- 대규모 분산 데이터 아키텍처 설계 및 고도화
- CDC, Flink, Nifi, Spark 기반 대규모 실시간 데이터 파이프라인 구축 및 운영
- 데이터 활용 부서에 필요한 데이터 통합 및 데이터 플랫폼 구축
- 고객, 데이터분석, 앱로그, 콘텐츠, 이상거래탐지, 머신러닝 등 핵심 데이터 플랫폼 구축
지원 자격
- 유관 경력 5년 이상 또는 그에 상응하는 역량
- Hadoop Ecosystem 및 대용량 분산 시스템(분산 컴퓨팅/스토리지) 경험
- 복잡한 비즈니스 요구사항을 데이터 모델 및 아키텍처로 설계할 수 있는 능력
- 장애 발생 시 근본 원인을 찾아 해결하고 시스템 안정성을 높이는 능력
우대 자격
- Impala, Hive, Kudu, Trino, Spark, CDC, Flink, Nifi, Pinot, Hbase, Object Storage 기술 경험
- Data Lake House 구축을 위한 오픈 테이블 포맷(iceberg, deltalake 등) 사용 경험
- Java, Kotlin, Python 중 1개 이상의 언어 개발 경험
- CDC(Change Data Capture)를 이용한 데이터 수집 파이프라인 구축 경험
- 고객 데이터플랫폼, 데이터 분석플랫폼 관련 경험
사용 기술
- Hadoop Ecosystem, Spark, Flink, Nifi, Java