소개
LINE의 메시징 데이터 제품에 대한 데이터 엔지니어링 서비스를 담당하는 팀으로, 전 세계에서 생성되는 대용량 데이터를 처리하는 데이터 파이프라인을 운영합니다. 이 팀은 데이터 웨어하우징과 시각화, 비식별화 처리 파이프라인 개발을 통해 전사적인 인사이트 제공과 의사결정을 지원하는 미션을 수행합니다.
하는 일
- LINE 서비스 data mart 개발 및 운영
- 의사 결정 및 인사이트 도출을 위한 data warehousing, 시각화 및 관련 배치 파이프라인 운영
- 데이터 비식별화 처리 파이프라인 개발
지원 자격
- 3년 이상의 데이터 엔지니어링 업무 경력
- Data warehouse, Data mart 모델링, 구축, 운영 업무 가능
- Hadoop, Hive, Spark 등의 대용량 데이터 플랫폼 및 분산 처리 경험
- Airflow(ETL) 개발, 성능 개선, 트러블슈팅 가능
- Python, SQL, Git 사용 가능
- 시스템 장애 발생 시 문제 원인 파악 및 개선점 논리적 설명 가능
우대 자격
- Kafka 등을 활용한 데이터 파이프라인 Flow 이해
- Tableau를 이용한 분석 및 Dashboard 제작 경험
- 데이터 분석 관련 오픈소스 및 도구 사용 경험
- 통계 기법을 활용한 데이터 분석 업무 가능
- 기본적인 ML 개념 이해
- 실시간 데이터 분석 환경 구축 경험
사용 기술
- Hadoop, Hive, Spark, Airflow, Python, SQL, Kafka, Tableau, Git