소개
네이버웹툰의 데이터 플랫폼 팀은 대용량 데이터 저장 및 처리 플랫폼과 관련 에코시스템을 설계하고 운영하며, 데이터 거버넌스와 품질 관리를 담당합니다. 이 팀은 Apache Hadoop Ecosystem, Iceberg, Trino 등 첨단 기술 스택을 활용해 데이터 일관성과 보안을 보장하는 시스템을 구축합니다.
하는 일
- 데이터 플랫폼 아키텍처 설계 및 대용량 데이터 저장·처리 플랫폼 구축
- Apache Hadoop Ecosystem, Iceberg, Trino, Ceph Storage, Airflow 등 기술 스택 도입 및 최적화
- 데이터 일관성, 정확성, 신뢰성 보장 정책 및 프로세스 수립
- 데이터 접근 관리 및 보안 업무 수행
- 데이터 플랫폼 관련 에코시스템 개발 및 운영
- 인하우스 시스템과 데이터 플랫폼 연동 지원
지원 자격
- 데이터 플랫폼 관련 업무 경력 3년 이상
- 대용량 데이터 수집 및 적재 시스템 개발 및 운영 경험
- Java, Python, Golang, Node.js 중 하나 이상 능숙
- Kubernetes 기반 개발 경험
- 분산 처리 시스템(Hadoop, Spark 등) 또는 클라우드 기반 데이터 플랫폼(AWS EMR/Glue/Redshift, GCP Dataflow/BigQuery, Azure Databricks/Synapse 등) 활용 경험
우대 자격
- 대규모 분산처리 시스템 설계 및 구축 경험
- 스토리지 서비스(Block, NAS, Object Storage) 관련 플랫폼 구축 및 운영 경험
- 데이터 모델링 및 데이터 거버넌스 경험
- Kubernetes 관련 플랫폼 구축 및 운영 경험
사용 기술
- Apache Hadoop, Iceberg, Trino, Ceph Storage, Airflow, Java, Python, Golang, Node.js, Kubernetes, Spark, AWS EMR, AWS Glue, AWS Redshift, GCP Dataflow, GCP BigQuery, Azure Databricks, Azure Synapse