• 산업 데이터 특성(예: 시계열 로그, 이미지)에 맞는 데이터 수집·정제·표준화 로직 설계 및 구현
• 대규모 시계열·이벤트·정형·반정형 데이터를 위한 데이터 모델링 및 저장 구조 설계 (OLTP/OLAP, Lakehouse 등)
• 실시간 및 배치 처리 기반 데이터 파이프라인 개발
• AI/Backend/현장 엔지니어링 조직과 협업을 통한 데이터 API·ETL/ELT 프로세스·모니터링 체계 고도화
• 데이터 플랫폼 운영 환경(Docker, Kubernetes, Linux)에서의 성능 최적화 및 장애 대응
✔ 자격요건
• 경력 무관 (신입 지원 가능)
• 학력무관
• Python 및 Java 기반 데이터 엔지니어링 능력
• Docker 기반 컨테이너 개발 환경 구성 및 운영 역량
• 데이터 관계 모델링 및 스키마 설계 역량 (RDBMS, NoSQL, 시계열 DB)
• 대용량 데이터 (TB 단위) 처리를 위한 ETL 프로그램 설계 및 개발 능력
• 데이터 스트리밍·저장·처리·쿼리까지 이어지는 ELT 데이터 파이프라인 개발 및 운영
✔ 우대사항
• 스마트 팩토리, 제조 공정 데이터, 시계열 데이터 분석 프로젝트 경험을 가지신 분
• Python 기반 데이터 엔지니어링 생태계(Polars, DuckDB, Airflow 등) 활용 경험
• Apace Kafka, Apache Flink, Apache Spark 또는 유사 데이터 스트리밍 및 처리 프레임워크 활용 경험
• Apache Cassandra, MongoDB 또는 유사 NoSQL 데이터베이스 활용 경험
• InfluxDB, TimescaleDB 또는 유사 시계열 데이터베이스 활용 경험
• Apache Parquet, Avro 또는 유사 데이터 포맷 활용 경험