마감 62일 전
[디노티시아] Optimization Engineer
[디노티시아] Optimization Engineer
[담당업무]
• LLM 추론 엔진의 설계 및 개발
• 오픈소스 기반 추론 프레임워크(e.g., vLLM)의 구조 분석 및 커스터마이징
• LLM 워크로드에 대한 정량적 분석 및 병목 지점 프로파일링
• Quantization 및 Pruning 기법을 활용한 추론 경량화 및 최적화 설계 및 구현
• 최신 논문 및 공개된 구현체 기반 최적화 기법 지속적 습득 및 적용
• 시스템/하드웨어 특성에 맞춘 추론 경로 최적화 (e.g., CPU-GPU 간 데이터 이동 최소화, 메모리 계층 활용 등)
[자격요건]
• [신입] 유관 전공 학사 이상
• [경력] 유관 업무 3년 이상
• C++ 또는 Python 기반 개발 능력
• Transformer 구조 및 LLM 아키텍처에 대한 기초적인 이해
• Quantization 또는 Pruning 기법에 대한 이론 및 실습 경험
• Git, Linux 환경 기반 개발 및 디버깅 경험
[우대사항]
• vLLM 또는 유사한 LLM 추론 엔진 내부 구조에 대한 깊은 이해 및 수정 경험
• CUDA 및 GPU 최적화 커널 개발 경험
• GPU 아키텍처 및 메모리 계층 구조에 대한 실질적인 이해 (e.g., HBM, L2 cache, shared memory 등)
• TorchScript, TorchDispatch, TorchDynamo 등 PyTorch 시스템 레이어 경험
• 다음 분야에 대한 이해 및 실무 활용 능력 :
- Computer Architecture (CPU-GPU 파이프라인, 메모리 계층 구조 등)
- Heterogeneous Computing (CPU-GPU 협업 및 오프로드 전략 등)
- Operating System 기초 (메모리 관리, 스케줄링, IO path 등)
• LLM 추론 관련 최신 논문 및 구현체를 빠르게 분석하고 적용하는 능력
