마감 62일 전

[디노티시아] Optimization Engineer
[디노티시아] Optimization Engineer
기업형태
중소기업
접수기간
2026년 01월 19일(월) ~ 2026년 04월 20일(월)
모집직무
DBA/데이터베이스
ERP/시스템개발/설계
응용프로그램개발
IT/인터넷
BI 엔지니어
데이터 엔지니어
파이썬 개발자
CTO
DevOps / 시스템 관리자
시스템엔지니어(SE)
임베디드 개발자
블록체인 플랫폼 엔지니어
하드웨어 엔지니어
Android앱개발
C,C++ 개발자
iOS 개발자
소프트웨어 엔지니어
안드로이드 개발자
크로스플랫폼 앱 개발자
채용인원
0명
회사위치
서울 서초구 강남대로51길 1
근무지역
서울
지원방식
접수페이지

상세내용

[디노티시아] Optimization Engineer




[담당업무]


• LLM 추론 엔진의 설계 및 개발


• 오픈소스 기반 추론 프레임워크(e.g., vLLM)의 구조 분석 및 커스터마이징


• LLM 워크로드에 대한 정량적 분석 및 병목 지점 프로파일링


• Quantization 및 Pruning 기법을 활용한 추론 경량화 및 최적화 설계 및 구현


• 최신 논문 및 공개된 구현체 기반 최적화 기법 지속적 습득 및 적용


• 시스템/하드웨어 특성에 맞춘 추론 경로 최적화 (e.g., CPU-GPU 간 데이터 이동 최소화, 메모리 계층 활용 등)




[자격요건]


• [신입] 유관 전공 학사 이상


• [경력] 유관 업무 3년 이상


• C++ 또는 Python 기반 개발 능력


• Transformer 구조 및 LLM 아키텍처에 대한 기초적인 이해


• Quantization 또는 Pruning 기법에 대한 이론 및 실습 경험


• Git, Linux 환경 기반 개발 및 디버깅 경험




[우대사항]


• vLLM 또는 유사한 LLM 추론 엔진 내부 구조에 대한 깊은 이해 및 수정 경험


• CUDA 및 GPU 최적화 커널 개발 경험


• GPU 아키텍처 및 메모리 계층 구조에 대한 실질적인 이해 (e.g., HBM, L2 cache, shared memory 등)


• TorchScript, TorchDispatch, TorchDynamo 등 PyTorch 시스템 레이어 경험


• 다음 분야에 대한 이해 및 실무 활용 능력 :


   - Computer Architecture (CPU-GPU 파이프라인, 메모리 계층 구조 등)


   - Heterogeneous Computing (CPU-GPU 협업 및 오프로드 전략 등)


   -  Operating System 기초 (메모리 관리, 스케줄링, IO path 등)


• LLM 추론 관련 최신 논문 및 구현체를 빠르게 분석하고 적용하는 능력







지원동기 질문
자유양식 입니다.
자세한 내용은 반드시 해당 홈페이지 또는 직접 문의를 통해 안내 받으세요.

AD


기업문화 엿볼 때, 더팀스

로그인

/