[디노티시아] Optimization Engineer

마감 15일 전

기업형태

중소기업

접수기간

2026년 01월 19일(월) ~ 2026년 04월 20일(월)

모집직무

DBA/데이터베이스

ERP/시스템개발/설계

응용프로그램개발

IT/인터넷

BI 엔지니어

데이터 엔지니어

파이썬 개발자

CTO

DevOps / 시스템 관리자

시스템엔지니어(SE)

임베디드 개발자

블록체인 플랫폼 엔지니어

하드웨어 엔지니어

Android앱개발

C,C++ 개발자

iOS 개발자

소프트웨어 엔지니어

안드로이드 개발자

크로스플랫폼 앱 개발자

채용인원

0명

회사위치

서울 서초구 강남대로51길 1

근무지역

서울

홈페이지

https://dnotitia.com/ko/

지원방식

접수페이지

접수페이지 지원링크

상세내용

[디노티시아] Optimization Engineer

[담당업무]

• LLM 추론 엔진의 설계 및 개발

• 오픈소스 기반 추론 프레임워크(e.g., vLLM)의 구조 분석 및 커스터마이징

• LLM 워크로드에 대한 정량적 분석 및 병목 지점 프로파일링

• Quantization 및 Pruning 기법을 활용한 추론 경량화 및 최적화 설계 및 구현

• 최신 논문 및 공개된 구현체 기반 최적화 기법 지속적 습득 및 적용

• 시스템/하드웨어 특성에 맞춘 추론 경로 최적화 (e.g., CPU-GPU 간 데이터 이동 최소화, 메모리 계층 활용 등)

[자격요건]

• [신입] 유관 전공 학사 이상

• [경력] 유관 업무 3년 이상

• C++ 또는 Python 기반 개발 능력

• Transformer 구조 및 LLM 아키텍처에 대한 기초적인 이해

• Quantization 또는 Pruning 기법에 대한 이론 및 실습 경험

• Git, Linux 환경 기반 개발 및 디버깅 경험

[우대사항]

• vLLM 또는 유사한 LLM 추론 엔진 내부 구조에 대한 깊은 이해 및 수정 경험

• CUDA 및 GPU 최적화 커널 개발 경험

• GPU 아키텍처 및 메모리 계층 구조에 대한 실질적인 이해 (e.g., HBM, L2 cache, shared memory 등)

• TorchScript, TorchDispatch, TorchDynamo 등 PyTorch 시스템 레이어 경험

• 다음 분야에 대한 이해 및 실무 활용 능력 :

- Computer Architecture (CPU-GPU 파이프라인, 메모리 계층 구조 등)

- Heterogeneous Computing (CPU-GPU 협업 및 오프로드 전략 등)

- Operating System 기초 (메모리 관리, 스케줄링, IO path 등)

• LLM 추론 관련 최신 논문 및 구현체를 빠르게 분석하고 적용하는 능력

지원동기 질문

자유양식 입니다.

자세한 내용은 반드시 해당 홈페이지 또는 직접 문의를 통해 안내 받으세요.