[카카오] LLM Research Engineer (Pre-training) (신입/경력)

마감 85일 전

기업형태

대기업

접수기간

2026년 06월 19일(금) ~ 2026년 09월 18일(금)

모집직무

IT/인터넷

통신기술/네트워크구축

웹개발

응용프로그램개발

ERP/시스템개발/설계

네트워크/서버/보안

DBA/데이터베이스

HTML/퍼블리싱/UI개발

게임

연구개발/설계

콘텐츠/사이트운영

웹기획/PM/웹마케팅

.NET 개발자

Node.js 개발자

PHP 개발자

루비온레일즈 개발자

웹 개발자

웹프로그래머

자바 개발자

프론트엔드 개발자

Android앱개발

C,C++ 개발자

iOS 개발자

소프트웨어 엔지니어

안드로이드 개발자

크로스플랫폼 앱 개발자

CTO

DevOps / 시스템 관리자

시스템엔지니어(SE)

임베디드 개발자

블록체인 플랫폼 엔지니어

하드웨어 엔지니어

CIO

네트워크관리

네트워크엔지니어

보안 엔지니어

보안컨설팅

서버 개발자

시스템, 네트워크 관리자

시스템•네트워크 컨설팅

시스템운영

시스템프로그래머

정보보안

BI 엔지니어

데이터 엔지니어

파이썬 개발자

UI•UX 디자인

웹 퍼블리셔

모바일디자인

웹디자인

QA, 테스트 엔지니어

검증

기술지원

웹마스터

CS•고객지원

GM•게임운영

QA•베타테스터

VR 엔지니어

게임CS

게임개발

게임기획

게임디자인

게임마케팅

게임방송

게임시나리오

게임운영

게임음악효과음

그래픽스 엔지니어

서버•네트웍개발

영상,음성 엔지니어

온라인게임

클라이언트개발

테스터

채용인원

0명

회사위치

경기 성남시 분당구 판교역로 166

근무지역

경기

홈페이지

https://www.kakaocorp.com/page/

지원방식

접수페이지

접수페이지 지원링크

상세내용

[카카오] LLM Research Engineer (Pre-training) (신입/경력)

[모집기간]

채용 시 마감

[담당업무]

-추론 및 학습에 효율적인 LLM 구조 탐색 및 최적화 (e.g. Mixture of Experts, Gated Delta Net, Kimi Linear)

-비용 효율화를 위한 학습 최적화 및 데이터 최적화 (e.g., Fp-8 training, Dataset mixture search)

-비용 효율적인 언어 모델 학습을 위한 알고리즘 연구 및 응용 (e.g., Pruning & Distillation, Hyperparameter transfer, Scaling law, Optimizer)

-LLM 학습을 위한 대규모 데이터 수집, 생성 및 메타 정보 부착기술 개발 및 연구 (e.g. Synthetic dataset generation)

[자격요건]

-CS/AI/ML 등 관련 전공 석사 이상 혹은 이에 준하는 관련 프로젝트 경험을 보유하신 분

-Data/Model/Pipeline/Context/Expert Parallel 등 Model parallel 기반의 모델 학습 경험

-연구/개발에 대한 지속적인 관심과 새로운 기술/업무에 대한 도전 정신을 가지신 분

[우대사항]

-Low-precision training 관련 연구/개발 경험 (e.g., FP8/MXFP4 학습 시 수치 안정성 확보, loss scaling, tensor-wise/block-wise scaling 전략 설계)

-Quantization-Aware Training(QAT) 및 저비트 양자화(W4A8, W4A16 등) 환경에서의 LLM 학습 경험 (e.g., STE 기반 학습, rotation/smoothing 기법 적용, PTQ 대비 품질 회복)

-Knowledge Distillation을 활용한 모델 압축 연구 경험 (e.g., logit/feature-level distillation, on-policy distillation, teacher-student 학습 파이프라인 설계)

-LLM 관련 kernel 개발 경험 (e.g., Triton, CUDA 기반 custom kernel)

-Data/Model/Pipeline/Context/Expert Parallel 등 분산 학습 전략 설계 및 프레임워크(e.g., Megatron-LM, DeepSpeed, FSDP) 기여 경험

-LLM 학습 데이터의 품질 향상과 평가를 위한 연구 개발 경험 및 페타바이트 수준의 텍스트 데이터 수집 및 분산 처리 경험

-대규모 클러스터 환경(e.g., GPU / TPU)에서 초거대 모델 학습을 위한 최적화 경험 (e.g., communication overlap, activation recomputation, memory-efficient optimizer)

[채용공고]

지원동기 질문

자유양식 입니다.

자세한 내용은 반드시 해당 홈페이지 또는 직접 문의를 통해 안내 받으세요.