마감 53일 전

[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)
[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)
기업형태
중소기업
접수기간
2026년 04월 07일(화) ~ 2026년 07월 07일(화)
모집직무
IT/인터넷
웹개발
응용프로그램개발
ERP/시스템개발/설계
네트워크/서버/보안
DBA/데이터베이스
콘텐츠/사이트운영
웹기획/PM/웹마케팅
HTML/퍼블리싱/UI개발
QA
게임
더보기
채용인원
0명
채용형태
인턴
근무지역
경기

상세내용

[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)




[담당업무]

1.데이터 수집 파이프라인 설계 및 구축 

-멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축 

-데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용 

-데이터팀과의 협업을 위한 Human-in-the-loop 기반 어노테이션 워크플로우 설계 및 운영 


2.모델 학습 

-대규모 Multi-modal representation learning 및 Cross-modal pretraining 기법의 연구 및 적용 

-다양한 질의응답 태스크에 대응하기 위한 Instruction tuning 전략 개발 

-학습과 추론 효율을 고려한 모델 구조 개선 및 최적화 기법 연구 


3.평가 

-문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용 

-실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입 

-지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현 


4.그 외 

-연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유 

-최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유 

-제품팀, MLOps팀 등과의 긴밀한 협업을 통한 모델의 실서비스 적용 및 시스템 통합




[자격요건]

-관련 분야 석사 혹은 박사 학위

-AI 문제를 정의하고 해결하는 능력

-기초 머신러닝 알고리즘에 대한 깊은 이해

-Python, C++ 등의 언어를 활용한 강력한 프로그래밍 능력 및 Linux/Shell 활용 능력

-컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 학습 최신 알고리즘 이해

-주요 기계 학습 프레임워크에 대한 깊은 이해(예: TensorFlow, PyTorch)

-다양한 협업 환경에서 일할 수 있는 능력

-훌륭한 의사 소통 능력




[우대사항]

-Vision–Language Model 관련 연구 및 논문(e.g. CVPR, ICCV, ACL, EMNLP) 게재 경험

-국제 혹은 국내 AI 대회(Kaggle 등) 상위권 입상

-새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력

-멀티모달 VLM 최적화 및 도메인 적응(fine-tuning) 경험



[채용공고]








자세한 내용은 반드시 해당 홈페이지 또는 직접 문의를 통해 안내 받으세요.

AD


기업문화 엿볼 때, 더팀스

로그인

/