커리어 성장을 위한 모든 정보, 더팀스

마감 53일 전

[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)

기업형태

중소기업

접수기간

2026년 04월 07일(화) ~ 2026년 07월 07일(화)

모집직무

IT/인터넷

웹개발

응용프로그램개발

ERP/시스템개발/설계

네트워크/서버/보안

DBA/데이터베이스

콘텐츠/사이트운영

웹기획/PM/웹마케팅

HTML/퍼블리싱/UI개발

게임

채용인원

0명

채용형태

인턴

근무지역

경기

홈페이지

https://careers.upstage.ai/ko/upstage

홈페이지 지원링크

상세내용

[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)

[담당업무]

1.데이터 수집 파이프라인 설계 및 구축

-멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축

-데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용

-데이터팀과의 협업을 위한 Human-in-the-loop 기반 어노테이션 워크플로우 설계 및 운영

2.모델 학습

-대규모 Multi-modal representation learning 및 Cross-modal pretraining 기법의 연구 및 적용

-다양한 질의응답 태스크에 대응하기 위한 Instruction tuning 전략 개발

-학습과 추론 효율을 고려한 모델 구조 개선 및 최적화 기법 연구

3.평가

-문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용

-실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입

-지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현

4.그 외

-연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유

-최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유

-제품팀, MLOps팀 등과의 긴밀한 협업을 통한 모델의 실서비스 적용 및 시스템 통합

[자격요건]

-관련 분야 석사 혹은 박사 학위

-AI 문제를 정의하고 해결하는 능력

-기초 머신러닝 알고리즘에 대한 깊은 이해

-Python, C++ 등의 언어를 활용한 강력한 프로그래밍 능력 및 Linux/Shell 활용 능력

-컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 학습 최신 알고리즘 이해

-주요 기계 학습 프레임워크에 대한 깊은 이해(예: TensorFlow, PyTorch)

-다양한 협업 환경에서 일할 수 있는 능력

-훌륭한 의사 소통 능력

[우대사항]

-Vision–Language Model 관련 연구 및 논문(e.g. CVPR, ICCV, ACL, EMNLP) 게재 경험

-국제 혹은 국내 AI 대회(Kaggle 등) 상위권 입상

-새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력

-멀티모달 VLM 최적화 및 도메인 적응(fine-tuning) 경험

[채용공고]

자세한 내용은 반드시 해당 홈페이지 또는 직접 문의를 통해 안내 받으세요.