마감 53일 전
[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)
[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)
[담당업무]
1.데이터 수집 파이프라인 설계 및 구축
-멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축
-데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용
-데이터팀과의 협업을 위한 Human-in-the-loop 기반 어노테이션 워크플로우 설계 및 운영
2.모델 학습
-대규모 Multi-modal representation learning 및 Cross-modal pretraining 기법의 연구 및 적용
-다양한 질의응답 태스크에 대응하기 위한 Instruction tuning 전략 개발
-학습과 추론 효율을 고려한 모델 구조 개선 및 최적화 기법 연구
3.평가
-문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용
-실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입
-지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현
4.그 외
-연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유
-최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유
-제품팀, MLOps팀 등과의 긴밀한 협업을 통한 모델의 실서비스 적용 및 시스템 통합
[자격요건]
-관련 분야 석사 혹은 박사 학위
-AI 문제를 정의하고 해결하는 능력
-기초 머신러닝 알고리즘에 대한 깊은 이해
-Python, C++ 등의 언어를 활용한 강력한 프로그래밍 능력 및 Linux/Shell 활용 능력
-컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 학습 최신 알고리즘 이해
-주요 기계 학습 프레임워크에 대한 깊은 이해(예: TensorFlow, PyTorch)
-다양한 협업 환경에서 일할 수 있는 능력
-훌륭한 의사 소통 능력
[우대사항]
-Vision–Language Model 관련 연구 및 논문(e.g. CVPR, ICCV, ACL, EMNLP) 게재 경험
-국제 혹은 국내 AI 대회(Kaggle 등) 상위권 입상
-새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력
-멀티모달 VLM 최적화 및 도메인 적응(fine-tuning) 경험
[채용공고]
