직무 설명
AI 대형 모델 연구개발 엔지니어는 인공지능 분야의 최첨단 기술 연구개발을 담당하는 핵심 직무로, 컴퓨터 비전(CV), 자연어 처리(NLP) 및 멀티모달 융합 등의 분야에 주력합니다. 이 직무는 대규모 사전 훈련 모델의 아키텍처 설계 및 알고리즘 최적화에 깊이 관여함과 동시에 AI 기술 투자 및 연구 관련 특별 업무를 수행하여 회사의 기술 전략에 데이터 지원과 혁신 방향을 제공합니다.
주요 책임
- CV, NLP, 멀티모달 등 분야의 기술 발전 동향을 지속적으로 추적하고, 최신 알고리즘 연구 및 기술 검증 수행
- 대규모 사전 훈련 모델 개발 프로세스 주도 또는 참여 (데이터 전처리, 모델 훈련, 파라미터 튜닝 및 성능 평가 포함)
- AI 기술 솔루션 설계 및 구현, 특정 비즈니스 시나리오에 맞춘 모델 맞춤형 개발 및 배포
- AI 프로젝트 투자 타당성 분석 수행, 기술 평가 보고서 작성 및 혁신 제안 제시
- 제품 및 알고리즘 팀과 협력하여 기술 성과의 상용화 및 실제 적용 추진
- 기술 문서 체계 유지, 모델 개발 지식 베이스 및 모범 사례 규정 수립
- 기술 솔루션 검토 참여, 모델 성능, 계산 효율성 및 공학적 실현 가능성에 대한 전문적 논증
- NeurIPS, ICML 등 국제 최고 수준 학회 및 논문 동향 추적, 기술 감수성 유지
- 모델 평가 지표 체계 설계, 모델 효과의 정량적 분석 프레임워크 구축
- 모델 추론 효율성 최적화, 모델 압축 및 증류 등의 경량화 기술 솔루션 탐구
자격 요건
- 석사 이상 학위, 컴퓨터 과학/인공지능/머신러닝 등 관련 전공
- Python/C++ 프로그래밍 언어 숙련, TensorFlow/PyTorch 등 딥러닝 프레임워크 경험
- 3년 이상 대형 모델 연구개발 경험, 사전 훈련 모델(BERT/GPT 시리즈 등) 개발 경험자 우대
- 분산 훈련 프레임워크(Horovod/DeepSpeed 등) 경험, GPU/TPU 등 하드웨어 가속 기술 숙지
- 확률론/선형대수/최적화 알고리즘 등 수학적 기초 지식 보유
- AI 프로젝트 투자 평가 방법론 이해, 기술 경제 분석 능력 보유
- 제품/엔지니어링/데이터 팀과의 효율적 협업 능력
- 영어 기술 문서 독해 및 연구 보고서 작성 능력
- AWS 머신러닝 인증/TensorFlow 개발자 인증 등 관련 자격증 보유자 우대
- 복잡한 기술 문제 분석 및 독립적 해결 능력
- Docker/Kubernetes 등 컨테이너 기술을 활용한 모델 배포 프로세스 경험
- Matplotlib/Tableau 등 데이터 시각화 도구 활용 능력
- AI 윤리 및 규정 준수 요건 이해, 기술 리스크 평가 역량
- 다중 연구개발 과제를 효율적으로 관리하는 시간 관리 능력
- A/B 테스트/혼동 행렬 등 모델 평가 방법론 숙지