Mô tả Công việc
Trách nhiệm Chính
- Theo dõi liên tục xu hướng phát triển công nghệ trong các lĩnh vực CV, NLP, đa phương thức, tiến hành nghiên cứu thuật toán tiên tiến và kiểm chứng công nghệ
- Chủ trì hoặc tham gia vào quy trình phát triển mô hình tiền huấn luyện quy mô lớn, bao gồm tiền xử lý dữ liệu, huấn luyện mô hình, điều chỉnh tham số và đánh giá hiệu suất
- Thiết kế và triển khai các giải pháp công nghệ AI, phát triển và triển khai tùy chỉnh mô hình cho các kịch bản nghiệp vụ cụ thể
- Tiến hành phân tích khả thi đầu tư dự án AI, viết báo cáo đánh giá công nghệ và đề xuất ý tưởng đổi mới
- Phối hợp với nhóm sản phẩm và thuật toán, thúc đẩy ứng dụng thương mại và triển khai thực tế các thành tựu công nghệ
- Duy trì hệ thống tài liệu kỹ thuật, xây dựng kho kiến thức và quy chuẩn thực hành tốt nhất cho phát triển mô hình
- Tham gia đánh giá phương án kỹ thuật, thực hiện luận chứng chuyên môn về hiệu suất mô hình, hiệu quả tính toán và tính khả thi kỹ thuật
- Theo dõi các hội nghị quốc tế hàng đầu (như NeurIPS, ICML) và động thái nghiên cứu, duy trì nhạy bén công nghệ
- Thiết kế hệ thống chỉ số đánh giá mô hình, xây dựng khung phân tích định lượng hiệu quả mô hình
- Tối ưu hóa hiệu quả suy luận mô hình, khám phá các giải pháp công nghệ nhẹ như nén mô hình, chưng cất
Yêu cầu Công việc
- Bằng thạc sĩ trở lên, chuyên ngành khoa học máy tính, trí tuệ nhân tạo, học máy hoặc lĩnh vực liên quan
- Thành thạo ngôn ngữ lập trình Python/C++, quen thuộc với các framework học sâu như TensorFlow, PyTorch
- Có ít nhất 3 năm kinh nghiệm phát triển mô hình lớn, ưu tiên ứng viên có nền tảng phát triển mô hình tiền huấn luyện (như BERT, GPT series)
- Hiểu biết về framework huấn luyện phân tán (như Horovod, DeepSpeed), nắm vững công nghệ tăng tốc phần cứng GPU/TPU
- Có nền tảng toán học vững chắc, am hiểu lý thuyết xác suất, đại số tuyến tính, thuật toán tối ưu hóa
- Hiểu biết về phương pháp luận đánh giá đầu tư dự án AI, có khả năng phân tích kinh tế kỹ thuật
- Có khả năng hợp tác đa nhóm tốt, giao tiếp hiệu quả với nhóm sản phẩm, kỹ thuật và dữ liệu
- Kỹ năng đọc viết tiếng Anh xuất sắc, có thể đọc tài liệu kỹ thuật và viết báo cáo nghiên cứu bằng tiếng Anh
- Ưu tiên ứng viên có chứng chỉ chuyên môn liên quan (như chứng chỉ AWS Machine Learning, TensorFlow Developer)
- Có tư duy logic tốt, có thể phân tích và giải quyết độc lập các vấn đề kỹ thuật phức tạp
- Hiểu biết về quy trình triển khai mô hình, nắm vững công nghệ container hóa như Docker, Kubernetes
- Có khả năng trực quan hóa dữ liệu, thành thạo các công cụ như Matplotlib, Tableau
- Hiểu biết về yêu cầu đạo đức và tuân thủ AI, có ý thức đánh giá rủi ro công nghệ
- Có kỹ năng quản lý thời gian tốt, có thể thúc đẩy hiệu quả nhiều nhiệm vụ nghiên cứu song song
- Hiểu biết về phương pháp đánh giá hiệu quả mô hình, nắm vững kỹ thuật phân tích như A/B testing, ma trận nhầm lẫn
