岗位职责:
1. 负责深度学习模型的性能调参优化、模型训练与服务封装;
2. 负责LLM的预训练及微调相关工作,开展多模态大模型工程化及应用研究。基于大模型开展Agent研发;
3. 负责模型训练所需要的数据集建设规范制定;
4. 负责数据处理与分析、模型工程化开发与部署;
5. 跟踪人工智能领域相关方向前沿技术并开展探索实践与培训。
岗位要求:
1. 硕士及以上学历,人工智能、计算机、统计、数学等相关专业,有相关项目或实习经历者优先;
2. 扎实的相关领域理论基础:包括但不限于机器学习、统筹优化、数据分析、自然语言处理、大语言模型、深度学习等。良好的需求分析与建模分析能力,有数学建模经验优先;
3. 精通Linux操作系统及其开发环境部署、配置与优化;
4. 精通Python,熟悉Java、Golang,精通Pytorch框架及其他各类开源社区;
5. 熟悉大模型原理,具有Prompt工程及基于Langchain工具的开发经验,有多模态大模型领域经验者优先;
6. 对深度神经网络研究、通用大模型和NLP领域技术充满热情,在NLP/CV/ML顶会上发表论文者优先,获得过机器学习相关竞赛获奖者优先;
7. 具备良好的研究能力,可独立承担项目研究与小型团队管理;
8. 良好的英语听说读写能力,熟练阅读英文文献;
9. 热爱代码,具有良好的表达能力、沟通能力、自学能力、主动解决问题能力、团队协作能力,自律性强。