工作职责
1、负责/参与大模型的训练、对齐、微调、诊断与评估,保障大模型在相关业务领域的能力不断提升;
2、负责/参与大模型、深度学习数智创新研究中心与机器学习算法在国产硬件平台上的兼容适配与性能优化工作;
3、负责/参与大模型的部署与维护,协同推动大模型在各个业务场景的落地应用,支持业务目标的实现;
4、持续跟进最新的研究成果与动态,对前沿技术进行评估验证,持续提升模型性能水平;
5、参与大模型的迭代、训练与优化,持续提高模型在业务场景中的性能与应用价值;
6、与产品经理、数据开发工程师等其他团队成员紧密合作,共同克服项目中的困难与挑战,确保项目顺利推动落地。
任职要求
1、在大模型/NLP/深度学习/机器学习领域具有一定的工作实习或研究经验;
2、项目运作能力,敏锐的商业分析能力,良好的职业操守;
3、有一定的工程能力;参与过深度学习的工程应用项目,有大模型在化工领域的工程应用经验者优先;或有CUDA或相关算子开发优化经验者优先;
4、熟悉Python与C/C++;熟练掌握TensorFlow、PyTorch等深度学习框架;或熟练掌握Linux系统,了解TensorFlow、PyTorch等深度学习框架;
5、能够解决复杂问题,有较强的抗压能力和自驱力。