招聘人数:若干人
政治面貌:不限
婚况要求:不限婚况
专业要求:人工智能,计算机科学与技术,计算机技术,计算机类,计算机应用技术
工作职责:
1.参与语言、多模态基础大模型研发,设计、优化模型架构与算法,提升模型性能;
2.深入研究多模态大模型,支持图像识别、视觉问答和跨模态生成等任务;
3.优化模型训练流程,提升文本及其他模态数据的处理效率与质量;
4.实现模型微调(如SFT、RLHF、DPO等)与适配方案,针对不同下游任务进行性能优化,支撑大模型应用开发;
5.参与构建评估体系,测试模型在语言理解、知识应用和多模态任务上的表现;
6.跟踪大模型相关前沿技术及外围技术,推动团队技术研发,支撑技术转化落地。
任职资格:
1.人工智能、计算机或相关领域硕士及以上学历,有大语言模型或多模态模型研究开发经验;
2.熟悉Transformer架构,了解GPT、LLaMA、Mistral等语言模型与CLIP、BLIP、LLaVA等多模态模型原理;
3.具备NLP或CV基础,掌握注意力机制、自监督学习和对比学习等核心技术;
4.熟练使用PyTorch等深度学习框架,了解DeepSpeed、FSDP、Megatron-LM等分布式训练系统;
5.熟悉LoRA、QLoRA、PEFT等高效微调方法,能实现SFT、RLHF或DPO等对齐技术;
6.具备Agent、RAG、Text2SQL等基础技术核心算法及模型研发经验者优先;
7.具备团队协作与解决问题的能力,热爱技术创新。