【岗位职责】
1、负责大模型基础网络架构的探索和研究;
2、负责新型网络架构在语言大模型、多模态大模型以及视觉大模型上的应用研究;
3、负责相关创新成果的技术报告、专利和论文撰写;
4、负责支撑以上成果在实际场景中应用落地。
【任职条件】
1. 博士学历,计算机科学等相关专业优先;
2. 熟悉计算机视觉、自然语言处理,多模态学习等人工智能相关方向的研究,有神经网络架构/模型骨干网络研究经验者优先;
3. 具备扎实的编程能力,熟练掌握Python/C++/Java/Golang的一种或多种编程语言,熟练掌握各类数据结构及相关算法;
4. 熟悉主流深度学习框架(Pytorch/TensorFlow/...)
5. 在人工智能和计算机视觉/自然语言处理顶级期刊和会议(如IJCV/TPAMI/TIP, ICCV/CVPR/ECCV,NIPS/ICML/ICLR/AAAI/IJCAI/ACL/NAACL/EMNLP/COLING等)上有文章发表