【岗位职责】
作为AI核心技术人员参与广东联通算网大脑系统建设,具体职责如下:
1. 负责研发和维护深度学习框架:负责研发和维护 AI 训练框架(Tensorflow,Pytorch),提供高效、可扩展、易用的编程接口,支持多种硬件平台和操作系统。
2. 负责跨云大规模分布式训练:针对大规模数据和模型的训练需求,需要支持分布式训练,包括参数服务器、分布式优化等技术的设计和实现。
3. 负责训练和推理的性能优化:为了提高框架的性能和可扩展性,需要进行各种性能优化,如GPU加速计算、减少内存占用、降低网络通信开销等。
4. 负责深度学习研究和创新:除了开发框架和工具外,还需要进行深度学习研究和探索,推动 AI 技术的进一步发展
5、完成相应技术文档、专利撰写;
【任职条件】
1.具有博士学位,专业背景包括计算机科学、人工智能或电子电路相关领域;
2. 熟练掌握C++和Python语言开发;
3. 熟练掌握Tensorflow/Pytorch进行模型训练和推理,具有一些Tensorflow/Pytorch框架的开发和维护经验,Tensorflow/Pytorch相关开源项目贡献者优先;
4. 具有多GPU并行训练,GPU性能优化的经验优先;