工作职责:
1、负责辅助驾驶、事件检测、人员行为检测等场景下的视觉感知和多模态模型研发;
2、完成视觉算法模型的设计以及工程化落地,如模型优化、模型架构重构等;
3、研究多模态大模型在视觉检测领域的可行性,综合效果和成本因素考虑,选择最优方案;
4、持续跟进多模态新技术发展趋势,寻找并实施最佳技术方案;
5、维护并优化模型推理平台,达成推理效率最优。
任职资格:
1、学历:硕士及以上学历。
2、专业:计算机科学、软件工程、数学、自动化、人工智能相关专业。
3、能力要求:
①熟悉主流深度学习算法,精通一/多个领域,包括但不限于目标检测、分割、跟踪、多任务学习、立体视觉等领域。
②精通至少一种编程语言,通常是Python,需要熟悉C++,,掌握至少一种的深度学习训练框架(Pytorch, MXNet, Tensorflow等)。
③熟悉多模态大模型基本原理,掌握视觉模型标注、训练、部署、推理优化及badcase回归等闭环链路,有实际多模态大模型应用经验者优先。
④了解大模型发展趋势,有大模型应用项目经验者优先。
4、素质要求:思路清晰,思维敏捷,学习能力强,善于沟通协作,有强烈的上进心和求知欲,具备创造性思维,能够将全新想法转化为工程应用。