岗位职责:
1.基于pytorch优化模型多机多卡训练效率;
2.在不同平台上部署深度学习模型,包括CUDA,海思,amba,TI等,和深度学习算法工程师配合,深度优化模型训练效率,压榨硬件性能;
3.在不同平台上部署深度学习模型,提供量化支持,优化模型部署及推理效率,做到极致;
4.组织编写技术文档,面向全公司各类项目提供深度学习相关技术支撑。
任职要求:
1.熟练掌握C++、python中的一种,另一种也需要了解,两种都精通的优先;
2.熟悉常见深度学习模型,了解ONNX;
3.熟悉深度学习模型分布式训练或者不同平台的模型量化部署流程和细节,有分布式训练优化经验或模型量化性能调优经验的优先;
4.熟悉NVGPU体系架构或海思NPU体系结构的优先;
5.熟悉高性能计算的优化方法,或有深度学习算子优化加速经验者优先。