一、岗位职责: 1、理解不同硬件(Intel CPU/GPU/FPGA/ARM/ASIC)的体系结构,能在CPU和GPU层面上优化算法,达到加速效果。 2、能够从整体上平衡系统与算法,量化分析并给出优化决策以及优化后的提升结果。 3、针对异构架构,开发和优化深度学习推理框架,将硬件性能发挥到极致。 二、任职资格: 1、有扎实的计算机体系结构、并行计算、编译原理、操作系统知识。 2、有扎实的操作系统基础和整体系统性思维,熟悉Linux或安卓操作系统和C/C++编程语言,Shell/Python等脚本语言,具备系统软件开发能力。 3、掌握Linux下性能剖析和优化工具,掌握编译器,微架构性能优化手段,有优化经验者优先。 4、有优秀的逻辑分析能力,定位和分析问题,并提出解决方案,愿意接受挑战。 三、加分项: 1、有矩阵运算、计算机视觉和图像处理算法在不同处理器上移植和调优经验的优先。 2、有熟悉ARM Intrinsic、Intel Intrinsic、Nvidia Cuda开发者优先。 3、有熟悉开源推理框架的设计、原理、实现优先。 4、有熟悉Caffe/TensorFlow/MXNet等训练/推断框架源码优先。 |