工作地点:
四川省-成都市
工作职责:
1.参与AI算子开发与优化,实现深度学习模型中的核心计算算子,并针对不同硬件平台(如GPU/NPU)进行性能优化,提升计算效率;
2.框架适配与功能测试,将开发的算子集成到主流AI框架(如PyTorch、TensorFlow)中,并完成功能验证与性能测试,确保稳定运行;
3.技术文档编写与团队协作,整理开发文档和优化记录,协助团队解决算子相关的技术问题,支持模型部署与调优。
任职资格:
1.有扎实的C/C++/Python编程能力;
2.良好的算法基础,熟悉时间复杂度和空间复杂度的计算方法;
3.软件Debug能力出众,能够高效的定位bug范围;
4.有CPU/GPU/DSP上底层函数库的功能开发和性能优化经历者优先;
5.理解深度学习理论,熟悉Tensorflow/Caffe/Pytorch/MXNet/PaddlePaddle等至少一种开源深度学习框架;
6.有较强的快速学习能力,良好的团队合作能力和沟通能力。
加分项:
1.有汇编优化经验;
2.有CUDA, RDMA,TensorRT, OpenCL或其他MPI并行计算/HPC开发经验;
3.有在基于深度学习的目标识别、目标检测、机器视觉、NLP领域有过工程经验。