工作地点:
江苏省-南京市
工作职责:
仅接收24/25届毕业生,ai芯片公司相关实习经验优先;
1.构建和完善AI芯片软件栈的performance分析和benchmark;
2.针对典型应用场景分析系统性能瓶颈,并提出改进方案;
3.与软硬件架构师一起进行软件流程及架构探索;
4.驱动并解决跨团队的性能问题。
任职资格:
1.计算机/电子信息类专业学历;
2.熟悉C/C++/Python/Shell,具备高性能编程能力,熟悉多线程编程;
3.了解主要大模型基础结构和主要算子的计算细节;
4.对计算机体系结构有深刻理解;
5.熟练使用Linux工作环境,熟悉反汇编;
6.有较强的快速学习能力,有韧性和耐心,喜欢探索新事物;
7.良好的跨团队合作能力和沟通能力;
加分项:
1.对Linux驱动和各种高性能IO有一定了解
2.有从系统角度,性能提升的直接经验;
3.了解常用的benchmark工具,比如Sysbench、iometer、netperf;
4.了解常用的性能分析工具,比如SystemTap、perf、vtune、gperf、oprofile、火焰图;
5.有CPU、GPU、SoC或其它IP的软硬件调优经验;
6.有DPDK、RDMA、SPDK、PCIe等各方面性能提升的经验尤佳;
7.有CUDA、OpenCL开发或调试经验;
8.熟悉Tensorflow/Caffe/Pytorch/MXNet/PaddlePaddle等一种深度学习框架。