高性能计算工程师(端侧)
30-60k
深圳
经验不限
本科
招1人
今日更新
招聘
· 上海聚仕人才咨询有限公司
简历处理快
回复速度快
聊一聊
- 职位介绍
- 1、负责AI模型/智能体(Agent)在边缘计算平台的部署,全链路优化,量产落地;
2、CPU/GPU/NPU/Vision异构平台定位和分析性能瓶颈,内存访问优化,与算法团队合作改进算法设计,通过优化算法框架、模型结构、算子设计和异构调度,提高硬件计算效率,优化算法性能;
3、配合硬件团队完成软硬件联调,解决开发过程中出现的技术问题,提升产品性能与稳定性,解决生产调试中的技术问题;
4、负责开发跨端AI部署工具链、搭建软硬件系统,优化AI模型部署全流程的效率,构建AI部署能力。编写技术文档(设计方案、测试用例等),确保开发流程规范化。
【任职要求】
1、本科及以上学历,电子信息工程、计算机科学、自动化等相关专业;
2、熟悉C/C++/python语言,熟悉嵌入式端侧开发流程;
3、具备2年以上模型部署及优化开发经验:
a. 了解深度学习基本原理,熟悉NN基本架构和典型OP的计算方式,熟悉至少一种主流深度学习框架,如TensorFlow/PyTorch/Onnx等;熟悉常用CV计算库及NN推理计算库,如ACL/CUTLASS/TF Lite/TensorRT/QNN/MNN/tnn等;
b. 熟悉全栈模型压缩与加速,量化 (PTQ)、量化感知训练 (QAT)、结构化 / 非结构化稀疏、知识蒸馏
c. 熟悉内存与访存系统优化,攻克边缘设备内存带宽瓶颈,设计静态内存分配、特征图复用、数据布局优化方案
d. 熟悉边缘计算/异构计算平台(如NVIDIA Jetson系列、瑞芯微,高通等)的加速部署, 具备开发和调优经验,了解OpenVX/MediaPipe等异构计算框架,熟悉芯片体系结构和性能分析工具,掌握相应的编程接口或指令集, 能独立解决算子不支持、精度对齐及内存泄漏等工程问题。
e. 具备多模型工程化落地能力,设计多模型联合推理架构,实现特征共享与流水线并行,构建端到端的低延迟推理流水线,优化预处理、推理、后处理全链路
4、具备良好的逻辑思维能力和问题解决能力,对新技术有较强的学习兴趣和适应能力;
5、有团队合作精神,沟通表达能力强。
6、有RoboCon、RoboMaster等参赛经验者优先。
- 其他信息
- 语言要求:不限
- 行业要求:科技推广服务
猎聘温馨提示:
- 1. 如您发现平台内招聘方存在以下违规行为的,请立即举报
-
- · 扣押您的身份证件或者其他证件;
- · 要求您提供担保人、担保金或者以其他名义向您收取财物( 如培训费、体检费、资料费、置装费、押金等);
- · 强迫您入股或者向您集资;
- · 以招聘名义牟取不正当利益;
- · 发布虚假招聘广告信息;
- · 工作时长违反劳动法规定;
- · 存在其他损害您的合法权益的行为。
- 2. 如您应聘的岗位属于涉外劳务合作/海外岗位的,请务必核实招聘方对外劳务合作资质取得情况,同时注意自身资金安全,防范招聘欺诈。
- 了解更多安全防范知识>
- 3. 本平台招聘方不向求职者提供任何收费服务。
查看全部