Data Infra Senior Engineer (深度学习框架)
职位编号 J027091
行业 汽车/摩托车(制造/维护/配件/销售/服务)
类型
所在地 广州市 
职位描述:
职责描述 1. 负责深度学习超大规模数据集高性能高可用分布式存储的研发. 2. 参与大规模深度学习平台研发,积极参与ai/data infra开源项目,并能和自研平台做功能集成 3. 深入分析训练过程中出现的系统故障和性能瓶颈,并设计可靠解决方案.
职位要求:
职位要求 1. 较强的代码能力, 良好的编程习惯,精通python/golang,熟悉c++/java. 2. 精通kubernetes生态系统,熟悉kubeflow. 3. 深入理解分布式存储原理及实现,熟悉分布式文件系统和对象存储. 4. 深入理解主流深度学习平台构架,并熟悉pytorch. 5. 责任心强,自我驱动,工作有激情,并具备良好的沟通能力和团队合作能力. 满足以下条件者优先 1. 精通 kubeflow / mlflow / pytorch / mindspore/ tensorflow. 3. 精通tfserving / torchserve / automl 4. 精通深度学习性能调优工具和自动化调参平台