高级GolangGPU调度开发工程师
1-1.8万元/月【岗位职责】
1、参与GPU调度器/资源管理器的设计与开发。
2、实现GPU资源发现、健康检查、隔离(MIG/ComputeModes)、配额与回收策略。
3、设计并优化调度策略(优先级、抢占、亲和性、拓扑感知调度、NUMA/PCIe-aware)。
4、与容器编排(Kubernetes)集成:开发DevicePlugin、CSI、SchedulerExtender、AdmissionController等组件。
5、与底层驱动/运行时协同(nvidia-driver、nvidia-container-toolkit、ROCm、containerd/runc/crun)。
6、负责平台后端服务的开发与维护,使用Go语言构建高性能、可扩展的调度系统。
7、设计和实现RESTfulAPI、gRPC,与前端数据和中间件交互。
8、编写高质量单元/集成测试与自动化部署。
9、与产品经理、前端开发、设计师等团队紧密合作,确保项目按时交付。
10、编写技术文档,记录系统设计和实现细节,提供API文档,方便其他开发者使用。
【任职要求】
1、精通Golang,熟悉常用并发模型(goroutine、channel、context)与性能优化技巧。
2、有GPU相关开发经验,了解NVIDIA驱动、CUDA、nvidia-smi、nvidia-container-toolkit;了解MIG/多租户GPU隔离机制者优先。
3、熟悉容器与容器运行时(Docker、containerd、runc/crun)以及Kubernetes的工作原理(Controller、Scheduler、Admission)。
4、有分布式系统/调度算法的实践经验(调度公平性、优先级、抢占、负载均衡等)。
5、良好的代码能力、文档撰写能力、英文文档阅读能力与团队协作能力。
【加分项】
1、有实现KubernetesDevicePlugin、SchedulerExtender、CustomScheduler或自研调度器经验。
2、有Slurm、Torque、LSF、Volcano等HPC作业调度器经验。
3、熟悉ROCm/AMDGPU生态者优先。
4、有性能分析(pprof)、追踪(OpenTelemetry)、监控(Prometheus)实战经验。
5、熟悉云厂商GPU产品(例如AWS/GCP/Azure的GPU实例)和混合云/多租户策略。
6、有分布式对象存储、高性能存储的经验。
-
催乳师
8000-10000/元投递简历
-
【新塘】30招做长期组装工
10388-10500/元投递简历
-
学校宿管(进港大道包住)
3800-4000/元投递简历
-
广州滴滴司机-薪酬日结
9000-13500/元投递简历
-
急招催乳/产康师/包吃住/新手可招
8000-15000/元投递简历
-
【石碁】联昊通快递司机
面议投递简历
-
【石碁】会计文员(话补)
4500-5000/元投递简历
-
清洁工阿姨
面议投递简历
-
区域销售精英:月可入2万
10000-20000/元投递简历