使用nvidia_gpu_expoter配合prometheus+grafana监控GPU性能

网友投稿 486 2022-09-11

使用nvidia_gpu_expoter配合prometheus+grafana监控GPU性能

项目地址:​​GitHub - utkuozdemir/nvidia_gpu_exporter: Nvidia GPU exporter for prometheus using nvidia-smi binary​​​

根据git上面的nvidia监控项目,可以实现grafana监控GPU,但是git上面提供的utkuozdemir/nvidia_gpu_exporter:0.3.0这个镜像只可以在ubuntu系统上面运行,如果在centos上运行,日志会提示无法获取到GPU信息,也就导致无法接到k8s的prometheus.目前使用的方法是将nvidia_gpu_exporter这个可执行访问下载到centos系统中,然后通过系统命令运行,最终得到一个服务,也就是gpu的metircs。然后在k8s中,创建endpoinst、service、servicemonitor,实现prometheus收集到gpu-metrics信息,最后通过grafana进行可视化展示。下面是具体操作步骤:​

1 在centos系统中有创建nvidia_gpu_exporter服务​

2 在k8s中创建endpoints、service、servicemonitor​

3 在grafana中创建GPU监控面板​

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:k8s CustomResourceDefinition invalid 错误
下一篇:PR人:为什么品牌直播间越来越专业,却越来越无聊?
相关文章

 发表评论

暂时没有评论,来抢沙发吧~