性能指标监控¶
仅企业认证后的账号可用
方式一:容器内API主动获取¶
使用以下代码在容器内(容器实例或者弹性部署的容器)执行获取CPU、内存、GPU监控信息
import requests
import json
# url地址不同容器都一样,均使用127.0.0.1进行获取
url = 'http://127.0.0.1:2022/autopanel/v1/api/monitor/current'
response = requests.get(url)
content = response.content.decode()
if response.status_code == 200 and "success" in content:
metric = json.loads(content)['data']
print(f"CPU Usage: {metric['cpu_usage']} %")
print(f"Mem Usage: {metric['memory_usage']} MiB")
print("GPU Info:")
gpu_metrics = metric.get('gpu_list', [])
for gm in gpu_metrics:
print(f"\tIdx:{gm['index']} Mem Usage: {gm['memory_used']} MiB Utilization: {gm['utilization']} %")
方式二:推送至Prometheus¶
您可以在AutoDL上配置托管您自己的Prometheus的PushGateway账号密码,AutoDL将自动推送容器的metric数据至您私有Prometheus数据库,进而您可以通过其他的技术栈比如Grafana查看所有容器的监控数据。注意:Prometheus、PushGateway、Grafana等均由您自己提供,AutoDL只进行数据的推送。
配置并开启推送监控数据到Prometheus
开启后新创建/重启的容器将会开始推送Metric数据
如何可视化这些Metric数据请使用Grafana等做进一步配置