跳转至

性能指标监控

仅企业认证后的账号可用

方式一:容器内API主动获取

使用以下代码在容器内(容器实例或者弹性部署的容器)执行获取CPU、内存、GPU监控信息

import requests
import json

# url地址不同容器都一样,均使用127.0.0.1进行获取
url = 'http://127.0.0.1:2022/autopanel/v1/api/monitor/current'
response = requests.get(url)
content = response.content.decode()
if response.status_code == 200 and "success" in content:
    metric = json.loads(content)['data']
    print(f"CPU Usage: {metric['cpu_usage']} %")
    print(f"Mem Usage: {metric['memory_usage']} MiB")
    print("GPU Info:")
    gpu_metrics = metric.get('gpu_list', [])
    for gm in gpu_metrics:
        print(f"\tIdx:{gm['index']}  Mem Usage: {gm['memory_used']} MiB  Utilization: {gm['utilization']} %")

方式二:推送至Prometheus

您可以在AutoDL上配置托管您自己的Prometheus的PushGateway账号密码,AutoDL将自动推送容器的metric数据至您私有Prometheus数据库,进而您可以通过其他的技术栈比如Grafana查看所有容器的监控数据。注意:Prometheus、PushGateway、Grafana等均由您自己提供,AutoDL只进行数据的推送。

配置并开启推送监控数据到Prometheus

开启后新创建/重启的容器将会开始推送Metric数据

如何可视化这些Metric数据请使用Grafana等做进一步配置