监控项说明
JuiceFS 为每个文件系统提供一个 Prometheus API,本章仅罗列和介绍部分常用监控指标,完整列表请访问控制台,在「监控」页面点击「Prometheus API」,直接查看接口数据。
提示
部分指标由于子项众多,并未完整列出,比如 juicefs_fuse_ops_lookup
、juicefs_fuse_ops_open
就统一收录在 juicefs_fuse_ops_<name>
。
另外,本章介绍的指标全部冠以 juicefs_
前缀,在私有部署的 Grafana 中并没有这个统一前缀,比如:
juicefs_trash_size
叫作jfs_stat_trash_size
juicefs_operationDuration
叫作mount_operationDuration
因此,如果你关心的指标没搜到,试试掐头去尾重新搜索其中的部分关键字。
文件系统
标签
名称 | 说明 |
---|---|
name 或 volume | 文件系统名 |
path 或 subdir | 目录路径 |
指标
名称 | 说明 | 单位 |
---|---|---|
juicefs_size | 文件系统大小 | 字节 |
juicefs_inodes | inodes 数量 | |
juicefs_trash_size | 回收 站文件大小 | 字节 |
juicefs_trash_files | 回收站文件数量 | |
juicefs_quota_size 或 volume_quota_size_usage | 目录配额中已使用的数据量百分比 | |
juicefs_quota_files 或 volume_quota_inodes_usage | 目录配额中已使用的文件数量百分比 |
客户端
标签
名称 | 说明 |
---|---|
name 或 subdir | 文件系统名 |
host | 客户端所在主机名 |
ip | 客户端所在主机 IP 地址 |
mountpoint | 挂载点路径 |
cache_group | 缓存组名称 |
cache_group_role | 缓存组角色,可选值有 Provider 、Consumer 。如果没有加入任何缓存组,这个标签的值为空。 |
指标
操作系统
名称 | 说明 | 单位 |
---|---|---|
juicefs_uptime | 运行时长 | 秒 |
juicefs_cpuusage | 累计 CPU 使用时间 | 微秒 |
juicefs_memusage | 当前占用 RSS 内存量 | 字节 |
juicefs_heapSys | Go 申请的内存总量,同 Sys | 字节 |
juicefs_heapInuse | 同 HeapInuse | 字节 |
juicefs_handles | 客户端持有文件句柄数 | |
juicefs_threads | 客户端 Go 线程数量,详见 ThreadCreateProfile | |
juicefs_goroutines | 客户端 Go 协程数量 | |
juicefs_gcPause | 同 PauseTotalNs | 纳秒 |
元数据服务
名称 | 说明 | 单位 |
---|---|---|
juicefs_metaDuration | 元数据服务请求延迟 | 微秒 |
juicefs_metaRequest | 元数据服务请求数 | |
juicefs_meta | meta 前缀的指标汇总,不单独参考 | |
juicefs_meta_operations | 元数据操作量 | |
juicefs_meta_bytes_sent | 元数据服务请求发送流量 | 字节 |
juicefs_meta_bytes_received | 元数据服务请求接受流量 | 字节 |
juicefs_meta_packets_sent | 元数据服务请求包发送流量 | |
juicefs_meta_packets_received | 元数据服务请求包接受流量 | |
juicefs_meta_reconnects | 元数据服务重连次数 | |
juicefs_meta_usec_ping | 元数据服务 ping 延迟 | 微秒 |
文件操作
名称 | 说明 | 单位 |
---|---|---|
juicefs_read_bytes | 读取总量,与 juicefs_get_bytes 不同,这是文件操作层级的统计 | 字节 |
juicefs_write_bytes | 写入总量,与 juicefs_put_bytes 不同,这是文件操作层级的统计 | 字节 |
juicefs_operations | 文件操作总量 | |
juicefs_operationDuration | 文件操作延迟,体现了应用通过 JuiceFS 读写文件所耗费的时间 | 微秒 |
juicefs_operationErrors | 文件操作错误的数量,可以通过该指标监控客户端的读写出错 | |
juicefs_operationSlows | 文件操作慢请求(超过 10 秒)的数量 | |
juicefs_operationInterrupted | 文件操作中断的数量 | |
juicefs_fuse_ops | 文件操作总量(分类再汇总统计,与 juicefs_operations 有少量差别) | |
juicefs_fuse_ops_<name> | 单个文件操作的计数,例如 getattr 、lookup 、open | |
juicefs_openfiles | 打开的文件数 |
缓冲区
名称 | 说明 | 单位 |
---|---|---|
juicefs_totalBufferUsed | 读写缓冲区已使用大小 | 字节 |
juicefs_readBufferUsed | 读缓冲区已使用大小 | 字节 |
juicefs_readahead_bytes | 将预读的数据从缓存区写入内核页缓存的总量 | 字节 |
元数据缓存
名称 | 说明 | 单位 |
---|---|---|
juicefs_meta_dircache | 命中客户端元数据缓存的所有操作总量 | |
juicefs_meta_dircache_<name> | 命中客户端元数据缓存的各种操作的总量,例如 getattr 、open 、lookup | |
juicefs_meta_dircache<zone-number>_dirs | 分区号为 <zone-number> (如 0 、1 )的客户端元数据缓存的目录数量 | |
juicefs_meta_dircache<zone-number>_inodes |