本文介绍云数据库MongoDB基本监控、高级监控和性能趋势功能支持的监控项、监控指标及其具体含义。
基础监控
不同类型实例支持的监控项请以控制台为准。
监控项 | key | 指标名 | 指标含义 | 支持的实例类型 |
磁盘空间使用率 | DiskUsage | disk_usage | 实例的磁盘使用率。 |
|
网络流量 | MongoDB_Network | bytes_in | 实例的网络进口流量。 | |
bytes_out | 实例的网络出口流量。 | |||
num_requests | 实例处理的请求数。 | |||
操作QPS数 | MongoDB_Opcounters | insert | 实例的插入操作QPS数。 | |
query | 实例的查询操作QPS数。 | |||
update | 实例的更新操作QPS数。 | |||
delete | 实例的删除操作QPS数。 | |||
getmore | 实例的读取操作QPS数。 | |||
command | 实例的协议命令操作QPS数。 | |||
连接数 | MongoDB_TotalConns | connections_active | 实例当前活跃连接数。 | |
current_conn | 实例当前连接数。 | |||
connections_totalCreated_ps | 实例每秒新建连接的总数。 |
| ||
connections_available | 实例当前可用的连接数。 | |||
连接数使用率 | ConnectionUsage | conn_usage | 实例的连接数使用率。 | |
CPU使用率 | CpuUsage | cpu_usage | 实例的CPU使用率。 | |
内存使用率 | MemoryUsage | mem_usage | 实例的内存使用率。 | |
IOPS使用量 | MongoDB_IOPS | iops | IOPS使用量。 说明
| |
IOPS使用率 | IOPSUsage | iops_usage | 实例的IOPS使用率。 说明 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。 | |
磁盘空间使用量 | MongoDB_DetailedSpaceUsage | ins_size | 实例的磁盘使用空间。 | |
data_size | 数据磁盘使用空间(不包括local库),主要包括collection开头的数据物理⽂件,索引开头的索引物理⽂件和部分元数据物理⽂件,例如WiredTiger.wt。 | |||
log_size | local库的物理大小、mongodb运行日志大小和部分审计日志大小。 | |||
操作详情 | MongoDB_OperationDetails | operation_exactIDCount_ps | 针对特定ID进行计数操作的次数。 | |
operation_scanAndOrder_ps | 未用索引的排序操作数。 | |||
operation_writeConflicts_ps | 发生写冲突的次数。 | |||
MBPS | MongoDB_Disk_Detail | read_io_bandwidth_mbps | 磁盘读取的吞吐量。 | |
write_io_bandwidth_mbps | 磁盘写入的吞吐量。 | |||
io_bandwidth_mbps | 磁盘总吞吐量。 | |||
事务操作数 | MongoDB_Transactions | trans_totalPrepared_ps | 已准备好的事务数。 | |
trans_totalPreparedThenCommited_ps | 已准备好的事务中成功提交的事务数。 | |||
trans_totalPreparedThenAborted_ps | 已准备好的事务中成功回滚的事务数。 | |||
trans_totalStarted_ps | 已启动的事务数。 | |||
trans_totalCommited_ps | 成功提交的事务数。 | |||
trans_totalAborted_ps | 成功回滚的事务数。 | |||
Cursors | MongoDB_AllCursors | total_open | 实例当前打开的Cursor数量。 | |
timed_out | 实例因超时关闭的Cursor数量。 | |||
job_cursors_closed | 实例因关闭会话关闭的Cursor数量。 | |||
pinned_open | 实例当前打开且超时的Cursor数量。 | |||
noTimeout_open | 实例当前打开且未超时的Cursor数量。 |
| ||
WiredTiger | MongoDB_Wt_Cache | bytes_read_into_cache | 读入缓存的字节数。 | |
bytes_written_from_cache | 从缓存写出的字节数。 | |||
maximum_bytes_configured | 最大缓存大小。 | |||
WT并发事务数 | MongoDB_Wt_Concurrent_Trans | write_concurrent_trans_out | 当前写并发事务数。 | |
write_concurrent_trans_available | 可用的写并发事务数。 | |||
read_concurrent_trans_out | 当前读并发事务数。 | |||
read_concurrent_trans_available | 可用的读并发事务数。 | |||
WiredTigerUsage | MongoDB_WTCacheUsage | wt_cache_dirty_usage | WiredTiger脏缓存使用率。 | |
wt_cache_usage | WiredTiger缓存使用率。 | |||
平均响应时间 | MongoDB_RT | avg_rt | 实例平均响应时间。 | |
reads_avg_rt | 读操作平均响应时间。 | |||
writes_avg_rt | 写操作平均响应时间。 | |||
commands_avg_rt | 命令操作平均响应时间。 | |||
trans_avg_rt | 事务操作平均响应时间。 | |||
影响文档数量 | MongoDB_Documents | document_deleted_ps | 实例删除的文档数量。 | |
document_inserted_ps | 实例插入的文档数量。 | |||
document_returned_ps | 实例返回的文档数量。 | |||
document_updated_ps | 实例更新的文档数量。 | |||
GlobalLock | MongoDB_GlobalLocks | gl_ac_readers | 执行读操作的活跃客户端连接数。 | |
gl_ac_writers | 执行写操作的活跃客户端连接数。 | |||
gl_cq_writers | 排队等待写锁的操作数。 | |||
gl_cq_readers | 排队等待读锁的操作数。 | |||
gl_cq_total | 排队等待锁定的操作总数。 | |||
查询扫描索引与文档数量 | MongoDB_QueryExecutors | queryExecutor_scannedObject_ps | 查询扫描文档的数量。 | |
queryExecutor_scanned_ps | 查询扫描索引的数量。 | |||
TTL | MongoDB_TTLs | ttl_deletedDocuments_ps | 因TTL索引而删除的文档数量。 | |
ttl_passes_ps | 后台TTL线程进行删除的次数。 | |||
Repl Opcounters | MongoDB_ReplOpcounters | repl_command | 复制集中Command命令的操作数。 | |
repl_delete | 复制集中Delete命令的操作数。 | |||
repl_getmore | 复制集中Getmore命令的操作数。 | |||
repl_insert | 复制集中Insert命令的操作数。 | |||
repl_query | 复制集中Query命令的操作数。 | |||
repl_update | 复制集中Update命令的操作数。 | |||
Eviction扫描数 | MongoDB_WtCacheHPCheckEntriesWalked | wiredTiger_cache_hazardPointerCheckEntriesWalked | Eviction时扫描hazard pointer array的内容的数量。 | |
Lock Acquisitions | MongoDB_WtLockAcquisitions | wt_checkPoint_lock | 检查点锁获取次数。 | |
wt_dhandle_read_lock | 数据句柄读锁获取次数。 | |||
wt_dhandle_write_lock | 数据句柄写锁获取次数。 | |||
wt_metadata_lock | 元数据锁获取次数。 | |||
wt_schema_lock | 模式锁获取次数。 | |||
wt_table_read_lock | 表读锁获取次数。 | |||
wt_table_write_lock | 表写锁获取次数。 | |||
wt_txn_global_read_lock | 事务全局读锁获取次数。 | |||
wt_txn_global_write_lock | 事务全局写锁获取次数。 | |||
主备延时 | MongoDB_Repl_Lag | repl_lag | 实例主备节点的数据同步延时。 说明
|
|
Oplog保留时长 | MongoDB_OplogTimeInterval | oplog_time_interval | Oplog保留时长。 | |
moveChunk | MongoDB_MoveChunks | moveChunk_donor_started_ps | 当前节点作为范围迁移源的次数。 |
|
moveChunk_recip_stared_ps | 当前节点作为范围迁移目标的次数。 | |||
每次访问个数 | - | sl_qps | 实例的每秒访问次数。 |
|
高级监控
仅单节点、副本集和分片集群实例支持高级监控。
不同类型实例支持的监控项请以控制台为准。
支持的实例 | 监控项 | 监控指标及说明 |
| CPU使用率 | cpu_usage:实例的CPU使用率。 |
内存使用率 | mem_usage:实例的内存使用率。 | |
磁盘空间使用量 | 实例使用的磁盘空间,包括:
| |
连接数使用率 | conn_usage:实例当前连接数与最大连接数的比值。 | |
cursors | 实例当前使用的cursor数,包括:
| |
读写队列 | 实例当前等待全局锁的数量,包括:
| |
平均响应时间 | avgRT:实例平均响应时间。 | |
WiredTiger请求队列 | 查看当前正在并发的读写请求数以及剩余可用的并发数,包括:
| |
IO延迟 | iocheck_cost:当前IO的响应性能。 说明 仅单节点和MongoDB 4.0及以下版本的副本集实例支持。 | |
WiredTigerCache使用率 | 实例WiredTiger引擎cache的使用率,包括:
| |
影响文档数量 | 实例的文档数量,包括:
| |
操作详情 | 实例的操作详情,包括:
| |
查询扫描索引与文档数量 | 查询扫描索引和文档的数量,包括:
| |
TTL | 实例的TTL操作,包括:
| |
| 磁盘空间使用率 | disk_usage:实例总使用空间与最大可使用空间的比值。 说明 Serverless实例不支持该监控项。 |
操作QPS数 | 实例的操作QPS数,包括:
说明 Serverless实例不支持该监控项。 | |
连接数 | 实例的连接数,包括:
说明 Serverless实例不支持该监控项。 | |
网络流量 | 实例的网络流量,包括:
说明 Serverless实例不支持该监控项。 | |
| IOPS使用量 | data_iops(iops):IOPS使用量。 说明
|
IOPS使用率 | iops_usage:实例使用IOPS大小与最大可用IOPS的比值。 说明 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。 | |
主备延迟 | repl_lag:实例主备节点的数据同步延时信息。 说明
| |
分片集群实例 | 分片集群Shard组件操作QPS总数 | 实例Shard组件的操作QPS总数,包括:
|
分片集群Mongos组件操作QPS总数 | 实例Mongos组件的操作QPS总数,包括:
| |
moveChunk | 当前节点作为moveChunk源或目标的次数,包括:
|
性能趋势
不同类型实例支持的监控项请以控制台为准。
支持的实例 | 监控项 | 监控指标及说明 |
| CPU使用率 | mongodb.cpu_usage:实例的CPU使用率。 |
内存使用率 | mongodb.mem_usage:实例的内存使用率。 | |
磁盘空间使用量 | 实例磁盘空间的性能趋势,包括:
| |
cursors | 实例cursor数的性能趋势,包括:
| |
WiredTiger请求队列 | 读写请求数以及剩余可用并发数的性能趋势,包括:
说明 仅支持标准版副本集实例。 | |
WiredTiger | 实例WiredTiger引擎cache层指标的性能趋势,包括:
说明 仅支持标准版副本集实例。 | |
| 磁盘空间使用率 | mongodb.disk_usage:mongodb磁盘使用率。 |
操作QPS数 | 实例操作QPS数的性能趋势,包括:
| |
连接数 | mongodb.connections.current:实例当前连接总数。 | |
网络流量 | 实例网络流量的性能趋势,包括:
| |
| IOPS使用量 | IOPS使用量的性能趋势,包括:
|
IOPS使用率 | mongodb.iops_usage:IOPS使用率。 说明 4.2版本副本集云盘版实例以及4.2版本分片集群云盘版实例暂不支持查看IOPS使用量和IOPS使用率。 | |
副本集实例 | GlobalLock | 实例全局锁的性能趋势,包括:
|