TcaplusDB日常巡检
Tcaplus环境搭建好且投入运营后,日常巡检监控告警, 囊括了Tcaplus方方面面的指标监控, 可以分别配置告警阈值或套用Tcaplus提供的监控模板
设备层面:
- CPU使用率(总CPU、单个进程CPU)
- 内存使用量(总内存、单个进程内存)
- 磁盘分区使用量(数据盘、binlog盘、日志盘、冷备盘)
- 磁盘分区IO(同上)
- 网络出入带宽使用量
进程层面:
- Tcapcenter、Tcapdir、Tcapdb对连接MySQL、操作MySQL的成功率统计
- 目录服务器对登录验证的成功率统计
- 接入层对读写请求数、响应数、消息打解包的成功率统计
- 接入层对请求时延的监控
- 存储层对读写请求数、响应数、消息打解包的成功率统计
- 存储层对请求时延的监控
- 存储层对引擎文件的读写成功率统计
- 存储层对DB主从之间DBSeq同步差异、 主从角色切换的监控
- 网络层拥堵的监控