监控生命周期

发布时间 2023-07-12 13:55:11作者: 木偶学linux
  1. 服务器上架到机柜
  2. 基础设施监控
    服务器温度,风扇转速  ipmitool命令,只能用在物理机存储的监控(df ,fdisk, iotop)
    cpu(lscpu,uptime,top,htop,glances) 内存情况(free) 网络(iftop)
  3. 应用监控

             mysql    redis 
             nginx
              php-fpm
              python 

 

一个完善且理想的监控系统,得有如下特点

  • 监控系统能够自定义监控的内容,自己通过脚本采集所需的数据

  • 数据需要存入到数据库,日后对该数据进行分析计算

  • 监控系统可以简易,快速的部署到服务器

  • 数据可视化直观清晰

异常告警通知

  • 可以定义复杂度告警逻辑,做到监控项之间的关联告警,例如程序之间的依赖检测,而不是只单独检测某一个目标

  • 告警可以确认响应,让运维组内的人知道已经有人在处理告警问题了

  • 告警内容可以自定义,能够写入一些简单的分析,便于运维人员直观了解数据,否则还得去服务器查看

  • 报警后,可以预处理一些任务,如自我修复,重启,采集数据等

协同工作、

  • 监控系统有强大的API,提供给研发同学调用,其他系系统调用

  • 监控数据是开放性,数据结构主流,便于解析。

  • 监控可视化可以简易的插件使用,而非复杂的js文件