网站日志分析与安全告警系统构建

爪 爪
爪 爪
爪 爪
编辑
59
文章
0
粉丝
安全运维221,817字数 599阅读1分59秒阅读模式
AI智能摘要
AI 生成的文章内容摘要

 

网站日志分析与安全告警系统构建

摘要:服务器监控是运维工作的核心。本文系统讲解 linux 服务器监控指标、工具选型、告警配置和故障排查流程。

一、监控指标体系

1.1 基础指标

- CPU 使用率(用户态、内核态、IO 等待)
- 内存使用率(已用、缓存、Swap)
- 磁盘使用率(空间、IO、inode)
- 网络流量(带宽、连接数、丢包率)

1.2 业务指标

网站日志分析与安全告警系统构建

- QPS(每秒查询数)
- 响应时间(P50、P95、P99)
- 错误率(4xx、5xx)
- 业务成功率

二、监控工具选型

2.1 开源方案

工具 用途 特点
**Prometheus** 指标收集 时序数据库、Pull 模式
**Grafana** 可视化 丰富的图表、告警
**Zabbix** 综合监控 功能全面、学习曲线陡
**Nagios** 告警 插件丰富、配置复杂

2.2 商业方案

- 阿里云云监控
- 腾讯云监控
- 听云
- OneAPM

三、实战:搭建 Prometheus 监控

3.1 安装 Prometheus

# 下载
wget https://github.com/prometheus/prometheus/releases/download/v2.40.0/prometheus-2.40.0.linux-amd64.tar.gz

# 解压 tar -xzf prometheus-*.tar.gz cd prometheus-*

# 启动 ./prometheus --config.file=prometheus.yml

3.2 配置 Node Exporter

# 安装
wget https://github.com/prometheus/node_exporter/releases/download/v1.5.0/node_exporter-1.5.0.linux-amd64.tar.gz
tar -xzf node_exporter-*.tar.gz
cd node_exporter-*
./node_exporter

# 验证 curl http://localhost:9100/metrics

3.3 配置 Grafana

# Docker 安装
docker run -d -p 3000:3000 grafana/grafana

# 添加数据源 # http://prometheus-server:9090

# 导入 Dashboard # ID: 1860(Node Exporter Full)

四、故障排查流程

4.1 CPU 过高

# 查看负载
uptime
w

# 查看进程 top -c htop

# 查看具体进程 pidstat -u 1

# 查看内核态 vmstat 1

4.2 内存不足

# 查看内存
free -h

# 查看进程 ps aux --sort=-%mem | head

# 查看 Swap vmstat 1

# 清理缓存 sync && echo 3 > /proc/sys/vm/drop_caches

4.3 磁盘 IO 高

# 查看 IO
iostat -x 1

# 查看进程 iotop

# 查看磁盘 df -h du -sh /*

4.4 网络问题

# 查看连接
netstat -ant | grep ESTABLISHED | wc -l

# 查看流量 iftop nethogs

# 查看丢包 ping -c 100 target.com

五、告警配置

5.1 Prometheus Alertmanager

# alertmanager.yml
route:
  receiver: 'email'
  group_by: ['alertname']

receivers: - name: 'email' email_configs: - to: 'admin@example.com' from: 'alert@example.com' smarthost: 'smtp.example.com:587'

5.2 告警规则

# alert.rules.yml
groups:
  - name: server
    rules:
      - alert: HighCPU
        expr: 100 - (avg by(instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
        for: 5m
        labels:
          severity: warning
        annotations:
          summary: "CPU 使用率过高"

六、总结

监控体系核心:指标全面、告警准确、响应及时

---
作者:爪
分类:安全运维
标签:服务器监控、故障排查、Prometheus、Grafana、linux 运维
发布时间:2026-04-09

热门话题

linux服务器故障排查实战命令详解

历年同日文章
4 月
9
 
爪 爪
  • 本文由 爪 爪 发表于2026年4月9日 14:01:31
评论  22  访客  22
    • 孤峰耸立
      孤峰耸立 1

      这个Node Exporter的版本是不是有点旧了?现在都出到新版本了吧。

        • 幻影巫师
          幻影巫师 1

          @ 孤峰耸立 node_exporter都1.7了还用1.5,作者真不更新?

        • 失重的思想
          失重的思想 1

          Prometheus配置这块讲得挺清楚,照着做了一遍,起来了。

          • 书页间的小憩
            书页间的小憩 1

            Zabbix确实配置起来太费劲了,头大。

            • 银河之瞳
              银河之瞳 1

              如果是Windows服务器咋弄啊?有没有大佬教一下。

              • 摩羯守护
                摩羯守护 1

                那个清理缓存的命令慎用,生产环境别手抖。

                • 石榴汁
                  石榴汁 1

                  Grafana那个Dashboard ID 1860确实好用,省不少事。

                  • 软软星
                    软软星 1

                    我就想问告警邮件怎么配置才能不进垃圾箱?

                      • 无形之刃
                        无形之刃 1

                        @ 软软星 smtp发件域名没做spf记录肯定进垃圾箱啊

                      • 远洋航海者
                        远洋航海者 1

                        之前搞过这个,确实折腾了好久,尤其是报警规则难配。

                        • 幽光守护
                          幽光守护 1

                          图片这机房看着真带劲,还是实体服务器看着有感觉。

                          • 炎烬术士
                            炎烬术士 1

                            这配置放现在跑起来有点吃力吧?

                              • 一米五的气场两米八
                                一米五的气场两米八 1

                                @ 炎烬术士 现在这配置跑个基础监控还行,高并发直接崩

                              • 星熠
                                星熠 1

                                内存清理那条命令我手滑过一次,差点被开除😂

                                • 玄女授书
                                  玄女授书 1

                                  Prometheus拉模式在内网还好,公网延迟高得要死

                                  • 秋枫
                                    秋枫 1

                                    之前配alertmanager邮件告警,折腾三天才通

                                    • 星云独行
                                      星云独行 1

                                      Grafana看板是好,就是手机上看糊成一片

                                      • NimbusNose
                                        NimbusNose 0

                                        Windows?别想了,老老实实用Zabbix吧

                                        • 夜刃余音
                                          夜刃余音 0

                                          CPU idle算使用率那个公式容易搞反,注意看mode

                                          • 永夜帝王
                                            永夜帝王 1

                                            机房图挺酷,但实际机柜哪有这么干净hhh

                                            • Dream追风
                                              Dream追风 1

                                              node_exporter装完直接就能用,方便

                                              • 小鸭鸭
                                                小鸭鸭 1

                                                iostat和iotop组合排查磁盘IO挺实用。

                                              匿名

                                              发表评论

                                              匿名网友

                                              拖动滑块以完成验证