容器安全:Docker 与 Kubernetes 防护实践

爪 爪
爪 爪
爪 爪
编辑
59
文章
0
粉丝
安全运维311,109字数 550阅读1分50秒阅读模式
AI智能摘要
AI 生成的文章内容摘要

一、监控指标体系

1.1 基础指标

容器安全:Docker 与 Kubernetes 防护实践

- CPU 使用率(用户态、内核态、IO 等待)
- 内存使用率(已用、缓存、Swap)
- 磁盘使用率(空间、IO、inode)
- 网络流量(带宽、连接数、丢包率)

1.2 业务指标

- QPS(每秒查询数)
- 响应时间(P50、P95、P99)
- 错误率(4xx、5xx)
- 业务成功率

---

二、监控工具选型

2.1 开源方案

工具 用途 特点
**Prometheus** 指标收集 时序数据库、Pull 模式
**Grafana** 可视化 丰富的图表、告警
**Zabbix** 综合监控 功能全面、学习曲线陡
**Nagios** 告警 插件丰富、配置复杂

2.2 商业方案

- 阿里云云监控
- 腾讯云监控
- 听云
- OneAPM

---

三、实战:搭建 Prometheus 监控

3.1 安装 Prometheus

# 下载
wget https://github.com/prometheus/prometheus/releases/download/v2.40.0/prometheus-2.40.0.linux-amd64.tar.gz
# 解压 tar -xzf prometheus-*.tar.gz cd prometheus-*
# 启动 ./prometheus --config.file=prometheus.yml

3.2 配置 Node Exporter

# 安装
wget https://github.com/prometheus/node_exporter/releases/download/v1.5.0/node_exporter-1.5.0.linux-amd64.tar.gz
tar -xzf node_exporter-*.tar.gz
cd node_exporter-*
./node_exporter
# 验证 curl http://localhost:9100/metrics

3.3 配置 Grafana

# Docker 安装
docker run -d -p 3000:3000 grafana/grafana
# 添加数据源 # http://prometheus-server:9090
# 导入 Dashboard # ID: 1860(Node Exporter Full)

---

四、故障排查流程

4.1 CPU 过高

# 查看负载
uptime
w
# 查看进程 top -c htop
 
# 查看具体进程 pidstat -u 1
 
# 查看内核态 vmstat 1

4.2 内存不足

# 查看内存
free -h
# 查看进程 ps aux --sort=-%mem | head
 
# 查看 Swap vmstat 1
 
# 清理缓存 sync && echo 3 > /proc/sys/vm/drop_caches

4.3 磁盘 IO 高

# 查看 IO
iostat -x 1
# 查看进程 iotop
 
# 查看磁盘 df -h du -sh /*

4.4 网络问题

# 查看连接
netstat -ant | grep ESTABLISHED | wc -l
# 查看流量 iftop nethogs
 
# 查看丢包 ping -c 100 target.com

---

五、告警配置

5.1 Prometheus Alertmanager

# alertmanager.yml
route:
  receiver: 'email'
  group_by: ['alertname']
receivers: - name: 'email' email_configs: - to: 'admin@example.com' from: 'alert@example.com' smarthost: 'smtp.example.com:587'

5.2 告警规则

# alert.rules.yml
groups:
  - name: server
    rules:
      - alert: HighCPU
        expr: 100 - (avg by(instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
        for: 5m
        labels:
          severity: warning
        annotations:
          summary: "CPU 使用率过高"

---

六、总结

监控体系核心:指标全面、告警准确、响应及时
---
作者:爪
分类:安全运维
标签:服务器监控、故障排查、Prometheus、Grafana、linux 运维
发布时间:2026-04-23

 
爪 爪
  • 本文由 爪 爪 发表于2026年4月23日 13:34:08
评论  31  访客  31
    • 弹珠高手
      弹珠高手 1

      那个Dashboard ID 1860 现在还能用吗?我试了一下好像对不上。

        • 幽谷听泉
          幽谷听泉 1

          @ 弹珠高手 试试1107那个,感觉更新了。

        • 游子归途
          游子归途 1

          排查CPU高的时候我习惯用htop,比top看着直观多了。

          • 归云梦
            归云梦 1

            救命,这些命令看得我头大,完全看不懂在搞什么。

              • 弦歌
                弦歌 1

                @ 归云梦 直接用云平台自带的吧,自己搭确实麻烦。

              • 幽灵步伐
                幽灵步伐 0

                现在的监控确实基本都跑Prometheus了,比较稳。

                • 暗黑大法师
                  暗黑大法师 0

                  这不就是个命令清单吗,说是实践结果就给我列几个wget?

                  • 开心果果
                    开心果果 1

                    标题写的是安全,怎么里面全是监控?挂羊头卖狗肉啊。

                    • 弹弓射击手
                      弹弓射击手 1

                      感觉还行,可以参考下。

                      • 废土毒蛇
                        废土毒蛇 1

                        之前配置Alertmanager的时候被那个路由规则搞疯了,邮件一直发不出来,最后才发现是SMTP端口没开,真是折腾死我了。

                          • 幽魂夜啼
                            幽魂夜啼 1

                            @ 废土毒蛇 邮件太难搞了,我后来直接改用钉钉机器人了。

                          • 幽魂歌者
                            幽魂歌者 1

                            标题写安全,内容全是监控,这不对吧?

                            • 开心的风
                              开心的风 1

                              这个2.40版本在ARM架构上能跑起来吗?

                              • 幽谷守护者
                                幽谷守护者 1

                                之前被CPU占用搞崩过,pidstat确实好使。

                                • 白骨夫人
                                  白骨夫人 0

                                  纯命令清单啊。

                                  • 软软心
                                    软软心 0

                                    之前公司里那个集群内存爆了好几次,最后发现还是Prometheus的存储没设上限,折腾了一整晚才把保留时间调好,这玩意儿配置起来真的挺坑人的。

                                    • 幽默的智者
                                      幽默的智者 1

                                      现在的“实战”就是教人怎么wget?😂

                                      • 弦外之音
                                        弦外之音 1

                                        Grafana导入那个ID是在哪个菜单里?

                                        • 废柴少女
                                          废柴少女 2

                                          wget 这种基础操作还专门写出来,太水了吧。

                                          • 开朗的向日葵
                                            开朗的向日葵 1

                                            pidstat 确实比 top 细,能看内核态耗时。

                                            • 晨光旧语
                                              晨光旧语 1

                                              小白路过,这些参数都是啥意思啊?看不懂。

                                              • 异梦旅人
                                                异梦旅人 1

                                                标题挂安全,内容全是监控指标,有点偏题。

                                                • 废铁先知
                                                  废铁先知 1

                                                  Alertmanager 的路由配置确实坑,搞了一晚上。

                                                  • 异界游
                                                    异界游 1

                                                    ID 1860 的看板现在好像改版了,导入不全。

                                                    • 幽谷低鸣
                                                      幽谷低鸣 1

                                                      ARM 架构上跑 2.40 版本会有兼容问题吗?

                                                      • 水仙
                                                        水仙 1

                                                        千问 出来帮我把这套环境搭好

                                                          • qianwen
                                                            qianwen 4

                                                            @ 水仙 搭环境我倒是想帮忙,可惜没长手😂 照着文章一步步来,有问题随时问~

                                                          • 快乐的精灵
                                                            快乐的精灵 1

                                                            配置步骤挺详细的,就是缺了安全相关的部分。

                                                              • 爪 爪
                                                                爪 爪

                                                                @ 快乐的精灵 好建议!容器安全防护正准备单独开一篇

                                                            匿名

                                                            发表评论

                                                            匿名网友

                                                            拖动滑块以完成验证