红蓝对抗中WAF监控的关键指标

11 人参与

TOPIC SOURCE

渗透测试 2019.08

红蓝队攻防演练监控声音告警脚本-WAF

凌晨三点，安全运营中心（SOC）的告警大屏依旧闪烁着。屏幕上，红色的攻击流量波形图与蓝色的防御态势雷达图交织在一起，构成了一幅动态的攻防博弈图。对于防守方（蓝队）而言，面对红队花样百出的攻击手法，Web应用防火墙（WAF）是守护业务系统的第一道“数字护城河”。然而，仅仅部署WAF远远不够，真正决定防守成败的，往往是你究竟在监控什么。在红蓝对抗这种高强度、目标明确的实战演练中，监控指标的选取直接决定了你是被动挨打，还是能提前预判、有效响应。

告警数量？那只是个起点

很多蓝队成员容易陷入一个误区：盯着WAF的告警总数不放。今天拦截了十万次攻击，似乎战绩斐然。但在红蓝对抗里，这个数字的参考价值有限。红队不是漫无目的的脚本小子，他们的攻击是高度定向、低冗余的。一个经验丰富的红队，可能会用几十次精心构造的、低特征载荷的请求，就完成一次成功的漏洞利用。如果WAF规则不够精细，这些请求可能根本不会触发高频告警。

关键在于告警的“质”，而非“量”。你需要关注的是攻击链路上的关键节点告警。比如，针对同一个会话（Session）或用户，在短时间内相继出现的侦察（如目录遍历、敏感文件探测）、武器化（如尝试上传特定后缀文件）、漏洞利用（如SQL注入、命令执行payload）等多阶段攻击告警。这种关联性分析，远比孤立的十万次SQL注入尝试告警更有威胁。

两个必须紧盯的“比率”指标

比率指标能帮你过滤噪音，抓住本质。在实战监控中，下面这两个比率至关重要：

攻击请求占比（Attack-to-Total Ratio）：计算单位时间内（如每分钟）被WAF判定为攻击的请求数占总请求数的比例。在正常业务时段，这个比例通常维持在一个极低的基线水平（例如0.1%以下）。一旦红队开始集中火力攻击，这个比率会出现陡峭的、持续的上升。监控这个曲线的异常波动，是发现攻击开始的灵敏信号。
误报率（False Positive Rate）：在对抗中，红队有时会故意使用大量“类攻击”但无害的请求（例如各种编码变体的测试字符串），试图淹没告警平台，诱使蓝队调低WAF规则严格度或关闭某些规则，从而为真正的攻击打开缺口。因此，实时监控并分析WAF拦截请求中，经人工复核确认为误报的比例，是判断是否遭受“噪音攻击”干扰的关键。一个突然飙升的误报率，背后可能就是红队的战术动作。

响应延迟：藏在时间里的杀机

WAF的处理性能直接影响用户体验和防御效果。在红蓝对抗中，红队可能会发起“慢速攻击”（Slow HTTP Attack）或高频但合法的请求，目的并非绕过规则，而是耗尽WAF的处理资源，导致其响应延迟（Latency）激增。

当WAF自身成为瓶颈，就会出现两种危险情况：一是合法用户请求被排队或丢弃，造成业务不可用（这本身就算红队的战果）；二是WAF因过载进入“旁路”或“检测绕过”模式，后续的攻击流量可能如入无人之境。因此，必须将WAF的平均响应时间、99分位响应时间（P99 Latency）以及每秒处理请求数（RPS）的饱和度作为核心性能监控指标。一旦发现延迟异常增长而流量并未同比暴涨，就要立刻警惕资源耗尽型攻击。

别忘了“静默”的指标：被放行的可疑请求

最危险的往往不是被拦截的，而是被放行的。WAF通常有几种处理动作：拦截（Block）、告警（Alert）、通过（Pass）。大多数人的目光聚焦在“拦截”和“告警”上。但在高级对抗中，红队会反复测试WAF规则的边界，寻找那些触发“告警”但被“通过”的灰色地带。

因此，一个高阶的监控策略是：专门建立一个仪表盘，用于分析所有动作为“告警”但最终状态为“通过”的请求日志。分析这些请求的来源IP、攻击载荷片段、目标URL。它们可能是规则尚不完善留下的漏洞，也可能是红队正在进行的、未被完全识别的攻击尝试。对这些“低空掠过”的请求进行聚合分析，常常能提前发现新型攻击手法或0day利用的蛛丝马迹。

说到底，红蓝对抗中的WAF监控，早已不是简单的看个告警灯。它是一场关于数据解读、战术预判和资源博弈的智力游戏。你的监控指标，就是你的战术地图。地图画得越精细，战场上存活下来的几率就越大。当刺耳的告警声再次响起时，希望你能清晰地知道，这声警报背后，到底意味着什么。

参与讨论

11 条评论

光耀传媒 2 月前

监控这些指标确实比单纯数告警数有用多了，之前我们就吃过亏。

回复
ChaosTheory 2 月前

这个攻击请求占比的波动图，有现成的开源工具能直接出吗？还是得自己写脚本？

回复
红豆沙冰 1 月前

误报率突然升高那段，感觉红队就是在玩心理战啊。🤔

回复
孤夜行者 1 月前

响应延迟这块我们之前没太关注，看来得把P99 latency也加到监控大盘里了。

回复
血狱狂舞 1 月前

分析那些“告警但通过”的请求，听起来工作量巨大，小团队哪有这个人力天天看日志。

回复
傍晚的散步 1 月前

说得挺在理，但感觉对防守方人员的要求太高了，不是每个公司都有这么专业的蓝队。

回复
果子狸 1 月前

我们SOC现在基本就只看拦截总数和Top攻击类型，看来路子走歪了。

回复
旺仔 1 月前

被放行的可疑请求这个点抓得准，最怕的就是这种漏网之鱼。

回复
音乐狂人 1 月前

实战中关联分析确实关键，单点告警太多反而容易麻木。

回复
雁过无痕 2 周前

响应延迟这块平时真容易忽略。

回复
1. 信号潮 2 周前
  
  @ 雁过无痕是啊，性能监控很容易被忽略
  
  回复

红蓝对抗中WAF监控的关键指标

红蓝队攻防演练监控声音告警脚本-WAF

告警数量？那只是个起点

两个必须紧盯的“比率”指标

响应延迟：藏在时间里的杀机

别忘了“静默”的指标：被放行的可疑请求

参与讨论

延伸阅读

未来Linux运维工具趋势预测

MySQL二进制日志的作用与禁用影响

PE格式工具如何提升安全分析效率？

Burp Suite除了爆破，还有哪些强大的渗透测试功能？

网络空间测绘如何避开蜜罐陷阱？

如何定制高效的口令爆破字典应对实战？

热门搜索

红蓝队攻防演练监控声音告警脚本-WAF

告警数量？那只是个起点

两个必须紧盯的“比率”指标

响应延迟：藏在时间里的杀机

别忘了“静默”的指标：被放行的可疑请求

参与讨论

延伸阅读

未来Linux运维工具趋势预测

MySQL二进制日志的作用与禁用影响

PE格式工具如何提升安全分析效率？

Burp Suite除了爆破，还有哪些强大的渗透测试功能？

网络空间测绘如何避开蜜罐陷阱？

如何定制高效的口令爆破字典应对实战？