“叮——”“嘀——嘀——”

凌晨 06:11,报警短信像机关枪一样把值班手机打到烫手。(但值班休息ing...未及时响应)
网络监控大屏瞬间一片血红:核心交换机上行流量跌至 0。
整个机房,瞬间从互联网“蒸发”。

这,就是那只老鼠给我们的“见面礼”。

一、案发现场:光纤被啃成“意大利面”

1.1 还原

事件

触发“核心出口流量 0 bps”报警

发现机柜底部一截单模光纤光纤跳线被啃断,断口处还有一排清晰的齿痕

发现老鼠钻进吊顶配线架深处,拉出一整束“光纤面条”,单模光纤线阵亡

开始紧急熔纤

熔纤完成,因 OTDR 测试衰减超标,重新熔

通过测试,全网恢复,历时 11 小时 45 分

1.2 物理损伤特写

  • 被咬断的是单模光纤,外层 LSZH 低烟无卤被咬穿,凯夫拉抗拉层被撕成棉花状。

  • 断口呈 45° 斜切,齿距 1 mm,符合小家鼠门齿特征。

  • 还好到上游机房干线结实不会被咬断,不然熔纤师傅当场心态炸裂。

二、根因分析:一只老鼠如何团灭整个网络

2.1 诱因:机房环境“五星级鼠窝”

  • 温度:常年 22 ℃,老鼠体感舒适。

  • 通道:吊顶上空腔四通八达,线槽成了“鼠行道”&“老鼠 VIP 通道”。

2.2 为什么偏偏咬光纤?

  • 牙齿生长需求:老鼠门齿终生生长,需要硬物磨牙。光纤凯夫拉+PE 护套,硬度适中,“口感”刚好。

  • 好奇心驱动:光纤跳线走的吊顶洞口但很小,老鼠想钻出来,但出不来就咬线。

  • 化学诱因:LSZH 护套里含植物淀粉增塑剂,对啮齿类有微弱吸引力。

三、应急止血:11 小时我们做了什么

3.1 临时恢复方案

  1. 业务降级

    • 关停非关键流量

  2. 链路抢修

    • 备品备件:常备光纤

    • 紧急召唤熔纤工程师复线

3.2 沟通与舆情

  • 内部 IM:每 30 分钟观察情况发一次进度,附带照片,减少“怎么还没好”的灵魂拷问。

  • 客户公告:官网挂“技术升级”横幅,把“老鼠”改成“第三方施工破坏”,保留一点体面。

四、亡羊补牢:让老鼠永远进不来

  • 每月一次机房 6S 检查,重点排查食物残渣。

  • 所有进出物资必须拆箱检查,纸箱禁止带入机房。

  • 值班制度:摄像头 AI 识别鼠影自动报警。

五、一点反思:别小看任何“小”问题

这次事故直接损失:

  • 熔纤+人工

  • 备件耗材

  • 业务 SLA --

  • 最惨的是——团建烧烤预算被砍了(用来买防鼠设备)。

但收获也巨大:

“如果今天咬断的是 UPS 控制线,我们可能就不是 11 小时,而是 11 天。”

机房安全无小事。一只 20 g 的老鼠,可以让服务器集体“宕机”。
把每一次报警当成一次免费的渗透测试,把每一根光纤当成最后一根,才能在下一次“鼠灾”来临之前,优雅地说:

“对不起,机房已经无鼠可咬。”