美国服务器宕机检测需要注意的异常情况有:1。需要注意网络干扰排除问题。防止美国服务器出现宕机检测出错;2。需要注意特殊情况干扰排除问题。比如根据监控每个机房的上报频率。排除干扰;3。需要注意进一步识别误报问题。比如服务器心跳异常。Ping异常等误报问题。
具体内容如下:
1。网络干扰排除
宕机分析中较多误报是由于网络问题干扰。无法准确判断出美国服务器是否宕机。因为也有可能是网络问题。 排除上联网络设备异常导致的误报。包括机房小面积网络故障。上联网络故障。如通过探测丢包情况。使用一些逻辑初步判断网络问题。
美国服务器本身未丢包的误报除了需要过滤出网络问题。还要通过丢包数据分析。过滤掉SA误报问题。 SA异常会上报心跳异常。被误理解为宕机。
2。特殊情况干扰排除
个别美国服务器机房有时候会出现大面积风暴式的无故心跳异常。同时网络Ping值异常。但上联网络设备Ping值包正常。这种误报一般根据具体case具体进行针对性的分析。如根据监控每个机房的上报频率。排除干扰。
3。进一步识别误报
至此大部分干扰已经过滤掉。但仍有一部分误报隐藏其中。比如心跳异常。Ping异常。都合乎美国服务器宕机判断的逻辑。会导致误判成宕机。如导致网卡被打爆。或者重试率高。这种是业务原因导致网络异常。或者美国服务器并没有宕机。但IO延时和资源占用率各项指标都不正常等场景。需要增加uptime判断以及带外日志分析排查。
本文地址:https://gpu.xuandashi.com/57544.html,转载请说明来源于:渲大师
声明:本站部分内容来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场!