凯发K8

      服务器 2025-11-04

      R522 服务器异常重启

      一、现网描述

      1.1 环境描述

      设备型号:KunTai R722

      硬件配置:CPU:Kunpeng 920 5220

                        硬盘背板:25*2.5 SAS/SATA, Expander;2*2.5 SAS/SATA, Rear   

                        网卡:SP382

      软件配置:BMC:3.03.00.31

                        BIOS:1.89

                     

      二、故障描述

      2.1故障现象

      客户报障现场有1台服务器异常重启,需要分析重启根因情况,重启记录截图如下:

      image.png


      三、问题分析

      3.1排查思路

      1.查看日志logdump目录下fdmlog文件,发现日志中有Hardware Error Log Number记录,同时错误类型为:fatal Error,如下图:

      image.png

      2. 看server_config配置文件,确认其他部件状态正常

      image.png

      image.png

      3. 进一步查看logdump目录下app_debug_log_all日志文件,发现有FDM触发了OS重启记录信息

      image.png

      3.2分析结论

      根据以上iBMC日志分析,核实到PCIE3-SP382的网卡触发生一个fatal error,导致FDM机制触发了OS重启


      四、问题解决

      4.1解决办法

      更换PCIE3-SP382网卡