h5885 v3 装windows server 2012r2 物理机自动重启蓝屏 8台服务器hyper-v 集群
处理过程
从事件日志来看,机器近期有一次蓝屏行为(2021/9/12 8:34),7月也有一次,比较旧了,也为0x50。但由于c盘下没有足够大的剩余空间,pagefile配置没有成功,只有一个minidump,信息较少。
====dump 分析====
// bugcheck 为0x50,意为访问到一个无效内存地址,callstck解析信息量很少,看到有一个三方安全驱动nxup_ext_a有相关动作,且该驱动版本也比较旧了,建议做升级操作。另外一份dump是7月份的,比较旧了,callstack与此类似,也没有太多信息,涉及到的三方驱动为fltsrv,版本为2017年,建议先对这两个驱动进行升级,再做进一步观察。
dump info
============================================
dump name: 091221-57890-01.dmp
windows 8.1 kernel version 9600 mp (64 procs) free x64
product: server, suite: terminalserver singleuserts
built by: 9600.19678.amd64fre.winblue_ltsb_escrow.200330-1737
kernel base = 0xfffff801`e6c78000 psloadedmodulelist = 0xfffff801`e6f3d5f0
debug session time: sun sep 12 08:27:04.004 2021 (utc + 8:00)
system uptime: 53 days 23:47:30.527
。。。。。。。。。。
。。。。。
。。。
。。
。
硬件日志详细分析如下:(收集到带外日志的2台均一致)
1.sel日志中记录到9月22日有系统未知原因复位,复位前无硬件异常告警:
2.fdm日志为空,排除硬件存在uce等引发系统复位可能性:
3.操作日志无相关记录,排除对设备进行复位等操作引发系统复位可能性:
4.硬件日志未发现异常,微软反馈的nxup的驱动是多路径的,建议找存储的看看。fltsrv这个也不是华为硬件提供的驱动,建议找对应驱动厂家看看。
根据微软反馈的分析结论,可能与以下驱动模块相关,其中nxup_ext_a.sys这个驱动是华为多路径的,建议可以让存储那边看看。
fltsrv.sys这个驱动也不是服务器这边提供的,建议客户找到对应的驱动厂家看看。
建议:
1.升级驱动nxup_ext_a.sys和fltsrv.sys 后,进一步观察。
2.由于minidump信息量过少,请参考如下步骤配置kernel dump(pagefile 为20g),等待下次蓝屏发生:
以管理员身份打开命令提示符依次运行如下命令:
reg add hklm/system/currentcontrolset/control/session manager/memory management /v pagingfiles /t reg_multi_sz /d c:/pagefile.sys 20480 20480 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v dumpfile /t reg_expand_sz /d c:/windows/memory.dmp /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v crashdumpenabled /t reg_dword /d 2 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v autoreboot /t reg_dword /d 1 /f
重启服务器配置生效。
注:确保c盘剩余空间大于2倍pagingfile大小。
解决方案
硬件日志未发现异常,微软反馈的nxup的驱动是多路径的,建议找存储的看看。fltsrv这个也不是华为硬件提供的驱动,建议找对应驱动厂家看看。
根据微软反馈的分析结论,可能与以下驱动模块相关,其中nxup_ext_a.sys这个驱动是华为多路径的,建议可以让存储那边看看。
fltsrv.sys这个驱动也不是服务器这边提供的,建议客户找到对应的驱动厂家看看。
建议:
1.升级驱动nxup_ext_a.sys和fltsrv.sys 后,进一步观察。
2.由于minidump信息量过少,请参考如下步骤配置kernel dump(pagefile 为20g),等待下次蓝屏发生:
以管理员身份打开命令提示符依次运行如下命令:
reg add hklm/system/currentcontrolset/control/session manager/memory management /v pagingfiles /t reg_multi_sz /d c:/pagefile.sys 20480 20480 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v dumpfile /t reg_expand_sz /d c:/windows/memory.dmp /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v crashdumpenabled /t reg_dword /d 2 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v autoreboot /t reg_dword /d 1 /f
重启服务器配置生效。
注:确保c盘剩余空间大于2倍pagingfile大小。
50通道QUSPIN OPM-MEG光泵原子磁力计阵列在多通道脑磁记录仪的应用
脱硫塔玻璃鳞片防腐技术分析
分体式垃圾压缩机设备的介绍
首钢设计院打造强势品牌
高温蒸汽流量计在蒸汽计量中应用中存在的问题及解决方案
华为 RH5885 V3 不停蓝屏重启
软水过程水质分析仪水处理系统内容有哪些
wandfluh电磁阀WDMFB04-ADB-G24发发*
关于电动电动UPVC蝶阀您都了解吗?
气弹簧工艺参数的确定及其使用性能
信百诺为您介绍下压力试验机变形测量的相关知识
压瓦机的种类区分与彩钢压瓦机的发展方向
TD-016C-地热井高精度传感器分层测温方案
穿线钢铝拖链的结构与应用
便携手持式水中油份浓度分析仪
什么是近红外(NIR)传感器?
全自动切带机机器特点与行业优势
真金板的用途
微机控制橡胶靠球耐穿刺试验机现货出售
全自动穿羊肉串机实现自动上签穿肉更适合肉串加工