摘要:当时一个S7-400 CPU故障了,所有的指示灯全闪,换上一个新的备件,CPU还是不能工作,故障现象居然相同。于是初步怀疑背板也有问题,在更换背板和第三块CPU后,系统终于正常工作了。
你相信CPU 故障会传染吗?
故事的发生是这样的:
当时一个S7-400 CPU故障了,所有的指示灯全闪,换上一个新的备件,CPU还是不能工作,故障现象居然相同。于是初步怀疑背板也有问题,在更换背板和第三块CPU后,系统终于正常工作了。
问题是解决了, 相信有的朋友还是会困惑,新的CPU插入有问题的背板怎么就再也不能工作了?!
咱们今天就来看看,有问题的背板是否会感染新的CPU?
第一步 故障测试
这是两个故障的CPU和背板,让我们看看到了实验室是不是问题依然存在。
这里插播一句,其实像这样的问题在“西门子1847”都可以找到,各位电气/工控工程师、PLC工程师、现场和调试工程师、售前/售后技术支持等朋友一定要去看看!
回到正题,咱们可以先用一块电源模块,测试下旧CPU。
第二步 故障复现
之后,可以看到旧CPU的故障又复现了,指示灯全闪,正常操作不能清零。
后续又做了一个更长时间的清零操作,部分指示灯熄灭了,但是STOP灯也熄灭了,这个现象也很诡异。接着,我们再测试作为备件的新CPU。
第三步 故障排查
在视频中可以看到,两个CPU的故障现象是一样的,难道真的传染了?
首先查看被怀疑背板的插针是否有弯曲、短接。
除了大量的灰尘外,插针一切正常,我们使用实验室正常的背板测试CPU,问题依旧呀!说明两块CPU确实故障了。
故障详解
当CPU出现指示灯全闪,程序不能执行、与外部的通信中断时,CPU就进入了故障模式。
一般来说,造成CPU进入故障模式原因主要有三种:
一,CPU的逻辑受到干扰,导致CPU故障。这种故障也是为了保护设备和人身的安全,被动停止,在这种情况下,断电几分钟后再启动就会自动恢复。目前这种情况就排除了。
二,CPU的固件损坏了,就像计算机的操作系统崩溃一样,这种故障重新更新固件就可以了。
由于CPU不能通信了,即使再插入通信模块也不能在线联机CPU。
这时候我们只能使用最原始的方法,找一块最小8M的FLASH卡,将下载的固件烧到卡中,这里还需要编程器。
一阵忙活和操作,最终给两个CPU都更新了固件,启动后还是故障,后续又更新到最新的固件,故障依旧啊,最终排除固件的问题。
其实最后一种也是我们不愿看到的,就是硬件故障了,故障不可逆,CPU必须维修了!
测试到这里,得到的结果就是两个CPU是硬件故障。是背板造成CPU的损坏吗?怀着忐忑的心情,将被怀疑的背板插入实验室的CPU进行测试.
第五步 原因揭秘
CPU可以正常启动,到这里我想大家可能都明白了,现场的故障现象完全是一个巧合。
背板没有问题,旧的CPU硬件确实出问题了,作为备件的新CPU在更换前已经出问题了。这就造成了背板总线感染CPU的假象。
什么原因造成CPU的损坏呢?
从测试中可以看到,CPU中的运行环境确实不好,插入实验室新的背板,再拔下来,相应的插槽全是灰尘,拍打CPU,大量的灰尘掉落。
CPU的平均无故障时间大概是20-30年,这是在EMC干扰受限、温度、湿度、防尘等符合要求的环境下测试的结果。
如果这些IP20防护等级的设备,安装于没有柜门或者柜门不关闭而且灰尘很大的环境下,这些设备的平均无故障时间就无法得到保护了。
这款CPU面世至少在10年以上了,备件的保管同样也是一个问题,同时也建议在收到备件后进行一下上电测试,否则就会遇到这样小概率事件了。
故障的“传染”,本质上是现场环境和备件状态问题的叠加结果,而非设备之间的相互影响。
每月为您推荐超多工控资讯
来源:西门子工业支持中心一点号