CPU故障也会传染吗?

B站影视 2025-01-01 17:00 2

摘要:当时一个S7-400 CPU故障了,所有的指示灯全闪,换上一个新的备件,CPU还是不能工作,故障现象居然相同。于是初步怀疑背板也有问题,在更换背板和第三块CPU后,系统终于正常工作了。

你相信CPU 故障会传染吗?

故事的发生是这样的:

当时一个S7-400 CPU故障了,所有的指示灯全闪,换上一个新的备件,CPU还是不能工作,故障现象居然相同。于是初步怀疑背板也有问题,在更换背板和第三块CPU后,系统终于正常工作了。

问题是解决了, 相信有的朋友还是会困惑,新的CPU插入有问题的背板怎么就再也不能工作了?!

咱们今天就来看看,有问题的背板是否会感染新的CPU?

第一步 故障测试

这是两个故障的CPU和背板,让我们看看到了实验室是不是问题依然存在。

这里插播一句,其实像这样的问题在“西门子1847”都可以找到,各位电气/工控工程师、PLC工程师、现场和调试工程师、售前/售后技术支持等朋友一定要去看看!

回到正题,咱们可以先用一块电源模块,测试下旧CPU。

第二步 故障复现

之后,可以看到旧CPU的故障又复现了,指示灯全闪,正常操作不能清零。

后续又做了一个更长时间的清零操作,部分指示灯熄灭了,但是STOP灯也熄灭了,这个现象也很诡异。接着,我们再测试作为备件的新CPU

第三步 故障排查

在视频中可以看到,两个CPU的故障现象是一样的,难道真的传染了?

首先查看被怀疑背板的插针是否有弯曲、短接。

除了大量的灰尘外,插针一切正常,我们使用实验室正常的背板测试CPU,问题依旧呀!说明两块CPU确实故障了。

故障详解

当CPU出现指示灯全闪,程序不能执行、与外部的通信中断时,CPU就进入了故障模式

一般来说,造成CPU进入故障模式原因主要有三种:

一,CPU的逻辑受到干扰,导致CPU故障。这种故障也是为了保护设备和人身的安全,被动停止,在这种情况下,断电几分钟后再启动就会自动恢复。目前这种情况就排除了。

二,CPU的固件损坏了,就像计算机的操作系统崩溃一样,这种故障重新更新固件就可以了。

由于CPU不能通信了,即使再插入通信模块也不能在线联机CPU。

这时候我们只能使用最原始的方法,找一块最小8M的FLASH卡,将下载的固件烧到卡中,这里还需要编程器。

一阵忙活和操作,最终给两个CPU都更新了固件,启动后还是故障,后续又更新到最新的固件,故障依旧啊,最终排除固件的问题。

其实最后一种也是我们不愿看到的,就是硬件故障了,故障不可逆,CPU必须维修了

测试到这里,得到的结果就是两个CPU是硬件故障。是背板造成CPU的损坏吗?怀着忐忑的心情,将被怀疑的背板插入实验室的CPU进行测试.

第五步 原因揭秘

CPU可以正常启动,到这里我想大家可能都明白了,现场的故障现象完全是一个巧合

背板没有问题,旧的CPU硬件确实出问题了,作为备件的新CPU在更换前已经出问题了。这就造成了背板总线感染CPU假象

什么原因造成CPU的损坏呢?

从测试中可以看到,CPU中的运行环境确实不好,插入实验室新的背板,再拔下来,相应的插槽全是灰尘,拍打CPU,大量的灰尘掉落。

CPU的平均无故障时间大概是20-30年,这是在EMC干扰受限、温度、湿度、防尘等符合要求的环境下测试的结果。

如果这些IP20防护等级的设备,安装于没有柜门或者柜门不关闭而且灰尘很大的环境下,这些设备的平均无故障时间就无法得到保护了。

这款CPU面世至少在10年以上了,备件的保管同样也是一个问题,同时也建议在收到备件后进行一下上电测试,否则就会遇到这样小概率事件了。

故障的“传染”,本质上是现场环境备件状态问题叠加结果,而非设备之间的相互影响。

每月为您推荐超多工控资讯

来源:西门子工业支持中心一点号

相关推荐