摘要:一查进程,L2INF(二层协议处理)占了60%的CPU——原来是某接入层交换机的端口环路,导致BPDU和MAC漂移风暴不断上送主控。
号主:老杨丨11年资深网络工程师,更多网工提升干货,
去年一家客户说核心交换机“带不动”了,业务卡顿,非要升级到高端型号。
我上去一看,CPU持续90%,内存占用85%,看着确实紧张。可流量统计显示,整机利用率不到30%。
一查进程,L2INF(二层协议处理)占了60%的CPU——原来是某接入层交换机的端口环路,导致BPDU和MAC漂移风暴不断上送主控。
清掉异常会话,CPU瞬间降到20%。干了这么多年,我明白一个道理:设备不会无缘无故“老”,它喊累,是因为有人在“滥用”。
今天,我就把华为交换机性能排查的“三板斧”——CPU、内存、流量,给你拆开讲透。
今日文章阅读福利:《华为交换机开局配置一本通 》
顺手发个好东西!网工必备资料!!
私信我,发送暗号“一本通”,即可获取这份优质PDF资源。
01 性能瓶颈的三大来源在排查前,先明确性能问题的可能根源:
# 查看1分钟、5分钟、15分钟平均负载
display cpu-usage
# 输出示例:
# CPU Usage Stat. Cycle: 10 (Second)
# cpu (s) user system idle
# 14% 23% 63%
# CPU utilization for ten seconds: 37%
# 查看各进程CPU占用
display cpu-usage process
# 输出示例:
# Process name CPU%
# L2INF 62.1
# ARPSNOOPING 15.3
# OSPF 2.1
常见高危进程:
L2INF:二层协议处理(STP、MAC学习)——查环路、BPDU风暴ARPSNOOPING:ARP处理——查ARP泛洪、扫描ACL:ACL匹配复杂——查规则数量与匹配频率# 查看内存使用率
display memory-usage
# 输出示例:
# Memory Usage : 85%
# Total: 4194304 KB, Used: 3565158 KB, Free: 629146 KB
注意:华为设备内存包含主控和业务板,需分板查看。
02 检查关键资源表项# 查看MAC地址表使用率
display mac-address summary
# Total: 16384, Used: 15800 → 占用96%,接近溢出
# 查看ARP表项
display arp all | count
# 若ARP表接近设备规格(如S5735支持16K ARP),需排查扫描行为
# 查看ACL资源占用
display acl resource
风险点:表项溢出会导致学习失败,引发通信异常。
# 查看接口带宽利用率
display interface brief
# 重点关注:
# - Input/Output rate(最近300秒平均流量)
# - CRC errors、giants(异常包)
判断标准:持续 > 70% 利用率需关注,> 90% 可能成为瓶颈。
02 识别异常流量类型# 查看接口流量统计(按协议)
display interface gigabitethernet 1/0/1 | include broadcast|multicast
# 输出示例:
# Broadcast: 123456 packets
# Multicast: 789012 packets
异常信号:
广播包 > 10% 总流量 → 可能存在环路或扫描组播风暴 → 检查IGMP Snooping配置# 开启NetStream统计
interface gigabitethernet 1/0/1
ip netstream inbound
#
netstream exporter ip 10.1.1.100 2055
netstream sampler random-packets 1000
价值:可分析流量五元组,定位“元凶”IP与应用。
05 综合排查流程图开始
↓
查看 CPU 使用率 > 70%?
↓ 是
查看高占用进程 → 定位协议类型
↓
结合内存与流量验证:
- 内存是否高?表项是否溢出?
- 流量是否异常?广播比例如何?
↓
制定策略:
- 优化配置(如STP、ACL)
- 阻断异常源(如私接设备)
- 升级硬件(最后选择)
↓
结束
交换机性能瓶颈的排查是一项系统性工作,需综合CPU、内存与流量三维度数据进行交叉分析。
华为设备提供了丰富的诊断命令,帮助咱定位问题根源。
实践中,多数性能问题源于配置不当或网络异常(如环路、扫描),而非硬件性能不足。
建议大家建立定期健康检查机制,通过display cpu-usage、display memory-usage和display interface等命令提前发现隐患,避免故障扩大。
来源:网络工程师俱乐部一点号