摘要:Ceph可以查看主副本,一般如果ceph集群出现故障,可以执行ceph health detail或者ceph -s,可以查看到ceph的那个主副本,一般是第一个osd。
Ceph可以查看主副本,一般如果ceph集群出现故障,可以执行ceph health detail或者ceph -s,可以查看到ceph的那个主副本,一般是第一个osd。
然后执行ceph osd tree去查看osd 所在的ceph 存储节点。
接着去ceph存储节点执行:
ps -ef| grep ceph
可以查看到ceph osd所对应的进程osd编号。
通过查看到磁盘的链接/dev/disk/里面的分区信息,可以查看到osd所对应的磁盘或者磁盘分区。
接着去检测ceph osd对应磁盘的健康状态。
比如执行:dmesg -T| grep -i error去查看操作系统中是否有磁盘报错。
还有smartctl -a /dev/sdX(sas盘)区查看sata或者sas盘是否故障,事先需要安装包:yum install smartmontools -y。
还有nvme smart-log和nvme error-log去查看nvme盘是否故障,事先需要安装包:yum install nvme-cli -y。
如果主副本所在的磁盘没有故障,那么可以执行:
ceph pg repair $pg_id
去用ceph 数据的主副本修复从副本的数据。
执行命令一段时间后,再执行:
ceph -s。
可以查看到ceph集群的状态是:
HEALTH_OK的状态,代表ceph集群修复成功。
白玉兰花开
鼓励的话语:只有强大的对手才能证明更为强大的自己!
来源:科技现场谈