摘要:在南大通用GBase数据库日常运维过程中,我们会用到很多工具,即有通用工具、也有专用工具,来帮助我们完成任务、提升效率。本文就介绍两个常用运维工具:C3、nmon。
在南大通用GBase数据库日常运维过程中,我们会用到很多工具,即有通用工具、也有专用工具,来帮助我们完成任务、提升效率。本文就介绍两个常用运维工具:C3、nmon。
C3工具使用
当集群节点服务器很多时,例如10 个以上节点时,对于集群的一些维护工作需要在每个节点上都执行一次相关操作,这样十分耗时,而且繁琐。因此,GBase在集群安装包中,提供了C3 工具的安装脚本,使用C3 工具,可以减少集群节点的维护操作,仅在装有C3 工具的节点机器上输入一次维护命令,便可在所有集群节点上执行,方便集群的维护操作。C3工具实际是一个在集群的一台服务器上执行一条指令并让该指令在集群的所有服务器上执行的工具。C3工具的安装请参考《GBASE 8a MPP Cluster SQL安装手册》第8章C3工具安装。
C3工具已经在集群首节点安装部署好,操作系统的root用户和gbase用户都可以使用C3工具来管理集群。
注意事项:
1.C3工具所管理的服务器只包含集群的节点,不包含集群的加载机。另C3工具配置好后,请不要随意修改首节点服务器上/etc/c3.conf文件。
2.使用C3工具运行集群管理命令只能在首节点上执行,如果在集群其他节点上执行C3命令,会导致严重的内存耗尽直至节点宕机问题,执行C3命令前请确保C3命令运行在首节点服务器上。
简单介绍常用C3集群维护命令
1.启停集群:
使用C3工具启停集群指令:
运行指令用户:root
运行指令环境:linux shell 集群首节点服务器
运行指令:
检查所有节点gcware运行状态:
cexecs "service gcware status"
停止各节点gcware服务:
cexecs "service gcware stop"
启动各节点gcware服务:
cexecs "service gcware start"
重启各节点gcware服务:
cexecs "service gcware restart"
2.查看集群内各节点运行SQL情况:
cexecs "gccli -ugbase -pgbase20110531 -e\"show processlist\" | grep Query | grep -v infile | grep -v processlist"
3.查看集群内各节点加载执行情况:
cexecs "gccli -ugbase -pgbase20110531 -e\"show processlist\" | grep infile "
4.查看集群各节点存储空间情况:
cexecs "df -h "
5.显示集群各节点系统时间:
cexecs date
设置集群各节点系统时间:
cexecs date -s 14:15:00
nmon工具使用介绍
nmon工具是IBM提供的免费的监控AIX系统与Linux系统资源的工具。该工具可将服务器的系统资源耗用情况收集起来并输出一个特定的文件,并可利用excel分析工具进行数据的统计分析,非常利于UNIX或者Linux系统的性能数据分析。
启动nmon工具后输入h可以看到监控项目选项,常用监控项及对应输入包括:
c->CPU资源监控
m->内存资源监控
n->网络资源监控
d->磁盘资源监控
t->活动进程占用系统资源情况监控
nmon还具有输出文件,并通过nmon analyser进行分析的功能,nmon_analyser的分析工具,可利用excel进行统计结果的分析。
使用nmon输出文件,需要在root用户下linux shell中输入:
./ nmon –fT –s 5 –c 5
上面命令的含义是,-f输出文件,-T输出最耗资源的进程,-s收集数据的时间间隔,-c收集次数。比如,我们测试场景需要执行20分钟,那么我们需要每隔10秒监控Linux系统资源就可以写成:
./ nmon_x86_fedora5 –fT –s 10 –c 120
120是次数,也就是20分钟/10秒=120次。完成后会在当前目录生成一个.nmon的文件,
如果想在后台运行nmon,则可用:
nohup ./ nmon_x86_fedora5 –fT –s 10 –c 120
如果想结束该进程,可使用:
ps –ef|grep *nmon*
命令查出该进程ID,然后使用:
kill -9 进程ID
命令消除即可。
生成的.nmon文件如果想使用excel进行分析,可以使用其自带的nmon analyser工具,nmon analyser可生成excel结果、图表等。
来源:GBASE南大通用