11gR2 新特性:Oracle
Cluster Health Monitor(CHM)简介
https://blogs.oracle.com/Database4CN/entry/11gr2_新特性_oracle_cluster_health
By JaneZhang(张建英) on 六月 15, 2012
Cluster Health
Monitor(以下简称CHM)是一个Oracle提供的工具,用来自动收集操作系统的资源(CPU、内存、SWAP、进程、I/O以及网络等)的使用情况。CHM会每秒收集一次数据。
这些系统资源数据对于诊断集群系统的节点重启、Hang、实例驱逐(Eviction)、性能问题等是非常有帮助的。另外,用户可以使用CHM来及早发现一些系统负载高、内存异常等问题,从而避免产生更严重的问题。
CHM会自动安装在下面的软件:
11.2.0.2 及更高版本的 Oracle Grid Infrastructure for Linux (不包括Linux
Itanium) 、Solaris (Sparc 64 和 x86-64)
11.2.0.3 及更高版本 Oracle Grid Infrastructure for AIX 、 Windows
(不包括Windows Itanium)。
在集群中,可以通过下面的命令查看CHM对应的资源(ora.crf)的状态:
$ crsctl stat res -t
-init
--------------------------------------------------------------------------------
NAME TARGET STATE SERVER STATE_DETAILS
Cluster Resources
ora.crf ONLINE ONLINE rac1
CHM主要包括两个服务:
1). System Monitor
Service(osysmond):这个服务在所有节点都会运行,osysmond会将每个节点的资源使用情况发送给cluster
logger service,后者将会把所有节点的信息都接收并保存到CHM的资料库。
$ ps -ef|grep
osysmond
root 7984 1 0 Jun05 ? 01:16:14
/u01/app/11.2.0/grid/bin/osysmond.bin
2). Cluster Logger Service(ologgerd):在一个集群中的,ologgerd
会有一个主机点(master),还有一个备节点(standby)。当ologgerd在当前的节点遇到问题无法启动后,它会在备用节点启用。
主节点:
$ ps -ef|grep
ologgerd
root 8257 1 0 Jun05 ? 00:38:26
/u01/app/11.2.0/grid/bin/ologgerd -M -d
/u01/app/11.2.0/grid/crf/db/rac2
备节点:
$ ps -ef|grep
ologgerd
root 8353 1 0 Jun05 ? 00:18:47
/u01/app/11.2.0/grid/bin/ologgerd -m rac2 -r -d
/u01/app/11.2.0/grid/crf/db/rac1
CHM Repository:用于存放收集到数据,默认情况下,会存在于Grid Infrastructure home
下 ,需要1 GB 的磁盘空间,每个节点大约每天会占用0.5GB的空间。
您可以使用OCLUMON来调整它的存放路径以及允许的空间大小(最多只能保存3天的数据)。
下面的命令用来查看它当前设置:
$ oclumon manage -get
reppath
CHM Repository Path =
/u01/app/11.2.0/grid/crf/db/rac2
Done
$ oclumon manage -get
repsize
CHM Repository Size = 68082
<====单位为秒
Done
修改路径:
$ oclumon manage -repos reploc
/shared/oracle/chm
修改大小:
$ oclumon manage -repos resize 68083
<==在3600(小时) 到
259200(3天)之间
rac1 --> retention
check successful
New retention is 68083 and will use
1073750609 bytes of disk space
CRS-9115-Cluster Health Monitor
repository size change completed on all nodes.
Done
获得CHM生成的数据的方法有两种:
1. 一种是使用Grid_home/bin/diagcollection.pl:
1). 首先,确定cluster logger service的主节点:
$ oclumon manage -get
master
Master = rac2
2).用root身份在主节点rac2执行下面的命令:
#
<Grid_home>/bin/diagcollection.pl
-collect -chmos -incidenttime inc_time -incidentduration
duration
inc_time是指从什么时间开始获得数据,格式为MM/DD/YYYY24HH:MM:SS,
duration指的是获得开始时间后多长时间的数据。
比如:# diagcollection.pl -collect
-crshome /u01/app/11.2.0/grid -chmoshome /u01/app/11.2.0/grid
-chmos -incidenttime 06/15/201215:30:00 -incidentduration
00:05
3).运行这个命令之后,CHM的数据会生成在文件chmosData_rac2_20120615_1537.tar.gz。
2. 另外一种获得CHM生成的数据的方法为oclumon:
$oclumon dumpnodeview [[-allnodes] |
[-n node1 node2] [-last "duration"] | [-s "time_stamp" -e
"time_stamp"] [-v] [-warning]] [-h]
-s表示开始时间,-e表示结束时间
$ oclumon dumpnodeview -allnodes -v -s
"2012-06-15 07:40:00" -e "2012-06-15 07:57:00" >
/tmp/chm1.txt
$ oclumon dumpnodeview -n node1 node2
node3 -last "12:00:00"
>/tmp/chm1.txt
$ oclumon dumpnodeview -allnodes -last
"00:15:00" >/tmp/chm1.txt
下面是/tmp/chm1.txt中的部分内容:
----------------------------------------
Node: rac1 Clock: '06-15-12 07.40.01'
SerialNo:168880
----------------------------------------
SYSTEM:
#cpus: 1 cpu: 17.96 cpuq: 5
physmemfree: 32240 physmemtotal: 2065856 mcache: 1064024 swapfree:
3988376 swaptotal: 4192956 ior: 57 io
w: 59 ios: 10 swpin: 0 swpout: 0 pgin:
57 pgout: 59 netr: 65.767 netw: 34.871 procs: 183 rtprocs: 10 #fds:
4902 #sysfdlimit: 6815744
#disks: 4 #nics: 3 nicErrors:
0
TOP CONSUMERS:
topcpu: 'mrtg(32385) 64.70'
topprivmem: 'ologgerd(8353) 84068' topshm: 'oracle(8760) 329452'
topfd: 'ohasd.bin(6627) 720' topthread:
'crsd.bin(8235) 44'
PROCESSES:
name: 'mrtg' pid: 32385 #procfdlimit:
65536 cpuusage: 64.70 privmem: 1160 shm: 1584 #fd: 5 #threads: 1
priority: 20 nice: 0
name: 'oracle' pid: 32381
#procfdlimit: 65536 cpuusage: 0.29 privmem: 1456 shm: 12444 #fd: 32
#threads: 1 priority: 15 nice: 0
...
name: 'oracle' pid: 8756 #procfdlimit:
65536 cpuusage: 0.0 privmem: 2892 shm: 24356 #fd: 47 #threads: 1
priority: 16 nice: 0
----------------------------------------
Node: rac2 Clock: '06-15-12 07.40.02'
SerialNo:168878
----------------------------------------
SYSTEM:
#cpus: 1 cpu: 40.72 cpuq: 8
physmemfree: 34072 physmemtotal: 2065856 mcache: 1005636 swapfree:
3991808 swaptotal: 4192956 ior: 54 io
w: 104 ios: 11 swpin: 0 swpout: 0
pgin: 54 pgout: 104 netr: 77.817 netw: 33.008 procs: 178 rtprocs:
10 #fds: 4948 #sysfdlimit: 68157
44 #disks: 4 #nics: 4 nicErrors:
0
TOP CONSUMERS:
topcpu: 'orarootagent.bi(8490) 1.59'
topprivmem: 'ologgerd(8257) 83108' topshm: 'oracle(8873) 324868'
topfd: 'ohasd.bin(6744) 720' t
opthread: 'crsd.bin(8362)
47'
PROCESSES:
name: 'oracle' pid: 9040 #procfdlimit:
65536 cpuusage: 0.19 privmem: 6040 shm: 121712 #fd: 33 #threads: 1
priority: 16 nice: 0
...
关于CHM的更多解释,请参考Oracle官方文档:
http://docs.oracle.com/cd/E11882_01/rac.112/e16794/troubleshoot.htm#CWADD92242
Oracle® Clusterware Administration and Deployment Guide
11g Release 2 (11.2)
Part Number E16794-17
或者 My Oracle Support文档:
Cluster Health Monitor (CHM) FAQ (Doc ID
1328466.1)
相关推荐
HTML5新特性 简洁的DOCTYPE: HTML5 只有一个简单的文档类型:<!DOCTYPE html>,表示浏览器会按照标准模式解析。 简单易记的编码类型 你现在可以在meta 标签中使用”charset”:<meta charset=”utf-8″ />...
&he0,&he2,&he4,&he6,&he8,&hea,&hec,&hee,&hf0,&hf2,&hf4,&hf6,&hf8,&hfa,&hfc,&hfe, _ &h1b,&h19,&h1f,&h1d,&h13,&h11,&h17,&h15,&h0b,&h09,&h0f,&h0d,&h03,&h01,&h07,&h05, _ &h3b,&h39,&h3f,&h3d,&h33,&h31,&...
IBM Host Ethernet Adapter overview
如果网页处于焦点状态返回true,否则返回fasle 什么是焦点?焦点是指用户是否活动在该页面.确切的说鼠标是否在该网页内活动.或者说该网页中的内容是否有被选中的,或者光标存在于该页的某个元素内..../hea
HEA具有一些新的特点, 例如在局部搜索中采用了一种新提出的基于块移动的邻域结构, 这种邻域结构合理地限制了搜索空间, 提高了算法的搜索效率; 在HEA中采用了一种新的组合算子——块顺序交叉算符(BOX)来产生新的子...
Lambda 算法是 Hea 的新版本
Const adErrPropNotSupported = &Hea2 Const adErrCatalogNotSet = &Hea3 Const adErrCantChangeConnection = &Hea4 Const adErrFieldsUpdateFailed = &Hea5 Const adErrDenyNotSupported = &Hea6 Const ...
利用MATLAB读取心电数据
React式网站对 Meteor 的React式改编。 博客文章: 。介绍这个包把 2 个部分放在一起: 一个React式字典rxFavico ,便于使用 。 显示通知或测试结果非常方便。 浏览器全局空间中的Favico类,就像的基本... 在玉: hea
HEA(TIL) Hoje eu aprendi(今天我已学习) Esterepositórioéum mapa do meu aprendizado,conteúdosque acabei de conhecer ou que ando revisando,alémde umacoleçãode pequenos artigos quenã...
hea-uihea-ui 是一款比较成熟的前端组件和解决方案,基于vue开发,后续会发展成vue react任选的方案 完美的解决了业务与视图之间的耦合关系组件化开发,效率更高,速度更快,无缝对接数据接口。安装NPMnpm install ...
源码采用php实现,这是一个用php脚本...2.动态浏览与静态后台自由切换!3.全站伪原创.全站可生成页面缓存,减轻服务器负担,读取速度加快!4.四种采集方式,兼容98%空间服务器,独立模板风格,作为开发的各种例子程序代码
:sparkles:特性 :white_heavy_check_mark:使用Vue.js全家桶开发 :red_circle:网易云账号登录 :television: MV播放 :page_with_curl:支持歌词显示 :prohibited: :handshake:无任何社交功能 :globe_showing_...
使用matlab读取心电、血压等采集数据.dat和.hea文件,并分图标注显示。内有详细程序说明和读取实例
效果图: 代码如下: <!doctype html> <html lang=en> <head> <meta charset=UTF-8> <title>js验证码</title> <style type=text/css>... letter-spacing:2px;.../hea
上载数据库“ db-hea-web”并根据您的配置修改您的.env文件 打开终端,将目录更改为yoursite / themes / starter并运行yarn watch Silverstripe的更多内容 有关更多信息,请参见。 Bugtracker 在github.com上跟踪...
今天在新服上安装php imagick, 环境如下: php 5.4.13 ImageMagick-6.8.3-10 imagick-3.0.1 可是出错了一个问题.就是死说找不到MagickWand.h: checking for MagickWand.h header file… configure: error: Cannot ...
爆头Headshot 是一个 gem,它为 Ruby on Rails 应用程序提供了一种快速简便的方法,可以通过网络摄像头捕捉用户的照片,而无需接触 ...= headshot_default_config(Rails.application.config.session_options[:key], hea
Akai-KKR-HEA-示例 KKR-CPA计算 XC电位= PBE HEA =高熵合金 Akai-KKR(2021年3月29日[03:31:26]) 安装 从获取Akai-KKR代码 在Linux窗口上打开终端或控制台(例如,WSL上的Ubuntu 18.04或Ubuntu 18.04 LTS) 须藤...
我们首先来看看要实现的效果图 代码如下 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> <style>.../hea