Devido a existência de um BUG na versão 11g, o Cluster Health Monitor (CHM) que é responsável pela coleta de métricas de sistema como utilização de memória, swap, processos, I/O, entre outros, acaba gerando abaixo do GI (Grid Infrastructure) enormes arquivos de dados, como por exemplo o crfclust.bdb.
Verificando a retenção do repositório temos 1094795585 segundos, que são 12671 dias, sendo este um dos fatores de problema.
[grid@rac2 ~]$ oclumon manage -get repsize CHM Repository Size = 1094795585 Done
A coleta Essa coleta se dá através do “Cluster Health Monitor Service” – ora.crf, desta forma vamos proceder com a parada do serviço que pode ser realizada com o cluster funcionando sem gerar qualquer problema ao ambiente.
Local onde os arquivos correspondentes ao repositório do CHM são armazenados (gerados).
[grid@rac2 ~]$ oclumon manage -get reppath CHM Repository Path = /orabin01/app/11.2.0/grid/crf/db/rac2 Done
Parando o serviço:
[grid@rac2 ~]$ crsctl stop res ora.crf -init CRS-2673: Attempting to stop 'ora.crf' on 'rac2' CRS-2677: Stop of 'ora.crf' on 'rac2' succeeded
Com o usuário root proceda com a remoção de todos os arquivos .bdb localizados abaixo do diretório retornado no reppath
[root@rac2 ~]# cd /orabin01/app/11.2.0/grid/crf/db/rac2 [root@rac2 rac2]# rm -f *.bdb
Suba novamente o serviço ora.crf:
[root@rac2 rac2]# su - grid [grid@rac2 ~]$ . oraenv <<< +ASM2 ORACLE_SID = [+] ? The Oracle base has been set to /orabin01/app/11.2.0 [grid@rac2 ~]$ crsctl start res ora.crf -init CRS-2672: Attempting to start 'ora.crf' on 'rac2' CRS-2676: Start of 'ora.crf' on 'rac2' succeeded
Os arquivos .bdb serão novamente recriados e as coletas retomadas!
[grid@rac2 rac2]$ ls -hlrt *.bdb -rw-r----- 1 root root 8.0K Nov 25 09:26 repdhosts.bdb -rw-r----- 1 root root 8.0K Nov 25 09:28 crfconn.bdb -rw-r----- 1 root root 2.5M Dec 5 19:22 crfts.bdb -rw-r----- 1 root root 3.8M Dec 5 19:22 crfloclts.bdb -rw-r----- 1 root root 9.5M Dec 5 19:22 crfcpu.bdb -rw-r----- 1 root root 4.2M Dec 5 19:22 crfalert.bdb -rw-r----- 1 root root 4.0M Dec 5 19:22 crfhosts.bdb -rw-r----- 1 root root 221M Dec 5 19:22 crfclust.bdb
Ajuste a retenção do repositório para 259200 (3 dias)
[grid@rac2 ~]$ oclumon manage -repos resize 259200 rac1 --> retention check successful rac2 --> retention check successful New retention is 259200 and will use 4516300800 bytes of disk space CRS-9115-Cluster Health Monitor repository size change completed on all nodes.
Referência:
Oracle Cluster Health Monitor (CHM) using large amount of space (more than default) (Doc ID 1343105.1)
0 comentários:
Postar um comentário