Oracle RAC集群环境下正常启停数据库
·
Oracle RAC集群环境下正常启停数据库
一、正常(计划内)停数据库操作流程
前提:登录任意一台数据库服务器操作系统,
下面以节点一服务器为例
1、停止数据库监听程序
su - grid
srvctl stop listener -n host33rac1
srvctl stop listener -n host34rac2
srvctl stop scan_listener -f
备注:
-n 后面为node_name,一般为主机名,也可以通过olsnodes -n命令来查看确认
验证:监听已经停止
方法1)通过查询集群状态来确认
crsctl stat res -t|grep -A 2 LISTENER
方法2)集群各节点服务器上查看是否有监听进程
ps -ef|grep tnslsnr|grep -v grep
2、停止数据库上的所有业务程序(包括所有前台和后台程序)
3、检查数据库上是否存在大批量更新数据的运行事务
通过运行事务所使用的undo回滚段大小来判断,一般undo回滚段使用超过500M表示存在大的运行事务。
具体检查方法如下:
select INST_ID,START_TIME,trunc(USED_UBLK*8192/1024/1024,2) undo_mb
from gv$transaction
order by inst_id,3 desc;
备注:
1)如果数据库中检查出来,存在大批量事务,必须等待事务完成,或者杀掉事务进程后,必须等待事务回滚操作完成;
2)第一列为节点号,表示事务在集群中哪个节点上运行
3)第三列为运行事务使用的undo回滚段大小,单位为M
4、登录Oracle集群中所有节点的服务器操作系统,杀掉所有通过网络连接数据库的进程(外部连接)
1)每个集群节点都执行:
su - oracle
ps -ef|grep oracle|grep LOCAL=NO|grep -v grep|awk '{print $2}'|xargs kill -9
ps -ef|grep oracle|grep LOCAL=NO|grep -v grep|awk '{print $2}'|xargs kill -9
执行两次,确保外部连接杀干净
2)每个集群节点都验证:
ps -ef|grep oracle|grep LOCAL=NO|grep -v grep
5、手工执行数据库检查点,一般执行三次。(每个集群节点都执行)
备注:数据库检查点会将已经提交的事务(事务SQL语句中更新的数据块),全部从内存刷新到磁盘数据文件,保证数据一致性,意义有三点:
(1)缩短正常停库时间
(2)极大提高正常immediate关库的成功性
(3)出现极小概率必须使用abort强制关闭时,可以大概率规避abort强制关库引起的数据块损坏、数据库无法正常起来等很多问题
具体执行方法如下:(每个集群几点都需要执行!!!)
su - oracle
sqlplus "/as sysdba"
alter system checkpoint;
alter system checkpoint;
alter system checkpoint;
exit
5、正常关闭数据库
在节点一上执行
su - oracle
1)停止节点二数据库实例,如下:
srvctl stop instance -d orcl -i orcl2 -o immediate;
2)可选。步骤5,在剩余的节点一重复执行一次,因为关闭节点一实例,会引起RAC重构,建议再执行一次检查点
3)停止剩余的节点一数据库实例,如下:
srvctl stop instance -d orcl -i orcl1 -o immediate;
二、正常(计划内)启数据库操作流程
前提:登录集群中任意一台数据库服务器操作系统
1、启动数据库
在节点一上执行
su - oracle
srvctl start database -d orcl
备注:
1)该命令会在启动集群所有节点的数据库实例
2)默认情况下,由于数据库和监听程序的以来关系,再我们启动数据库时,会将监听程序一起启动
备注:如果监听程序未启动,可以通过下面方式手工启动,任意登录集群中的一个节点
在节点一上执行
su - grid
srvctl start listener -n host33rac1
srvctl start listener -n host34rac2
srvctl start scan_listener
2、验证
1)验证数据库已经启动
su - grid
crsctl stat res -t|grep -A 2 .db
2)验证监听程序已经启动
方法1)通过查询集群状态来确认
crsctl stat res -t|grep -A 2 LISTENER
方法2)集群各节点服务器上查看是否有监听进程
ps -ef|grep tnslsnr|grep -v grep
3、启动数据库上的所有业务程序,包括前台和后台程序。
4、简单的业务功能可用性测试
更多推荐

所有评论(0)