Jul
21
[原]解决OCFS2不能自动挂载的问题
客户报障说,两台服务器运行Oracle 10g RAC集群。但其中一台在启动的时候不能自动加载ocfs2模块,启动o2cb服务失败,而机器启动后,手工运行启动则成功。另外一台则没有问题。
一、故障描述
1、分析日志
登陆到故障机器中,查看/var/log/messages日志,发现启动的时候,报错如下:
启动后,手动启动o2cb服务:
日志显示正常:
服务启动信息:
2、查看配置
从/etc/init.d/o2cb或者,启动的时候,需要读取/etc/sysconfig/o2cb文件,其内容如下:
对比另一台正常的机器,可发现故障的原因在此。
二、解决问题
修改故障机器的/etc/sysconfig/o2cb文件为:
重启启动后故障解决。
※关于ocfs2的另一重要的配置文件在/etc/o2cb/cluster.conf。
三、回顾
该故障,应该是配置ocfs2分区的时候,不注意启动参数,o2cb并没有设置自动启动引起的。
一、故障描述
1、分析日志
登陆到故障机器中,查看/var/log/messages日志,发现启动的时候,报错如下:
引用
Jul 19 21:00:59 dbsrv-2 netfs: Checking network-attached filesystems succeeded
Jul 19 21:01:08 dbsrv-2 mount: mount.ocfs2: Unable to access cluster service
Jul 19 21:01:08 dbsrv-2 mount:
Jul 19 21:01:08 dbsrv-2 netfs: Mounting other filesystems: failed
Jul 19 21:01:08 dbsrv-2 mount: mount.ocfs2: Unable to access cluster service
Jul 19 21:01:08 dbsrv-2 mount:
Jul 19 21:01:08 dbsrv-2 netfs: Mounting other filesystems: failed
启动后,手动启动o2cb服务:
/etc/init.d/o2cb load
/etc/init.d/o2cb online ocfs2
/etc/init.d/o2cb start
/etc/init.d/o2cb status
mount -t ocfs2 -o datavolume,nointr /dev/sdc1 /oradata
cd /oradata
/etc/init.d/init.crs start
/etc/init.d/o2cb online ocfs2
/etc/init.d/o2cb start
/etc/init.d/o2cb status
mount -t ocfs2 -o datavolume,nointr /dev/sdc1 /oradata
cd /oradata
/etc/init.d/init.crs start
日志显示正常:
引用
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 Node Manager 1.2.3
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 DLM 1.2.3
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 DLMFS 1.2.3
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 User DLM kernel interface loaded
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 DLM 1.2.3
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 DLMFS 1.2.3
Jul 19 21:49:57 dbsrv-2 kernel: OCFS2 User DLM kernel interface loaded
服务启动信息:
引用
Jul 19 21:51:34 dbsrv-2 kernel: o2net: accepted connection from node dbsrv-1 (num 1) at 172.20.3.1:7777
Jul 19 21:51:36 dbsrv-2 kernel: OCFS2 1.2.3
Jul 19 21:51:36 dbsrv-2 kernel: ocfs2_dlm: Nodes in domain ("B7E0B9B6253841AB92CDCC1011A7D6DB"): 0 1
Jul 19 21:51:36 dbsrv-2 kernel: kjournald starting. Commit interval 5 seconds
Jul 19 21:51:36 dbsrv-2 kernel: ocfs2: Mounting device (8,33) on (node 0, slot 0)
Jul 19 21:52:14 dbsrv-2 root: Oracle Cluster Ready Services starting by user request.
Jul 19 21:51:36 dbsrv-2 kernel: OCFS2 1.2.3
Jul 19 21:51:36 dbsrv-2 kernel: ocfs2_dlm: Nodes in domain ("B7E0B9B6253841AB92CDCC1011A7D6DB"): 0 1
Jul 19 21:51:36 dbsrv-2 kernel: kjournald starting. Commit interval 5 seconds
Jul 19 21:51:36 dbsrv-2 kernel: ocfs2: Mounting device (8,33) on (node 0, slot 0)
Jul 19 21:52:14 dbsrv-2 root: Oracle Cluster Ready Services starting by user request.
2、查看配置
从/etc/init.d/o2cb或者,启动的时候,需要读取/etc/sysconfig/o2cb文件,其内容如下:
引用
O2CB_ENABLED=false
O2CB_BOOTCLUSTER=ocfs2
O2CB_BOOTCLUSTER=ocfs2
对比另一台正常的机器,可发现故障的原因在此。
二、解决问题
修改故障机器的/etc/sysconfig/o2cb文件为:
引用
O2CB_ENABLED=true
O2CB_BOOTCLUSTER=ocfs2
O2CB_HEARTBEAT_THRESHOLD=
O2CB_BOOTCLUSTER=ocfs2
O2CB_HEARTBEAT_THRESHOLD=
重启启动后故障解决。
※关于ocfs2的另一重要的配置文件在/etc/o2cb/cluster.conf。
三、回顾
该故障,应该是配置ocfs2分区的时候,不注意启动参数,o2cb并没有设置自动启动引起的。
else
2009/07/05 13:29
顶,终于在你这里找到了答案,谢谢
cjhp
2008/12/18 13:50
谢谢 ,我的问题就是看了这个解决得 ,
分页: 1/1 1