Jun
11
[原]解决Failed 3 to bind listening endpoint错误
今天收到客户的报障,一套两台部署了Oracle 10g R2 RAC的系统,其中一台主板损坏,更换的主板。但更换后,该机器CRS服务无法正常启动。经咨询,除因更换主板后,网卡MAC地址改变,而重新配置了网络外,本地配置没有做改动。
一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
再追踪到/tmp/crsctl.11059,有:
由此,怀疑是更换主板后,网络配置带来的影响。
二、故障解决
查看/etc/sysconfig/network-scripts/ifcfg-eth0和ifcfg-eth1文件,对比集群中另一台机器db02,IP设置正确;查看主机名,设置正确;查看/etc/hosts文件,发现只保留下面的信息:
由于Oracle启动listener默然使用主机名对应,怀疑是hosts文件错误,导致主机名和IP对应失败。
从db02拷贝hosts的内容到本机:
重启init.crs服务:
启动正常,故障解决。
※后续:引起问题的原因,怀疑是Redhat的gnome网络配置工具,在配置网络信息后,把/etc/hosts文件恢复到初始状态,而丢失了RAC必须的主机名-IP配置关系表。但时间关系,没进一步深究。
一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
引用
/var/log/messages:
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059
再追踪到/tmp/crsctl.11059,有:
引用
Failed 3 to bind listening endpoint:(ADDRESS=(PROTOCOL=tcp)(HOST=prv2)
由此,怀疑是更换主板后,网络配置带来的影响。
二、故障解决
查看/etc/sysconfig/network-scripts/ifcfg-eth0和ifcfg-eth1文件,对比集群中另一台机器db02,IP设置正确;查看主机名,设置正确;查看/etc/hosts文件,发现只保留下面的信息:
引用
127.0.0.1 localhost.localdomain localhost
由于Oracle启动listener默然使用主机名对应,怀疑是hosts文件错误,导致主机名和IP对应失败。
从db02拷贝hosts的内容到本机:
引用
127.0.0.1 localhost.localdomain localhost
# Public Network - (eth0)
219.142.7.143 ora01
219.142.7.144 ora02
# Private Interconnect - (eth1)
10.0.0.1 int-ora01
10.0.0.2 int-ora02
# Public Virtual IP (VIP) addresses for - (eth0)
219.142.7.201 vip-ora01
219.142.7.202 vip-ora02
# Public Network - (eth0)
219.142.7.143 ora01
219.142.7.144 ora02
# Private Interconnect - (eth1)
10.0.0.1 int-ora01
10.0.0.2 int-ora02
# Public Virtual IP (VIP) addresses for - (eth0)
219.142.7.201 vip-ora01
219.142.7.202 vip-ora02
重启init.crs服务:
# service init.crs start
启动正常,故障解决。
※后续:引起问题的原因,怀疑是Redhat的gnome网络配置工具,在配置网络信息后,把/etc/hosts文件恢复到初始状态,而丢失了RAC必须的主机名-IP配置关系表。但时间关系,没进一步深究。