常见故障、Bug的处理
Dec
31
还是之前提供的x86_64操作系统平台上,运行Tomcat并启动https的问题。就像日志中描述的,在我的测试环境中部署非常顺利,几乎就没有遇到什么障碍。但把操作过程告知用户,结果访问https://ip:8443/时,就报错,最终无法连接。今天特到现场看看故障情况,经排查原来是用户的Oracle环境变量导致的,去掉有问题的变量后,https启动正常。
Nov
8
我们都知道,若机器上有多个网卡,则会根据/etc/modprobe.conf或/etc/modules.conf文件中的加载顺序决定网络设备号,例如:
但后来我发现,在Asianux 3.0上似乎并不是这样的。可能是由于驱动原因(都是BCM的网卡),或其他原因吧,机器每次启动后连接网线的设备号都会不同。如果您只在一个网卡上接了网线,那可能这次用eth2可以连接,但下次重启后就变成需要用eth1了。没有什么固定的规律。这对服务的稳定性带来很大的影响。
引用
# cat /etc/modprobe.conf|grep eth
alias eth0 bnx2
alias eth1 bnx2
alias eth2 tg3
alias eth0 bnx2
alias eth1 bnx2
alias eth2 tg3
但后来我发现,在Asianux 3.0上似乎并不是这样的。可能是由于驱动原因(都是BCM的网卡),或其他原因吧,机器每次启动后连接网线的设备号都会不同。如果您只在一个网卡上接了网线,那可能这次用eth2可以连接,但下次重启后就变成需要用eth1了。没有什么固定的规律。这对服务的稳定性带来很大的影响。
Nov
7
项目中,使用红旗 Asianux 3.0 for x86系统,对外提供telnet服务。修改/etc/xinetd.d/telnet配置文件,重启xinetd服务,使用netstat -ln|grep 23确认服务器已经打开23端口。但使用客户端Netterm或Windows终端去连接,都报如下错误:
怀疑安全设置中需要DNS回访导致的。
引用
getnameinfo: localhost: Success
Temporary failure in name resolution: Illegal seek
Temporary failure in name resolution: Illegal seek
怀疑安全设置中需要DNS回访导致的。
Nov
4
某机器,系统运行一段时间之后根分区都会变成只读。当使用光盘进入拯救模式后,用
可以看到文件系统的状态是“clean with errors”。
用fsck进行系统检查时,报如下错误:
该错误表明ext3文件系统有一部分的日志丢失了。由于fsck并不能恢复日志,需要手动重建磁盘日志。
# dumpe2fs -h /dev/sda1
可以看到文件系统的状态是“clean with errors”。
用fsck进行系统检查时,报如下错误:
引用
journal_bmap_Rsmp_6199acb1: journal block not found at offset 5132 on md(9,0)
Aborting journal on device md(9,0).
ext3_abort called.
EXT3-fs abort (device md(9,0)): ext3_journal_start: Detected aborted journal
Remounting filesystem read-only
Aborting journal on device md(9,0).
ext3_abort called.
EXT3-fs abort (device md(9,0)): ext3_journal_start: Detected aborted journal
Remounting filesystem read-only
该错误表明ext3文件系统有一部分的日志丢失了。由于fsck并不能恢复日志,需要手动重建磁盘日志。
Sep
13
两个有关sshd服务的常见问题:
一、取消DNS反向解析
使用的Linux用户可能觉得用SSH登陆时为什么反映这么慢,有的可能要几十秒才能登陆进系统。其实这是由于默认sshd服务开启了DNS反向解析,如果你的sshd没有使用域名等来作为限定时,可以取消此功能。
一、取消DNS反向解析
使用的Linux用户可能觉得用SSH登陆时为什么反映这么慢,有的可能要几十秒才能登陆进系统。其实这是由于默认sshd服务开启了DNS反向解析,如果你的sshd没有使用域名等来作为限定时,可以取消此功能。
Jun
11
今天收到客户的报障,一套两台部署了Oracle 10g R2 RAC的系统,其中一台主板损坏,更换的主板。但更换后,该机器CRS服务无法正常启动。经咨询,除因更换主板后,网卡MAC地址改变,而重新配置了网络外,本地配置没有做改动。
一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
再追踪到/tmp/crsctl.11059,有:
由此,怀疑是更换主板后,网络配置带来的影响。
一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
引用
/var/log/messages:
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059
再追踪到/tmp/crsctl.11059,有:
引用
Failed 3 to bind listening endpoint:(ADDRESS=(PROTOCOL=tcp)(HOST=prv2)
由此,怀疑是更换主板后,网络配置带来的影响。
Apr
8
关于cups 1.1.x的配置,请见:[原]用好Linux下的CUPS打印机服务
今天在使用Asianux 3.0配置cups的时候,发现其版本从Asianux 2.0带的1.1升级到了1.2.4,这升级也让配置文件也改变了。经过查询Google和man资料,只是实现了部分功能,即Linux-Linux的共享打印。可惜,没法实现Windows-Linux的远程打印。在Windows中添加cups提供的http/ipp协议打印机的时候,一直报错,让我非常纳闷:
希望,若有朋友解决了该问题,也通知我一声。谢谢!
今天在使用Asianux 3.0配置cups的时候,发现其版本从Asianux 2.0带的1.1升级到了1.2.4,这升级也让配置文件也改变了。经过查询Google和man资料,只是实现了部分功能,即Linux-Linux的共享打印。可惜,没法实现Windows-Linux的远程打印。在Windows中添加cups提供的http/ipp协议打印机的时候,一直报错,让我非常纳闷:
引用
192.168.228.247 - - [08/Apr/2008:15:17:28 +0800] "POST /printers/hp3050z HTTP/1.1" 200 133 Get-Printer-Attributes successful-ok
192.168.228.247 - - [08/Apr/2008:15:17:29 +0800] "POST /printers/hp3050z HTTP/1.1" 200 75 windows-ext client-error-bad-request
192.168.228.247 - - [08/Apr/2008:15:17:29 +0800] "POST /printers/hp3050z HTTP/1.1" 200 133 Get-Printer-Attributes successful-ok
192.168.228.247 - - [08/Apr/2008:15:17:29 +0800] "POST /printers/hp3050z HTTP/1.1" 200 75 windows-ext client-error-bad-request
192.168.228.247 - - [08/Apr/2008:15:17:29 +0800] "POST /printers/hp3050z HTTP/1.1" 200 133 Get-Printer-Attributes successful-ok
希望,若有朋友解决了该问题,也通知我一声。谢谢!






