Jun 11
   今天收到客户的报障,一套两台部署了Oracle 10g R2 RAC的系统,其中一台主板损坏,更换的主板。但更换后,该机器CRS服务无法正常启动。经咨询,除因更换主板后,网卡MAC地址改变,而重新配置了网络外,本地配置没有做改动。

一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
引用
/var/log/messages:
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059

再追踪到/tmp/crsctl.11059,有:
引用
Failed 3 to bind listening endpoint:(ADDRESS=(PROTOCOL=tcp)(HOST=prv2)

由此,怀疑是更换主板后,网络配置带来的影响。
Tags: , ,
Apr 8
   关于cups 1.1.x的配置,请见:[原]用好Linux下的CUPS打印机服务
   今天在使用Asianux 3.0配置cups的时候,发现其版本从Asianux 2.0带的1.1升级到了1.2.4,这升级也让配置文件也改变了。经过查询Google和man资料,只是实现了部分功能,即Linux-Linux的共享打印。可惜,没法实现Windows-Linux的远程打印。在Windows中添加cups提供的http/ipp协议打印机的时候,一直报错,让我非常纳闷:
引用
192.168.228.247 - - [08/Apr/2008:15:17:28 +0800] "POST /printers/hp3050z HTTP/1.1" 200 133 Get-Printer-Attributes successful-ok
192.168.228.247 - - [08/Apr/2008:15:17:29 +0800] "POST /printers/hp3050z HTTP/1.1" 200 75 windows-ext client-error-bad-request
192.168.228.247 - - [08/Apr/2008:15:17:29 +0800] "POST /printers/hp3050z HTTP/1.1" 200 133 Get-Printer-Attributes successful-ok

希望,若有朋友解决了该问题,也通知我一声。谢谢!
Tags:
Nov 21
   这又是一个从php-syslog-ng找出来的报错信息。如果没有它,估计我不会发现使用了这么久的ntp有报错。信息如下:
引用
ntpd[3775]: sendto(61.153.197.226): Invalid argument
Tags:
Nov 20
   自从使用php-syslog-ng监控日志信息后,经常发现一些过去会忽略的报错信息,目前正逐一解决中。其中一个报错发生在,我使用密钥通过ssh登陆到服务器的时候,日志信息显示:
引用
Nov 19 10:32:20 printserver auth 10:32:20 pam_loginuid[9691]: set_loginuid failed opening loginuid
Nov 19 10:32:20 printserver auth 10:32:20 remote(pam_unix)[9691]: session opened for user root by (uid=0)
Nov 19 10:32:20 printserver auth 10:32:20 sshd[9689]: Accepted publickey for root from 192.168.228.244 port
1487 ssh2
Tags: ,
Nov 16
   最近发现,在使用yum更新包的时候,常报下面的错误:
引用
Reading repository metadata in from local files
primary.xml.gz            100% |=========================| 1.7 MB    02:25
http://www.mirrorservice.org/sites/apt.sw.be/redhat/el4/en/i386/dag/repodata/primary.xml.gz:
[Errno -1] Metadata file does not match checksum
Trying other mirror.

   有时候当替换了几个镜像后就可以了。但经常也会发现最终是失败的。由于我的系统是依赖yum更新的,若使用国外网络源的时候出这样的问题,影响挺大的。
   Google搜索了一下,是一个常见问题,也提供了一些方法。只是后来发现,这些方法要不就是没有说清楚,要不就是误解。经过测试,最终基本可以解决了。
Tags: ,
Nov 15
    在部署好php-syslog-ng服务器后,发现邮件服务器报下面的错误信息:
引用
Nov 11 04:30:04 mail postfix/smtpd[25964]: sql_select option missing
Nov 11 04:30:04 mail postfix/smtpd[25964]: auxpropfunc error no mechanism available

    以前一直都没有发现该问题,就是因为通常我只是grep error或fail信息,而没有看miss信息,并且原来的syslog也没有明显的把level区分开来。所以说,一定要选好日志服务器,并做好其维护工作。
Nov 9
   syslog是用来记录系统日志信息的,主要是记录重要信息。但一些无聊的日志信息很可能会把关键信息给冲掉,或者导致寻找信息很麻烦。例如,在/var/log/messages中就经常看到这样的信息:
引用
Nov  9 17:10:02 mail crond(pam_unix)[4768]: session closed for user root
Nov  9 17:10:02 mail crond(pam_unix)[4769]: session closed for user root
Nov  9 17:15:01 mail crond(pam_unix)[4780]: session opened for user root by (uid=0)
Nov  9 17:15:01 mail crond(pam_unix)[4780]: session closed for user root

没5分钟、10分钟就执行一次,烦不烦啊?一定要解决掉。
Tags: ,
Nov 3
   OOM是Out of Memory的简写,也就是内存不足。出现该问题的原因有很多,如程序内存泄漏等。内存泄漏问题可以通过定时地终止和重启有问题的程序来发现和解决。在比较新的Linux内核版本中,有一种名为OOM(Out Of Memory )杀手的算法,它可以在必要时执行Kill而杀掉一些程序。
Tags: ,
Jul 20
   客户反应,由两套IBM x460组成的Oracle 10g RAC集群,出现ping任何IP地址,都会出现0.000ms的故障。
一、故障描述
◎硬件架构:
每套x460是由两台x460堆叠而成的,每台带1块双口的网卡,也就是一套4个口,实际使用到其中的2个口,一个接路由器,一个接交叉线连接到另外一套中,做心跳。
每套带两块HBA卡,连接到DS4300盘柜中,实现冗余。
Jan 12
红旗DC4.1运行IBM Tivoli Monitoring 6.1(for OS和for Oracle两个agent运行在linux上,server端运行在2003上),其中for oracle的agent运行不正常。通过删除php-oci8可解决问题。
Tags: , , ,
Sep 14
 项目需要部署Open Country,其要求使用Postgresql 7.0或8.0版本。系统为红旗DC 5.0 for x86,默认安装有Postgresql 8.0。
 启动时候出现下面的故障提示:
引用
# service postgresql start
正在初始化数据库:                                         [失败]
启动 postgresql 服务:                                     [失败]
Nov 15
假设eth0上配置的IP是:192.168.228.x,在配置完Cluster Server 4.0后,启动heartbeat:
service heartbeat start


服务器console的屏幕上一直会有这样的信息刷屏(这个信息作为kernel日志写入了/var/log/messages文件中):
xxx.xxx.xxx.xxx sent an invalid ICMP type 11, code 0 error to a broadcast: xxx.xxx.xxx.xxx


虽然此问题并不影响服务器的运行,而且只出现在第一个屏幕中,但有碍查看日志文件,为此,决定想办法把他去掉:
Tags: ,
分页: 4/4 第一页 上页 1 2 3 4 最后页 [ 显示模式: 摘要 | 列表 ]