Domino/UNIX服务器死机及挂起的数据收集步骤

12/3/2006来源:Lotus Notes人气:27570

数据收集前的准备工作:如果近期有频繁出现服务器死机或者服务挂起现象,建议首先做下面三步准备工作.

1. 修改Notes.ini文件。建议在Domino服务器的notes.ini文件中增加以下参数:

DEBUG_CAPTURE_TIMEOUT=1
DEBUG_SHOW_TIMEOUT=1
DEBUG_THREADID=1
DEBUG_OUTFILE=debug.txt
注: 建议在问题解决后,删除前三个参数.
2. 添加一个新的New Server Statistic Collection的记录来记录服务器的统计信息。

A. 在Domino Administrator中,点 配置 - Statistics %26amp; Events - Server Statistic Collection, 点New Server Statistic Collection,如下图所示:
image
B. 参照下图做相应设置:
image
image
C. 保存退出。

D. 在服务器停止运行状态下,修改notes.ini文件中,查找名为 ServerTasks 的行,并在行最后加入 ",collect"
image
点击查看大图
E. 重启Domino服务器

3. 安装memcheck (此工具在Domino 5.0.8以前的版本需要单独安装,5.0.9版本之后,服务器安装后就已经自动包含,所以可以忽略此步骤)

A. 首先从Lotus技术支持人员处,获得特定平台上的特定版本使用的Memcheck。

B. 必须把获得的memcheck文件(文件名有可能是memcheck508等)重命名为memcheck,不带有任何平台及版本信息,例如
> mv memcheck5.07 memcheck

C. 拷贝此文件到Domino的程序目录下,例如对于Domino/Solaris, 程序目录是 /opt/lotus/notes/latest/sunspa

D. 改变文件的Ownership,例如:> chown root:bin memcheck

E. 修改文件的权限,例如: > chmod 755 memcheck

F. 切换至操作系统的notes用户,在Domino数据目录下运行命令:> nsd ,如果出现下面类似信息,则说明memcheck安装已经成功。如果没有成功,请根据出错信息,检查相应设置。
Debugger Version: Standard
MEMCHECK Version: MEMCHECK Version (X.X) for Lotus Notes Release 5.0.2b ()

当出现服务器挂起(hang)问题时,收集下面数据:

1.以”notes”用户在DOMINO数据目录下运行”nsd”,产生log文件。文件格式类似于:
nsd_all_AIX_lotus_11_01@20_43.log

2.从Notes客户端访问服务器,记录错误信息。

3.在客户端运行“NPING”工具访问Domino服务器,记录响应时间,收集数据。
注 : nping的应用程序需要另行安装, 请访问下面的网址:
http://www-1.ibm.com/support/docview.wss?rs=203%26amp;q=NotesConnect%26amp;uid
=swg24004434%26amp;loc=en_US%26amp;cs=utf-8%26amp;lang=en

4.在客户端“PING”服务器地址,记录响应时间,收集数据。

5.在控制台运行”sh task debug”,”sh user debug”,”sh port tcpip”,”sh stat ”等命令查看服务器运行状态,收集相关数据。

6.在服务器上运行”netstat -a”,“vmstat 2”30秒后结束,“iostat 2”30秒后结束,收集所有三条命令产生的数据。

7.在距第一次收集 nsd 文件5-10分钟后,以”notes”用户在DOMINO数据目录下再次运行nsd命令,产生log文件。

8. 在Domino数据目录下查找是否有名为“core.xxxxx.xxx_xxxx_xx_xx@xx_xx.Z”格式的文件,如果有,将其收集起来。

9. 在Domino数据目录或者程序目录下搜索,是否有名为SEMDEBUG.TXT的文件,如果有将其收集起来,并将原文件删除。

10. 重启服务器.

11. 在以上步骤完成后,将上面九步收集的所有数据,外加debug.txt;statrep.nsf;log.nsf;一起发送给Lotus技术支持人员。

当出现服务器死机(crash)问题时,收集以下数据:

1. 以”notes”用户在DOMINO数据目录下运行”nsd”,产生log文件.文件格式类似于:
nsd_all_AIX_lotus_11_01@20_43.log

2. 在客户端“PING”服务器地址,记录响应时间,收集数据。

3. 在距第一次收集 nsd 文件5-10分钟后,以”notes”用户在DOMINO数据目录下再次运行nsd命令,产生log文件。

4. 在Domino数据目录下查找是否有名为“core.xxxxx.xxx_xxxx_xx_xx@xx_xx.Z”格式的文件,如果有,将其收集起来。

5. 在Domino数据目录或者程序目录下搜索,是否有名为SEMDEBUG.TXT的文件,如果有将其收集起来,并将原文件删除。

6. 重启服务器.

7. 在以上步骤完成后,将上面六步收集的所有数据,外加debug.txt;statrep.nsf;log.nsf;一起发送给Lotus技术支持人员。