在Red Hat Enterprise Linux 5.0服务器中,如果NFS出现了故障,可以从以下几个方面着手检查。
1.1 故障排除思路
(1)NFS客户机和服务器的负荷是否太高,服务器和客户端之间的网络是否正常。
(2)/etc/exports文件的正确性。
(3)必要时重新启动NFS或portmap服务。
运行下列命令重新启动portmap和NFS:
service portmap restart
service nfs start
(4)检查客户端中的mount命令或/etc/fstab的语法是否正确。
(5)查看内核是否支持NFS和RPC服务。
普通的内核应有的选项为CONFIG_NFS_FS=m、CONFIG_NFS_V3=y、CONFIG_ NFSD=m、CONFIG_NFSD_V3=y和CONFIG_SUNRPC=m。
我们可以使用常见的网络连接和测试工具ping及tracerroute来测试网络连接及速度是否正常,网络连接正常是NFS作用的基础。rpcinfo命令用于显示系统的RPC信息,一般使用-p参数列出某台主机的RPC服务。用rpcinfo-p命令检查服务器时,应该能看到portmapper、status、mountd nfs和nlockmgr。用该命令检查客户端时,应该至少能看到portmapper服务。
1.2 NFS错误信息
NFS错误信息如下表所示。
1.3 使用nfsstat命令查看NFS服务器状态
nfsstat命令显示关于NFS和到内核的远程过程调用(RPC)接口的统计信息,也可以使用该命令重新初始化该信息。如果未给定标志,默认是nfsstat -csnr命令。使用该命令显示每条信息,但不能重新初始化任何信息。
nfsstat命令的主要参数如下。
(1)-b:显示NFS V4服务器的其他统计信息。
(2)c:只显示客户机端的NFS和RPC信息,允许用户仅查看客户机数据的报告。nfsstat命令提供关于被客户机发送和拒绝的RPC和NFS调用数目的信息。
要只显示客户机NFS或者RPC信息,将该参数与-n或者-r参数结合。
(3)-d:显示与NFS V4授权相关的信息。
(4)-g:显示RPCSEC_GSS信息。
(5)-m:显示每个NFS文件系统的统计信息,该文件系统和服务器名称、地址、安装标志、当前读和写大小,以及重新传输计数
(6)-n:为客户机和服务器显示NFS信息。要只显示NFS客户机或服务器信息,将该参数与-c和-s参数结合。
(7)-r:显示RPC信息。
(8)-s:显示服务器信息。
(9)-t:显示与NFS标识映射子系统的转换请求相关的统计信息,要只显示NFS客户机或服务器信息,将-c和-s
选项结合。
(10)-4:当与-c、-n、-s或-z参数组合使用时,将包含NFS V4客户机或服务器的信息,以及现有的NFS V2和V3数据
。
(11)-z:重新初始化统计信息。该参数仅供root用户使用,并且在显示上面的标志后可以和那些标志中的任何一个组合到
统计信息的零特殊集合。
要显示关于客户机发送和拒绝的RPC和NFS调用数目的信息,输入:
nfsstat -c
要显示和打印与客户机NFS调用相关的信息,输入如下命令:
nfsstat -cn
要显示和打印客户机和服务器的与RPC调用相关的信息,输入如下命令:
nfsstat -r
要显示关于服务器接收和拒绝的RPC和NFS调用数目的信息,输入如下命令:
1.4 NFS典型故障排除步骤
1.个别客户端无法从一个或多个服务器导入
(1)在客户端中检查下列内容。
验证在客户端中是否有该本地目录,如果不存在,使用mkdir创建。例如,如下命令:
# mkdir /opt/adobe
检查局域网电缆是否没有损坏并已连接上,所有的连接是否有效。
/etc/hosts是否存在并且有”相关信息”。
/etc/fstab是否存在并且有”相关信息”,同时所有条目是否仍然指向服务器中的有效目录。
/etc/resolv.conf是否存在并且有”相关信息”(仅适于DNS)。
(2)在服务器中检查下列内容。
客户端尝试挂接的目录是否已存在并在配置文件中列出。
客户端是否具有挂接文件系统的权限。
相关信息说明如下。
/etc/hosts、/etc/fstab和/etc/resolv.conf中必须包含下列条目:
- /etc/hosts:系统主机名和IP地址,例如:
12.0.14.123 fredsys fredsys.mysite.myco.com
类似以下的条目:
127.0.0.1 localhost loopback #[no SMTP]
- /etc/fstab:对于标准挂接,每个导入的文件系统对应一个条目。
- /etc/resolv.conf(仅域名服务[DNS]需要使用):系统所在域的名称,例如:
domain mysite.myco.com
至少一个名称服务器,例如:
nameserver 12.0.14.165
2.所有客户端都无法从指定的服务器导入
在服务器上执行下列步骤。
(1)确保服务器已启动且正在运行,并且服务器和客户端之间的局域网连接有效(是否可以从服务器ping通连接客户端,并且反之也可)。
(2)确保客户端要挂接的文件系统已在/etc/fstab中列出。
(3)重新启动NFS服务器。
如果这些补救方法都失败,而配置也正确(执行了上述所有测试),则服务器可能没有正确引导,应重新引导服务器。
3.其他NFS常见故障排除
(1)当mount NFS文件系统时,如果错误信息是”Permission denied”,则表示NFS服务器不允许客户机挂接。一般可以用更改服务端上的/etc/exports文件来解决问题,使用exportfs-rv命令重新导出文件系统。
(2)如果出现的错误是”Program not registed”,则是NFS服务可能没有启动或者运行不正常,最常用的解决方法是重新启动NFS服务。
(3)如果出现”RPC:Unable to receive”,则可能是服务端没有启动portmap服务;如果已经启动,则可能是被防火墙所屏蔽。
(4)挂载文件系统的时候,客户端没有任何反应,则可能为客户端没有启动portmap服务。
(5)在NFS服务器中共享目录输出失败。
如果使用图形化窗口对共享目录进行配置,设置后必须测试共享目录的输出,以验证配置是否正确,通常图形化窗口不会报告配置错误。
使用”exportfs -v -a”命令检查/etc/exports文件中设置的共享目录是否能够正常输出,其中选项”-v”表示以冗余模式显示,即显示每一步的细节。
(6)显示”设备正忙”无法卸载。
在使用umount命令卸载远程NFS共享目录时,出现”设备正忙”等卸载失败消息。通常可能的原因是有一个进程仍然在使用这个目录,可以使用lsof命令来查看是否有进程正在使用该共享目录。
(7)挂载失败。
如果在挂载NFS共享目录时,客户端提示”RPC(Remote Procedure Call)failed”,即远程过程调用失败消息,则很可能是因为服务器上带有约束性质的防火墙错误地阻止了NFS客户端挂载NFS共享,即防火墙封锁了NFS或者RPC端口。为了解决这个问题,可以使用iptable命令打开服务器上的111(RPC)和2049(NFS)端口,允许NFS客户端访问服务器。
(8)NFS请求挂起。
如果客户端正在执行写操作,而服务器无法响应或者在网络上变得不可访问,那么在默认情况下(使用hard选项进行挂载)客户端进程将挂起直到写操作完成。如果不中止写操作,进程就不能从请求中退出。为了避免NFS请求挂起,在网络状况不稳定情况下可以在挂载目录时指定soft选项以允许操作因超时而退出,或者指定intr选项以允许用户在命令行上通过按下Ctrl+C组合键退出挂起的操作。
(9)NFS挂载在引导时挂起。
如果在/etc/fstab文件中设置了自动挂载NFS,但在系统引导时NFS共享目录暂时不可用,那么默认情况下引导进程将进入等待状态,直到NFS目录变得可用为止。如果所需等待的NFS目录是系统必须的,那么这种等待可能还可以接受。然而在很多情况下,用户只想让系统把挂载请求放在后台并继续引导系统。可以把bg选项添加到/etc/fstab文件中,这样在首次挂载请求超时之后,挂载请求会转入后台,系统继续引导。当需要在前台挂载NFS共享目录时可以将fg选项添加到/etc/fstab文件的挂载选项中。