Linux数据中心服务器一般很少被黑。但也有出故障的时候,没有十全十美的,当服务器连接到网络时,你永远不知道什么时候会出现问题,会出现什么样问题。当不可避免出现了错误的时,您应该知道如何解决问题,以及所需的所有工具。

对于大多数服务(Apache,MySQL等),有单独的日志可以将您键入连接,身份验证,安全性和许多其他问题。但是,当您需要研究的系统是服务器平台本身时会发生什么?当存在硬件问题时,您检查哪个日志文件?

我想到的第一个是一个特殊命令,它提供了有关在引导期间加载的各种设备驱动程序的大量信息。通过此命令显示的信息可以帮助您了解Linux系统正在发生的事情。命令就是dmesg。我一直在使用此工具对Linux服务器和台式机进行故障排除。下面让我们看看它是如何工作的。

一、说明:dmesg是每个Linux发行版上的命令之一,您只需打开一个终端窗口并开始使用该工具。

二、用法:如果直接使用dmesg命令,出来的信息量太大,这里有一个方法减少dmesg的输出,命令如下所示:

dmesg | less

以这种方式运行dmesg命令得到如下图:

然而,即使使用dmesg这种命令效果也不佳,仍有大量的信息可供筛选。dmesg有一些选项可以让你缩减这些信息。您可以将输出限制为仅错误和警告,这样您就不必筛选系统中正常运行的所有内容。如何做?使用-level标签。可以查看八个不同的级别,每个级别可以组合以进行dmesg输出的特定迭代。以下是八级别:

emerg - 系统无法使用

alert - 必须立即采取行动

crit - 危急的条件

err - 错误条件

warn - 警告条件

notice - 正常但重要的条件

info - 信息

debug - 调试级消息

假设您只想查看警报和严重警告。对此的命令是:

dmesg --level=alert,crit

希望在运行上述命令后,您将看不到输出。如果你什么也看不见,而且你知道存在问题,那么将等级降低到一定程度,比如错误和警告:

dmesg --level=err,warn

现在我们来看看有用的信息(如下图)。

故障时间戳

如果您想准确了解错误或警告发生的时间,该怎么办?您可以添加-T选项,如下所示:

dmesg --level=err,warn -T

现在我们有一个与每个条目相关的时间戳(如下图)。

如果您发现信息仍然太多,请将上述命令传递给less。如果您没有时间马上分析完成,可以将其导出,如下所示:

dmesg --level = err,warn -T> dmesg_output

dmesg命令在数据中心管理工具包中使用方便。借助这款易于使用的工具,您可以开始大规模地对服务器进行故障排除,然后开始缩小搜索范围。

文章转载于:https://www.idcjia.net/m3071.html

Logo

更多推荐