Linux中使用日志来排错登录失败的原因及计算方法

T为时间戳的必需元素，它将日期和时间分隔开。

22:14:15.003是24小时制的时间，包括步入下1秒的微秒数(003)。

Z是一个可选元素，指的是UTC时间linux解压rar，不仅Z，这个事例还可以包括一个偏斜量，比如-08:00，这意味着时间从UTC偏斜8小时，即PST时间。

主机名

主机名数组(在前面的事例中对应)指的是主机的名称或发送信息的系统.

应用名

应用名数组(在前面的事例中对应sshd:auth)指的是发送信息的程序的名称.

优先级

优先级数组或简写为pri(在前面的事例中对应)告诉我们这个风波有多紧急或多严峻。它由两个数字数组组成：设备数组和紧急性数组。紧急性数组从代表debug类风波的数字7仍然到代表紧急风波的数字0。设备数组描述了那个进程创建了该风波。它从代表内核信息的数字0到代表本地应用使用的23。

Pri有两种输出形式。第一种是以一个单独的数字表示，可以这样估算：先用设备数组的值减去8，再加上紧急性数组的值：(设备数组)(8)+(紧急性数组)。第二种是pri文本错误系统日志 linux，将以“设备数组.紧急性数组”的字符串格式输出。后一种格式更便捷阅读和搜索，但抢占更多的储存空间。

在Linux中使用日志来排错

登陆失败缘由

假如你想检测你的系统是否安全linux软件，你可以在验证日志中检测登陆失败的和登陆成功但可疑的用户。当有人通过不正当或无效的凭据来登陆时会出现认证失败，这一般发生在使用SSH进行远程登陆或su到本地其他用户来进行访问权时。那些是由插入式验证模块（PAM）来记录的。在你的日志中会听到像Failedpassword和userunknown这样的字符串。而成功认证记录则会包括像Acceptedpassword和sessionopened这样的字符串。

失败的事例:

代码如下:

pam_unix(sshd:auth): authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=10.0.2.2
Failed password for invalid user hoover from 10.0.2.2 port 4791 ssh2
pam_unix(sshd:auth): check pass; user unknown
PAM service(sshd) ignoring max retries; 6 > 3

成功的事例：

代码如下:

Accepted password for hoover from 10.0.2.2 port 4792 ssh2
pam_unix(sshd:session): session opened for user hoover by (uid=0)
pam_unix(sshd:session): session closed for user hoover

你可以使用grep来查找什么用户失败登陆的次数最多。那些都是潜在的功击者正在尝试和访问失败的帐户。这是一个在ubuntu系统上的反例。

代码如下:

$ grep "invalid user" /var/log/auth.log | cut -d ' ' -f 10 | sort | uniq -c | sort -nr
23 oracle
18 postgres
17 nagios
10 zabbix
6 test

因为没有标准格式，所以你须要为每位应用程序的日志使用不同的命令。日志管理系统，可以手动剖析日志，将它们有效的归类，帮助你提取关键字，如用户名。

日志管理系统可以使用手动解析功能从Linux日志中提取用户名。这使你可以看见用户的信息，并能通过点击过滤。在下边这个事例中，我们可以见到，root用户登入了2700次之多，由于我们筛选的日志仅显示root用户的尝试登陆记录。

错误系统日志 linux_linux系统异常关机日志_linux系统报错日志

日志管理系统也可以让你以时间为做座标轴的图表来查看，使你更容易发觉异常。假如有人在几分钟内登陆失败一次或两次，它可能是一个真正的用户而忘掉了密码。并且，假如有几百个失败的登陆而且使用的都是不同的用户名，它更可能是在企图功击系统。在这儿，你可以听到在3月12日，有人企图登陆Nagios几百次。这似乎不是一个合法的系统用户。

linux系统异常关机日志_linux系统报错日志_错误系统日志 linux

重启的诱因

有时侯，一台服务器因为系统崩溃或重启而宕机。你如何晓得它何时发生，是谁做的？

死机命令

linux系统报错日志_linux系统异常关机日志_错误系统日志 linux

假如有人自动运行shutdown命令，你可以在验证日志文件中看见它。在这儿，你可以听到，有人从IP50.0.134.125上作为ubuntu的用户远程登陆了，之后关掉了系统。

代码如下:

Mar 19 18:36:41 ip-172-31-11-231 sshd[23437]: Accepted publickey for ubuntu from 50.0.134.125 port 52538 ssh
Mar 19 18:36:41 ip-172-31-11-231 23437]:sshd[ pam_unix(sshd:session): session opened for user ubuntu by (uid=0)
Mar 19 18:37:09 ip-172-31-11-231 sudo: ubuntu : TTY=pts/1 ; PWD=/home/ubuntu ; USER=root ; COMMAND=/sbin/shutdown -r now

内核初始化

假如你想瞧瞧服务器重新启动的所有缘由（包括崩溃），你可以从内核初始化日志中找寻。你须要搜索内核类（kernel）和cpu初始化（Initializing）的信息。

代码如下:

Mar 19 18:39:30 ip-172-31-11-231 kernel: [ 0.000000] Initializing cgroup subsys cpuset
Mar 19 18:39:30 ip-172-31-11-231 kernel: [ 0.000000] Initializing cgroup subsys cpu
Mar 19 18:39:30 ip-172-31-11-231 kernel: [ 0.000000] Linux version 3.8.0-44-generic (buildd@tipua) (gcc version 4.6.3 (Ubuntu/Linaro 4.6.3-1ubuntu5) ) #66~precise1-Ubuntu SMP Tue Jul 15 04:01:04 UTC 2014 (Ubuntu 3.8.0-44.66~precise1-generic 3.8.13.25)

检查显存问题

有好多缘由可能造成服务器崩溃，但一个常见的诱因是显存耗尽。

当你系统的显存不足时，进程会被杀害，一般会杀害使用最多资源的进程。当系统使用了所有显存，而新的或现有的进程企图使用更多的显存时才会出现错误。在你的日志文件查找像OutofMemory这样的字符串或类似kill这样的内核警告信息。这种信息表明系统故意杀害进程或应用程序，而不是容许进程崩溃。

比如:

代码如下:

[33238.178288] Out of memory: Kill process 6230 (firefox) score 53 or sacrifice child
[29923450.995084] select 5230 (docker), adj 0, size 708, to kill

你可以使用像grep这样的工具找到这种日志。这个反例是在ubuntu中:

代码如下:

$ grep “Out of memory” /var/log/syslog
[33238.178288] Out of memory: Kill process 6230 (firefox) score 53 or sacrifice child

请记住，grep也要使用显存错误系统日志 linux，所以只是运行grep也可能造成显存不足的错误。这是另一个你应当中央化储存日志的缘由！

定时任务错误日志

cron守护程序是一个调度器，可以在指定的日期和时间运行进程。假如进程运行失败或难以完成，这么cron的错误出现在你的日志文件中。具体取决于你的发行版，你可以在/var/log/cron，/var/log/messages，和/var/log/syslog几个位置找到这个日志。cron任务失败缘由有好多。一般情况下，问题出在进程中而不是cron守护进程本身。

默认情况下，cron任务的输出会通过postfix发送电子电邮。这是一个显示了该短信早已发送的日志。不幸的是，你不能在这儿听到电邮的内容。

代码如下:

Mar 13 16:35:01 PSQ110 postfix/pickup[15158]: C3EDC5800B4: uid=1001 from=
Mar 13 16:35:01 PSQ110 postfix/cleanup[15727]: C3EDC5800B4: message-id=<20150310110501.C3EDC5800B4@PSQ110>
Mar 13 16:35:01 PSQ110 postfix/qmgr[15159]: C3EDC5800B4: from=, size=607, nrcpt=1 (queue active)
Mar 13 16:35:05 PSQ110 postfix/smtp[15729]: C3EDC5800B4: to=, relay=gmail-smtp-in.l.google.com[74.125.130.26]:25, delay=4.1, delays=0.26/0/2.2/1.7, dsn=2.0.0, status=sent (250 2.0.0 OK 1425985505 f16si501651pdj.5 - gsmtp)

你可以考虑将cron的标准输出记录到日志中，以帮助你定位问题。这是一个你怎么使用logger命令重定向cron标准输出到syslog的反例。用你的脚本来取代echo命令，helloCron可以设置为任何你想要的应用程序的名子。

*/5****echo‘HelloWorld’2>&1|/usr/bin/logger-thelloCron

它创建的日志条目：

代码如下:

Apr 28 22:20:01 ip-172-31-11-231 CRON[15296]: (ubuntu) CMD (echo 'Hello World!' 2>&1 | /usr/bin/logger -t helloCron)
Apr 28 22:20:01 ip-172-31-11-231 helloCron: Hello World!

每位cron任务将按照任务的具体类型以及怎样输出数据来记录不同的日志。

希望在日志中有问题症结的线索，也可以按照须要添加额外的日志记录。

原文链接：

本作品采用知识共享署名 4.0 国际许可协议进行许可