作为一个系统管理员/SRE 工作 5 年后,我知道当我连接到一台 Linux 服务器时我首先应该做什么。这里有一系列关于服务器你必须了解的信息,以便你可以(在大部分时间里)更好的调试该服务器。
连上 Linux 服务器的第一分钟
这些命令对于有经验的软件工程师来说都非常熟悉,但我意识到对于一个刚开始接触 Linux 系统的初学者来说,例如我在 Holberton 学校任教的学生,却并非如此。这也是我为什么决定分享当我连上 Linux 服务器首先要运行的前 5 个命令的原因。
1 2 3 4 5 6
w history top df netstat
这 5 个命令在任何一个 Linux 发行版中都有,因此不需要额外的安装步骤你就可以直接使用它们。
w:
1 2 3 4 5 6 7
[ubuntu@ip-172-31-48-251 ~]$ w 23:40:25 up 273 days, 20:52, 2 users, load average: 0.33, 0.14, 0.12 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT ubuntu pts/0 104-7-14-91.ligh 23:39 0.00s 0.02s 0.00s w root pts/1 104-7-14-91.ligh 23:40 5.00s 0.01s 0.03s sshd: root [priv] [ubuntu@ip-172-31-48-251 ~]$
这里列出了很多有用的信息。首先,你可以看到服务器运行时间 uptime,也就是服务器持续运行的时间。然后你可以看到有哪些用户连接到了服务器,当你要确认你没有影响你同事工作的时候这非常有用。最后 load average 能很好的向你展示服务器的健康状态。
history
1 2 3 4 5 6 7
[ubuntu@ip-172-31-48-251 ~]$ history 1 cd /var/app/current/log/ 2 ls -al 3 tail -n 3000 production.log 4 service apache2 status 5 cat ../../app/services/discourse_service.rb
history 能告诉你当前连接的用户之前运行了什么命令。你可以看到很多关于这台机器之前在执行什么类型的任务、可能出现了什么错误、可以从哪里开始调试工作等信息。