1.Linux系统的平均负载的概念

有时候我们会觉得系统响应很慢,但是又找不到原因,这时就要查看平均负载了,看它是否有大量的进程在排队等待。特定时间间隔内运行队列中的平均进程数可以反映系统的繁忙程度,所以我们通常会在自己的网站或系统变慢时第一时间查系统的负载,即CPU的平均负载。

2.查看平均负载

究竟应该如何查看平均负载呢?最简单的命令是uptime,如下所示:

 
  1. [root@localhost ~]# uptime  
  2.  11:31:11 up 11 days, 19:01, 2 users, load average: 0.02, 0.01, 0.00 

目前的主流服务器都是双四核,有相当强悍的CPU,做一般的应用服务的话,Linux系统的负载这块倒不用我们担心。

还可以用w命令来查看,顺便可以查看一下系统当前有哪些用户,他们占用了哪些终端,如下所示:

 
  1. [root@localhost ~]# w  
  2.  11:33:00 up 11 days, 19:03, 2 users, load average: 0.00, 0.00, 0.00  
  3. USER TTY FROM LOGIN@  IDLE  JCPU  PCPU WHAT  
  4. root pts/1113.57.224.3 09:032:11m 0.04s 0.04s -bash  
  5. root pts/2113.57.224.3 11:310.00s 0.02s 0.00s w 

 

另外,还有动态命令top,这个命令也可以反映系统负载情况。在下面的命令提示中,我们只关心加粗字体部分。

 
  1. [root@localhost ~]# top  
  2. top - 11:37:47 up 11 days, 19:08, 2 users, load average: 0.00, 0.00, 0.00  
  3. Tasks: 122 total,  1 running, 121 sleeping,  0 stopped,  0 zombie  
  4. Cpu(s): 0.1%us, 0.0%sy, 0.0%ni, 99.9%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st  
  5. Mem:  4044136k total, 1435504k used, 2608632k free,  274740k buffers  
  6. Swap: 8193140k total,0k used, 8193140k free,  941884k cached 

 

上面加粗字体显示的内容是什么意思呢?再通过uptime查看一下。

 
  1. [root@localhost ~]# uptime  
  2.  11:39:36 up 11 days, 19:16, 1 user, load average: 0.09, 0.03, 0.01 

原来它所表示的是过去的1分钟、5分钟和15分钟内进程队列中的平均进程数量。

那么,如何衡量当前系统是否负载过高呢?可以从以下几点来考虑。

如果每个CPU(可以按CPU核心的数量计算)当前的活动进程数不大于3,则系统性能良好。

如果每个CPU当前的活动进程数不大于4,表示可以接受。

如果每个CPU当前的活动进程数大于5,则系统性能问题严重。

还可以结合vmstat命令来判断我们的系统是否过于繁忙,如果确定很繁忙的话,就要考虑是否更换服务器或增加CPU的个数了。总结如下:

如果r经常大于3或4,且id经常少于50,则表示CPU的负荷很重。