进程管理命令

工作场景：

小黑入职到一家公司，接到的第一项任务，就是监控生产服务器的性能，提到服务器性能，我们首先想到的就是 CPU，内存和磁盘。

1、top 查看 CPU 使用情况

命令：top

作用：查看服务器的进程占用的资源（100%使用）

语法：# top （动态显示）

交换操作快捷键：

M（大写）：表示将结果按照内存（MEM）从高到低进行降序排列；

P（大写）：，表示将结果按照 CPU 使用率从高到低进行降序排列；

1 ：当服务器拥有多个 cpu 的时候可以使用“1”快捷键来切换是否展示显示各个 cpu 的详细信息；

q：退出

用法一：top
示例代码：
#top
含义：查看CPU使用情况

1）系统整体信息：

内容	说明
10:12:28	系统当前时间
up 13:05	系统的运行时间.本机己经运行 13 小时 05 分钟
3 users	当前登录了三个用户
load average: 0.00,0.01，0.05	系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的，则这个数值超过 1 就是高负载：如果 CPU 是四核的，则这个数值超过 4 就是高负载

扩展：如何获取 CPU 的总核心数？
grep 'core id' /proc/cpuinfo |sort -u |wc -l

Tasks: 230 total	系统中的进程总数
1 running	正在运行的进程数
229 sleeping	睡眠的进程数
0 stopped	正在停止的进程数
0 zombie	僵尸进程数。如果不是 0，则需要手工检查僵尸进程

内容	说明
Cpu(s): 0.1 %us	用户模式占用的 CPU 百分比
0.1%sy	系统模式占用的 CPU 百分比
0.0%ni	改变过优先级的用户进程占用的 CPU 百分比
99.7%id	idle 缩写，空闲 CPU 占用的 CPU 百分比
0.1%wa	等待输入/输出的进程占用的 CPU 百分比
0.0%hi	硬中断请求服务占用的 CPU 百分比
0.1%si	软中断请求服务占用的 CPU 百分比
0.0%st	st（steal time）意为虚拟时间百分比，就是当有虚拟机时，虚拟 CPU 等待实际 CPU 的时间百分比

问题：如果我的机器有 4 核 CPU，我想查看每一核心分别的负载情况怎能办？

答：交换快捷键 “1”

内容	说明
Mem: 1863252 total	物理内存的总量，单位为 KB
829960 used	己经使用的物理内存数量
68352 free	空闲的物理内存数量。我们使用的是虚拟机，共分配了 628MB 内存，所以只有 53MB 的空闲内存
96490 buff/cache	作为缓冲的内存数量

内容	说明
Swap: 2097148 total	交换分区（虚拟内存）的总大小
3336 used	已经使用的交换分区的大小
2093812 free	空闲交换分区的大小
622420 avail Mem	可用内存

我们通过 top 命令的整体信息部分，就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于 CPU 核数，说明系统压力较大。如果物理内存的空闲内存过小，则也证明系统压力较大。

问题：根据以上信息，目前我们的系统压力如何？

问题：如果我们发现 CPU 负载过大，接下来怎么办？

2）进程信息：

PID	进程的 ID。
USER	该进程所属的用户。
PR	优先级，数值越小优先级越高。
NI	优先级，数值越小优先级越高。
VIRT	该进程使用的虚拟内存的大小，单位为 KB。
RES	该进程使用的物理内存的大小，单位为 KB。
SHR	共享内存大小，单位为 KB。计算一个进程实际使用的内存 = 常驻内存（RES）- 共享内存（SHR）
S	进程状态。其中 S 表示睡眠，R 表示运行
%CPU	该进程占用 CPU 的百分比。
%MEM	该进程占用内存的百分比。
TIME+	该进程共占用的 CPU 时间。
COMMAND	进程名

问题：如果我们发现 CPU 负载过大，接下来怎么办？

答：查看占用 CPU 最多的进程

问题：如何查看占用 CPU 最多的进程？

答：交互操作快捷键 P，P（大写）：，表示将结果按照 CPU 使用率从高到低进行降序排列

2、free 查看内存使用情况

命令：free

作用：查看内存使用情况

语法：#free -m

选项：-m 表示以 mb 为单位查看（1g = 1024mb，1mb = 1024kb）

用法一：free -m
示例代码：
#free -m
含义：查看内存使用情况

和 Centos6 相比，buffer 和 cached 被合成一组，加入了一个 available。

关于此 available，即系统可用内存，用户不需要去计算 buffer/cache，即可以看到还有多少内存可用，更加简单直观

第1行Mem数据：
total 内存总数: 1819
used 已经使用的内存数: 774
free 空闲的内存数: 152
shared 共享内存数: 77
buff/Cache块设备缓存区内存数: 892
available可用内存: 746

第2行数据是Swap交换分区，也就是我们通常所说的虚拟内存。可以在内存不够使用的情况下当临时内存来使用，交换分区并不是越大越好，一般话它就等同于实际内存的大小。

3、df 查看磁盘

命令：df

作用：查看磁盘的空间(disk free)

语法：# df [-h]

选项：-h 表示可读性较高的形式展示大小

这几列依次是：

Filesystem	磁盘名称
Size	总大小
Used	被使用的大小
Avail	剩余大小
Use%	使用百分比
Mounted on	挂载路径（相当于 Windows 的磁盘符）

4、ps 查看进程命令

命令：ps（process show 进程显示）

语法：ps [参数选项]

作用：主要是查看服务器的进程信息

选项含义：

-e：等价于“-A”，表示列出全部（all）的进程

-f : 表示 full，显示全部的列（显示全字段）

UID	该进程执行的用户 ID
PID	进程 ID
PPID	该进程的父级进程 ID，如果找不到，则该进程就被称之为僵尸进程（Parent Process ID）
C	Cpu 的占用率，其形式是百分数
STIME	进程的启动时间
TTY	终端设备，发起该进程的设备识别符号，如果显示“?”则表示该进程并不是由终端设备发起
TIME	进程实际使用 CPU 的时间
CMD	该进程的名称或者对应的路径

工作场景

小黑用学到的命令，发现某个进程占用 CPU 很高，希望进一步查看这个简称的信息。

ps -ef 会列出全部进程，但是我们发现进程非常多，我们很难找到自己想要看的进程。这里需要使用过滤命令 grep，来过滤掉我们不需要的信息。

用法：ps -ef |grep 想要看到的进程名
示例代码：
#ps -ef |grep crond
含义：查看crond进程的详细情况
注意：查询结果中，如果只有一条则表示没查到对应的进程（这1 条表示刚才ps 指令的自身）。只有查到的结果多余1 条，才表示有对应的进程。

补充：针对上述情况的优化：如果没有对应的进程，则什么都不显示。

思路：在现有的基础之上再次使用管道去处理下（-v 选项表示“排除”）。

扩展：ps aux BSD 格式命令，注意没有横杠"-"

Unix 有很多分支，目前主流的显示风格分为 System V 和 BSD，我们之前使用的 ps -ef 属于 system V 风格，ps aux 是 BSD 风格，大家可以理解为两种风格只是显示不同。

USER：该 process 属于哪个使用者账号 PID ：该 process 的 ID %CPU：该 process 使用掉的 CPU 资源百分比 %MEM：该 process 所占用的物理内存百分比 VSZ ：该 process 使用掉的虚拟内存量 (Kbytes) RSS ：该 process 占用的固定的内存量 (Kbytes) TTY ：该 process 是在那个终端机上面运作，若与终端机无关，则显示 ?，另外， tty1-tty6 是本机上面的登入者程序，若为 pts/0 等等的，则表示为由网络连接进主机的程序。 STAT：该程序目前的状态，主要的状态有 R ：该程序目前正在运作，或者是可被运作 S ：该程序目前正在睡眠当中 (可说是 idle 状态)，但可被某些讯号 (signal) 唤醒。 T ：该程序目前正在侦测或者是停止了 Z ：该程序应该已经终止，但是其父程序却无法正常的终止他，造成 zombie (疆尸) 程序的状态 START：该 process 被触发启动的时间 TIME ：该 process 实际使用 CPU 运作的时间 COMMAND：该程序的实际指令

5、netstat 查看进程网络访问

命令：netstat

作用：查看网络连接状态

语法：netstat -tnlp

选项：-t：表示只列出 tcp 协议的连接；

-n：表示将地址从字母组合转化成 ip 地址，将协议转化成端口号来显示；

-l ：表示过滤出"state（状态）"列中其值为 LISTEN（监听）的连接；

-p：表示显示发起连接的进程 pid 和进程名称；

Protocol：协议（tcp、upd、http、https、icmp、ssh…）
Receive：接收
Send：发送
Local Address:本地地址
Foreign：远程地址
State：状态，LISTEN表示侦听来自远方的TCP端口的连接请求
PID/Program name：进程ID和程序名

6、kill 关闭进程

命令：kill

语法：kill [信号] PID

作用：kill 命令会向操作系统内核发送一个信号（多是终止信号）和目标进程的 PID，然后系统内核根据收到的信号类型，对指定进程进行相应的操作

信号种类：

信号编号	含义
9	杀死进程，即强制结束进程。
15	正常结束进程，是 kill 命令的默认信号。

用法一：kill [信号编号] PID
示例代码：
#ps -ef |grep crond
查询crond进程信息，想知道它的PID，以便使用kill终止进程

#kill 6925
结束6925的进程，这里使用默认信号，正常结束，如果强制结束，就是kill -9 6925

#ps -ef |grep crond
查询crond进程信息,这次查询是为了确认crond进程是否被终止了，我们发现6925进程已经没有了

#systemctl start crond
使用前面学过的systemctl命令，重启crond服务

#ps -ef |grep crond
查询crond进程信息,这次查询是为了确认crond进程已经重新启动了，我们看到多了一个32934的进程，表明crond已经启动，并且进程ID变化了，这是一个新的进程

备注：在互联网中，经常看到 kill -9 进程 PID，强制杀死某个进程，kill -l

7、killall 关闭进程

命令：killall

作用：通过程序的==进程名==来杀死==一类==进程

语法：# killall [信号] 进程名称

信号种类：和 kill 相同，这里不再重复

用法一：killall [信号编号] 进程名
示例代码：
#ps -ef |grep crond
查询crond进程信息，想知道它的进程名，以便使用killall终止进程

#kill 6925
结束6925的进程，这里使用默认信号，正常结束，如果强制结束，就是kill -9 6925

1、top 查看 CPU 使用情况​

1）系统整体信息：​

问题：如果我的机器有 4 核 CPU，我想查看每一核心分别的负载情况怎能办？​

2）进程信息：​

问题：如果我们发现 CPU 负载过大，接下来怎么办？​

问题：如何查看占用 CPU 最多的进程？​

2、free 查看内存使用情况​

3、df 查看磁盘​

4、ps 查看进程命令​

5、netstat 查看进程网络访问​

6、kill 关闭进程​

7、killall 关闭进程​

1、top 查看 CPU 使用情况

1）系统整体信息：

问题：如果我的机器有 4 核 CPU，我想查看每一核心分别的负载情况怎能办？

2）进程信息：

问题：如果我们发现 CPU 负载过大，接下来怎么办？

问题：如何查看占用 CPU 最多的进程？

2、free 查看内存使用情况

3、df 查看磁盘

4、ps 查看进程命令

5、netstat 查看进程网络访问

6、kill 关闭进程

7、killall 关闭进程