top命令

1、查看多核CPU命令

mpstat -P ALL 和 sar -P ALL 说明：sar -P ALL > aaa.txt 重定向输出内容到文件 aaa.txt

2、详解

top - 14:35:23 up 16 days,  5:29,  1 user,  load average: 0.11, 0.11, 0.09
Tasks: 168 total,   1 running, 167 sleeping,   0 stopped,   0 zombie
%Cpu(s):  2.7 us,  3.2 sy,  0.0 ni, 94.2 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  8175056 total,  4722520 free,   318240 used,  3134296 buff/cache
KiB Swap:  2095100 total,  2095100 free,        0 used.  7410892 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
 1318 avahi     20   0   45176   3952   3336 S   0.3  0.0  28:24.32 avahi-daemon
20127 root      20   0   44656   3828   3172 R   0.3  0.0   0:00.04 top
    1 root      20   0  119724   5744   3848 S   0.0  0.1   0:05.36 systemd

第一行： 10:08:45 — 当前系统时间 10 days, 3:05 — 系统已经运行了10天3小时5分钟（在这期间没有重启过） 1 users — 当前有1个用户登录系统 load average: 0.00, 0.00, 0.00 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。

load average数据是每隔5秒钟检查一次活跃的进程数，然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量，结果高于5的时候就表明系统在超负荷运转了。

第二行：
Tasks — 任务（进程），系统现在共有135个进程，其中处于运行中的有1个，134个在休眠（sleep），stoped状态的有0个，zombie状态（僵尸）的有0个。

第三行：cpu状态
0.3% us — 用户空间占用CPU的百分比。
0.0% sy — 内核空间占用CPU的百分比。
0.0% ni — 改变过优先级的进程占用CPU的百分比
99.7% id — 空闲CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.0% hi — 硬中断（Hardware IRQ）占用CPU的百分比
0.0% si — 软中断（Software Interrupts）占用CPU的百分比

在这里CPU的使用比率和windows概念不同，如果你不理解用户空间和内核空间，需要充充电了。

第四行：内存状态
3808060k total — 物理内存总量（4GB）
3660048k used — 使用中的内存总量（3.6GB）
148012k free — 空闲内存总量（148M）
359760k buffers — 缓存的内存量 （359M）

第五行：swap交换分区
4184924k total — 交换区总量（4G）
0k used — 使用的交换区总量（0M）
4184924k free — 空闲交换区总量（4G）
2483956k cached — 缓冲的交换区总量（2483M）

第四行中使用中的内存总量（used）指的是现在系统内核控制的内存数，空闲内存总量（free）是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中，还包括过去使用过的现在可以被重复利用的内存，内核并不把这些可被重新使用的内存交还到free中去，因此在linux上free内存会越来越少，但不用为此担心。

如果出于习惯去计算可用内存数，这里有个近似的计算公式：第四行的free + 第四行的buffers + 第五行的cached，按这个公式此台服务器的可用内存：148M+259M+2483M = 2990M。

对于内存监控，在top里我们要时刻监控第五行swap交换分区的used，如果这个数值在不断的变化，说明内核在不断进行内存和swap的数据交换，这是真正的内存不够用了。

第六行是空行

第七行以下：各进程（任务）的状态监控
PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级，正值表示低优先级
VIRT — 进程使用的虚拟内存总量，单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小，单位kb。RES=CODE+DATA
SHR — 共享内存大小，单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计，单位1/100秒
COMMAND — 进程名称（命令名/命令行）

在top基本视图中，按键盘数字“1”，可监控每个逻辑CPU的状况如果不按1，则在top视图里面显示的是所有cpu的平均值。

3、free命令详解

命令行直接free：（默认单位kb）

列1：total：物理内存的总大小列2：used：被使用的大小列3：free：可用内存空闲内存大小列4：shared：被多个进程共享的内存列5：buffer/cached:磁盘缓存的大小列6：available：还可以被进程使用的物理内存大小

同步数据到磁盘 sync

根据需求清除对于缓存 echo 3 > /proc/sys/vm/drop_caches

参数说明： 0 //默认是0； 1-清空页缓存； 2-清空inode和目录树缓存； 3-清空所有缓存

4、linux跑程序占用缓存过多释放内存echo 3 ＞ /proc/sys/vm/drop_caches

在跑pytorch时出现了占用内存过多的问题，当然这个问题可以通过调小num_workers解决，不过还有手动解决办法就是释放内存，命令如下：

echo 3 > /proc/sys/vm/drop_caches

而这样会显示权限不足，如果前面加上sudo命令也不行，因为这时候sudo 只是让 echo 命令具有了 root 权限，但是并没有让 “>” 命令也具有root 权限，所以 bash 会认为这个命令没有写入信息的权限。

解决办法：

sudo bash -c "echo 3 > /proc/sys/vm/drop_caches"

还是不行。

该处出现的问题具有特殊性，只有在docker环境下才可能出现。问题其实很简单，程序中有相应的代码在程序执行前想通过修改文件的方式释放缓存，但是在docker容器中，无法在容器内部对此文件/proc/sys/vm/drop_caches进行操作，因此出现了频繁要求sudo权限输入密码的情况（实际上并没有啥用），虽然其实并不会影响我们程序的执行，但这大大的阻碍了程序的自动化，解决这个问题其实只需要注释掉释放内存的代码即可，由人工在容器外部手动释放。

top命令

top命令

1、查看多核CPU命令

2、详解

3、free命令详解

4、linux跑程序占用缓存过多释放内存echo 3 ＞ /proc/sys/vm/drop_caches

results matching ""

No results matching ""