检查Linux服务器性能的命令有:1。uptime命令;2。dmesg|tail命令;3。vmstat1命令;4。mpstat-PALL1命令;5。pidstat1命令;6。iostat-xz1命令;7。free-h命令;8。sar-nDEV1命令;9。sar-nTCP,ETCP1命令;10。top命令。
具体内容如下:
1.uptime
这个命令可以快速查看机器的负载情况。在Linux系统中。这些数据表示等待CPU资源的进程和阻塞在不可中断IO进程(进程状态为D)的数量。这些数据可以让我们对系统资源使用有一个宏观的了解。
命令的输出分别表示1分钟。5分钟。15分钟的平均负载情况。通过这三个数据。可以了解服务器负载是在趋于紧张还是区域缓解。如果1分钟平均负载很高。而15分钟平均负载很低。说明服务器正在命令高负载情况。需要进一步排查CPU资源都消耗在了哪里。反之。如果15分钟平均负载很高。1分钟平均负载较低。则有可能是CPU资源紧张时刻已经过去。如果近1分钟的平均负载远高于15分钟的负载情况,那么我们需要用vmstat,mpstat命令进行排查。
2.dmesg|tail
dmesg这条命令用于查看开机信息
dmesg|tail该命令会输出系统日志的最后10行
3.vmstat1
每行会输出一些系统核心指标。这些指标可以让我们更详细的了解系统状态。后面跟的参数2。表示每两秒输出一次统计信息。表头提示了每一列的含义。这几介绍一些和性能调优相关的列:
r:等待在CPU资源的进程数。这个数据比平均负载更加能够体现CPU负载情况。数据中不包含等待IO的进程。如果这个数值大于机器CPU核数。那么机器的CPU资源已经饱和。
free:系统可用内存数(以千字节为单位)。如果剩余内存不足。也会导致系统性能问题。下文介绍到的free命令。可以更详细的了解系统内存的使用情况。
si,so:交换区写入和读取的数量。如果这个数据不为0。说明系统已经在使用交换区(swap)。机器物理内存已经不足。
us,sy,id,wa,st:这些都代表了CPU时间的消耗。它们分别表示用户时间(user)。系统(内核)时间(sys)。空闲时间(idle)。IO等待时间(wait)和被偷走的时间(stolen。一般被其他虚拟机消耗)。
上述这些CPU时间。可以让我们很快了解CPU是否出于繁忙状态。一般情况下。如果用户时间和系统时间相加非常大。CPU出于忙于执行指令。如果IO等待时间很长。那么系统的瓶颈可能在磁盘IO。
4.mpstat-PALL1
该命令可以显示每个CPU的占用情况。如果有一个CPU占用率特别高。那么有可能是一个单线程应用程序引起的。
5.pidstat1
pidstat命令输出进程的CPU占用率。该命令会持续输出。并且不会覆盖之前的数据。可以方便观察系统动态。
6.iostat-xz1
iostat命令主要用于查看机器磁盘IO情况。该命令输出的列。主要含义是:
r/s,w/s,rkB/s,wkB/s:分别表示每秒读写次数和每秒读写数据量(千字节)。读写量过大。可能会引起性能问题。
await:IO操作的平均等待时间。单位是毫秒。这是应用程序在和磁盘交互时。需要消耗的时间。包括IO等待和实际操作的耗时。如果这个数值过大。可能是硬件设备遇到了瓶颈或者出现故障。
avgqu-sz:向设备发出的请求平均数量。如果这个数值大于1。可能是硬件设备已经饱和(部分前端硬件设备支持并行写入)。
%util:设备利用率。这个数值表示设备的繁忙程度。经验值是如果超过60。可能会影响IO性能(可以参照IO操作平均等待时间)。如果到达100%。说明硬件设备已经饱和。
如果显示的是逻辑设备的数据。那么设备利用率不代表后端实际的硬件设备已经饱和。值得注意的是。即使IO性能不理想。也不一定意味这应用程序性能会不好。可以利用诸如预读取。写缓存等策略提升应用性能。
7.free-h
free命令可用于查看系统内存的使用情况,最后两列分别表示用于IO缓存的内存数。和用于文件系统页缓存的内存数。需要注意的是。第二行-/+buffers/cache。看上去缓存占用了大量内存空间。这是Linux系统的内存使用策略。尽可能的利用内存。如果应用程序需要内存。这部分内存会立即被回收并分配给应用程序。因此。这部分内存一般也被当成是可用内存。
如果可用内存非常少。系统可能会动用交换区(如果配置了的话)。这样会增加IO开销(可以在iostat命令中提现)。降低系统性能。
8.sar-nDEV1
sar命令在这里可以查看网络设备的吞吐率。在排查性能问题时。可以通过网络设备的吞吐量。判断网络设备是否已经饱和。如示例输出中。eth0网卡设备。吞吐率只有大概在0.39Mbytes/s.
9.sar-nTCP,ETCP1
sar命令在这里用于查看TCP连接状态。其中包括:
active/s:每秒本地发起的TCP连接数。既通过connect调用创建的TCP连接;
passive/s:每秒远程发起的TCP连接数。即通过accept调用创建的TCP连接;
retrans/s:每秒TCP重传数量;
TCP连接数可以用来判断性能问题是否由于建立了过多的连接。进一步可以判断是主动发起的连接。还是被动接受的连接。TCP重传可能是因为网络环境恶劣。或者服务器压力过大导致丢包。
10.top
第一行是任务队列信息。同uptime命令的执行结果一样:第一列表示当前时间。第二列表示系统运行了多久。第三列表示当前登陆人数。最后的loadaverage表示的是系统负载(三个值分别是:1分钟。5分钟。15分钟前到现在的负载平均值)
第二列表示的是进程的信息。很直观。
本文地址:https://gpu.xuandashi.com/50722.html,转载请说明来源于:渲大师
声明:本站部分内容来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场!