如何在linux系统中使用vmstat命令?我相信很多没有经验的人对此无能为力。因此,本文总结了问题产生的原因及解决方法。希望你能通过这篇文章解决这个问题。
vmstat工具提供了一种低开销的系统性能观察方法。因为vmstat本身是一个低开销的工具,所以您需要在非常高负载的服务器,系统中检查和监控系统的运行状况,并且您仍然可以使用vmstat在控制窗口中输出结果。在学习vmstat命令之前,首先要了解Linux系统中关于物理内存和虚拟内存的信息。
物理内存和虚拟内存区别:
众所周知,直接从物理内存中读写数据比从硬盘中读写数据要快得多。所以我们希望所有的数据读写都在内存中进行,内存是有限的,这就产生了物理内存和虚拟内存的概念。
物理内存是系统硬件提供的内存大小,是实内存。相对于物理内存,linux下有一个虚拟内存的概念。虚拟内存是为解决物理内存不足而提出的一种策略。它是利用磁盘空间创建的逻辑内存,用作虚拟内存的磁盘空间称为SwapSpace。
作为物理内存的扩展,当物理内存不足时,linux会使用交换分区的虚拟内存。更具体地说,内核会将暂时未使用的内存块信息写入交换空间。因此,物理内存被释放,该内存可用于其他目的。当需要原始内容时,信息将从交换空间再次读入物理内存。
linux的内存管理采用分页访问机制。为了保证物理内存能够得到充分利用,内核会在适当的时候将物理内存中不常用的数据块自动交换到虚拟内存中,并将常用的信息保留在物理内存中。
要深入了解linux内存的运行机制,需要了解以下几个方面:
首先,Linux系统会时不时地交换页面,以尽可能多地保留空闲的物理内存。即使什么都不需要内存,Linux也会交换暂时不用的内存页面。这样可以避免等待交换时间。
其次,linux中的页面交换是有条件的。不使用时,并非所有页面都交换到虚拟内存。根据“最近最常使用”的算法,linux内核只将一些不常用的页面文件交换到虚拟内存中。有时我们会看到这样一个现象:在linux中仍然有很多物理内存,但是也使用了很多交换空间。其实这并不奇怪。比如一个占用大量内存的进程运行时,需要消耗大量的内存资源,而此时一些不常用的页面文件会被交换到虚拟内存中。但是当占用大量内存资源的进程结束,释放大量内存时,刚刚交换的页面文件不会自动交换到物理内存中。除非有这个必要,否则这时系统的物理内存会空闲很多,同时会用到交换空间,于是就出现了刚才提到的现象。这个不用担心,知道怎么回事就行了。
最后,交换空间中的页面在使用时会首先交换到物理内存中。如果此时没有足够的物理内存来容纳这些页面,它们将立即被换出。因此,虚拟内存中可能没有足够的空间来存储这些交换的页面,这最终会导致linux中的假崩溃和异常服务等问题。虽然linux可以自我恢复一段时间,但是恢复的系统基本上是不能用的。
因此,合理规划和设计linux内存的使用非常重要。
虚拟内存原理:
系统中运行的每个进程都需要使用内存,但并不是每个进程都需要一直使用系统分配的内存空间。当系统运行所需的内存超过实际物理内存时,内核会释放一些进程占用的部分或全部未使用的物理内存,并将这些数据存储在磁盘上,直到进程的下一次调用,并将释放的内存提供给需要的进程。
在Linux内存管理中,上述内存调度主要是通过“分页”和“交换交换”来完成的。页面调整算法是将内存中最近不常用的页面改为磁盘,将内存中的活动页面保留下来供进程使用。切换技术是把整个流程,而不是一些页面,切换到磁盘。
将页面写入磁盘的过程称为页面输出,将页面从磁盘返回内存的过程称为页面输入。当内核需要一个页面,但发现该页面不在物理内存中(因为它已经被页面调出),就会发生页面错误。
当系统内核发现可运行内存变少时,会通过Page-Out释放部分物理内存。虽然页面输出并不经常发生,但是如果页面输出经常发生,当内核管理页面的时间超过运行程序的时间时,系统性能会急剧下降。此时,系统运行非常缓慢或进入暂停状态,这也称为系统颠簸
1命令格式:
代码如下:
vmstat [-a] [-n] [-S单位] [延迟[计数]]
vmstat [-s] [-n] [-S单位]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p磁盘分区][-n][延迟[计数]]
vmstat [-f]
vmstat [-V]
2命令功能:
用于显示虚拟
拟内存的信息
3.命令参数:
-a:显示活跃和非活跃内存
-f:显示从系统启动至今的fork数量。
-m:显示slabinfo
-n:只在开始时显示一次各字段名称。
-s:显示内存相关统计信息及多种系统活动数量。
delay:刷新时间间隔。如果不指定,只显示一条结果。
count:刷新次数。如果不指定刷新次数,但指定了刷新时间间隔,这时刷新次数为无穷。
-d:显示磁盘相关统计信息。
-p:显示指定磁盘分区统计信息
-S:使用指定单位显示。参数有k、K、m、M,分别代表1000、1024、1000000、1048576字节(byte)。默认单位为K(1024bytes)
-V:显示vmstat版本信息。
4.使用实例:
实例1:显示虚拟内存使用情况
命令:vmstat
输出:
代码如下:
[root@localhost ~]# vmstat 5 6procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------r b swpd free buff cache si so bi bo in cs us sy id wa st0 0 0 3029876 199616 690980 0 0 0 2 3 2 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 41 1009 39 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 3 1004 36 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 4 1004 36 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 6 1003 33 0 0 100 0 0 0 0 0 3029752 199616 690980 0 0 0 5 1003 33 0 0 100 0 0
vmstat命令输出信息详细说明:
字段说明:
Procs(进程):
r:运行队列中进程数量
b:等待IO的进程数量
Memory(内存):
swpd:使用虚拟内存大小
free:可用内存大小
buff:用作缓冲的内存大小
cache:用作缓存的内存大小
Swap:
si:每秒从交换区写到内存的大小
so:每秒写入交换区的内存大小
IO:(现在的Linux版本块的大小为1024bytes)
bi:每秒读取的块数
bo:每秒写入的块数
系统:
in:每秒中断数,包括时钟中断。
cs:每秒上下文切换数。
CPU(以百分比表示):
us:用户进程执行时间(usertime)
sy:系统进程执行时间(systemtime)
id:空闲时间(包括IO等待时间),中央处理器的空闲时间。以百分比表示。
wa:等待IO时间
备注:如果r经常大于4,且id经常少于40,表示cpu的负荷很重。如果pi,po长期不等于0,表示内存不足。如果disk经常不等于0,且在b中的队列大于3,表示io性能不好。Linux在具有高稳定性、可靠性的同时,具有很好的可伸缩性和扩展性,能够针对不同的应用和硬件环境调整,优化出满足当前应用需要的最佳性能。因此企业在维护Linux系统、进行系统调优时,了解系统性能分析工具是至关重要的。
命令:vmstat55
表示在5秒时间内进行5次采样。将得到一个数据汇总他能够反映真正的系统情况。
实例2:显示活跃和非活跃内存
命令:vmstat-a25
输出:
代码如下:
[root@localhost ~]# vmstat -a 2 5procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------r b swpd free inact active si so bi bo in cs us sy id wa st0 0 0 3029752 387728 513008 0 0 0 2 3 2 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 0 1005 34 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 22 1004 36 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 0 1004 33 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 0 1003 32 0 0 100 0 0 [root@localhost ~]#
说明:
使用-a选项显示活跃和非活跃内存时,所显示的内容除增加inact和active外,其他显示内容与例子1相同。
字段说明:
Memory(内存):
inact:非活跃内存大小(当使用-a选项时显示)
active:活跃的内存大小(当使用-a选项时显示)
实例3:查看系统已经fork了多少次
命令:vmstat-f
输出:
代码如下:
[root@SCF1129 ~]# vmstat -f12744849 forks[root@SCF1129 ~]#
说明:
这个数据是从/proc/stat中的processes字段里取得的
实例4:查看内存使用的详细信息
命令:vmstat-s
输出:
代码如下:
[root@localhost ~]# vmstat -s4043760 total memory1013884 used memory513012 active memory387728 inactive memory3029876 free memory199616 buffer memory690980 swap cache6096656 total swap0 used swap6096656 free swap83587 non-nice user cpu ticks132 nice user cpu ticks278599 system cpu ticks913344692 idle cpu ticks814550 IO-wait cpu ticks10547 IRQ cpu ticks21261 softirq cpu ticks0 stolen cpu ticks310215 pages paged in14254652 pages paged out0 pages swapped in0 pages swapped out288374745 interrupts146680577 CPU context switches1351868832 boot time367291 forks
说明:
这些信息的分别来自于/proc/meminfo,/proc/stat和/proc/vmstat。
实例5:查看磁盘的读/写
命令:vmstat-d
输出:
代码如下:
[root@localhost ~]# vmstat -ddisk- ------------reads------------ ------------writes----------- -----IO------total merged sectors ms total merged sectors ms cur secram0 0 0 0 0 0 0 0 0 0 0ram1 0 0 0 0 0 0 0 0 0 0ram2 0 0 0 0 0 0 0 0 0 0ram3 0 0 0 0 0 0 0 0 0 0ram4 0 0 0 0 0 0 0 0 0 0ram5 0 0 0 0 0 0 0 0 0 0ram6 0 0 0 0 0 0 0 0 0 0ram7 0 0 0 0 0 0 0 0 0 0ram8 0 0 0 0 0 0 0 0 0 0ram9 0 0 0 0 0 0 0 0 0 0ram10 0 0 0 0 0 0 0 0 0 0ram11 0 0 0 0 0 0 0 0 0 0ram12 0 0 0 0 0 0 0 0 0 0ram13 0 0 0 0 0 0 0 0 0 0ram14 0 0 0 0 0 0 0 0 0 0ram15 0 0 0 0 0 0 0 0 0 0sda 33381 6455 615407 63224 2068111 1495416 28508288 15990289 0 10491hdc 0 0 0 0 0 0 0 0 0 0fd0 0 0 0 0 0 0 0 0 0 0md0 0 0 0 0 0 0 0 0 0 0[root@localhost ~]#
说明:
这些信息主要来自于/proc/diskstats.
merged:表示一次来自于合并的写/读请求,一般系统会把多个连接/邻近的读/写请求合并到一起来操作.
实例6:查看/dev/sda1磁盘的读/写
命令:vmstat-p/dev/sda1
输出:
代码如下:
[root@SCF1129 ~]# df文件系统 1K-块 已用 可用 已用% 挂载点/dev/sda3 1119336548 27642068 1034835500 3% /tmpfs 32978376 0 32978376 0% /dev/shm/dev/sda1 1032088 59604 920056 7% /boot[root@SCF1129 ~]# vmstat -p /dev/sda1sda1 reads read sectors writes requested writes18607 4249978 6 48[root@SCF1129 ~]# vmstat -p /dev/sda3sda3 reads read sectors writes requested writes429350 35176268 28998789 980301488[root@SCF1129 ~]#
说明:
这些信息主要来自于/proc/diskstats。
reads:来自于这个分区的读的次数。
readsectors:来自于这个分区的读扇区的次数。
writes:来自于这个分区的写的次数。
requestedwrites:来自于这个分区的写请求次数。
实例7:查看系统的slab信息
命令:vmstat-m
输出:
代码如下:
[root@localhost ~]# vmstat -mCache Num Total Size Pagesip_conntrack_expect 0 0 136 28ip_conntrack 3 13 304 13ip_fib_alias 11 59 64 59ip_fib_hash 11 59 64 59AF_VMCI 0 0 960 4bio_map_info 100 105 1064 7dm_mpath 0 0 1064 7jbd_4k 0 0 4096 1dm_uevent 0 0 2608 3dm_tio 0 0 24 144dm_io 0 0 48 77scsi_cmd_cache 10 10 384 10sgpool-128 32 32 4096 1sgpool-64 32 32 2048 2sgpool-32 32 32 1024 4sgpool-16 32 32 512 8sgpool-8 45 45 256 15scsi_io_context 0 0 112 34ext3_inode_cache 51080 51105 760 5ext3_xattr 36 88 88 44journal_handle 18 144 24 144journal_head 56 80 96 40revoke_table 4 202 16 202revoke_record 0 0 32 112uhci_urb_priv 0 0 56 67UNIX 13 33 704 11flow_cache 0 0 128 30msi_cache 33 59 64 59cfq_ioc_pool 14 90 128 30cfq_pool 12 90 216 18crq_pool 16 96 80 48deadline_drq 0 0 80 48as_arq 0 0 96 40mqueue_inode_cache 1 4 896 4isofs_inode_cache 0 0 608 6hugetlbfs_inode_cache 1 7 576 7Cache Num Total Size Pagesext2_inode_cache 0 0 720 5ext2_xattr 0 0 88 44dnotify_cache 0 0 40 92dquot 0 0 256 15eventpoll_pwq 3 53 72 53eventpoll_epi 3 20 192 20inotify_event_cache 0 0 40 92inotify_watch_cache 1 53 72 53kioctx 0 0 320 12kiocb 0 0 256 15fasync_cache 0 0 24 144shmem_inode_cache 254 290 768 5posix_timers_cache 0 0 128 30uid_cache 0 0 128 30ip_mrt_cache 0 0 128 30tcp_bind_bucket 3 112 32 112inet_peer_cache 0 0 128 30secpath_cache 0 0 64 59xfrm_dst_cache 0 0 384 10ip_dst_cache 5 10 384 10arp_cache 1 15 256 15RAW 3 5 768 5UDP 5 10 768 5tw_sock_TCP 0 0 192 20request_sock_TCP 0 0 128 30TCP 4 5 1600 5blkdev_ioc 14 118 64 59blkdev_queue 20 30 1576 5blkdev_requests 13 42 272 14biovec-256 7 7 4096 1biovec-128 7 8 2048 2biovec-64 7 8 1024 4biovec-16 7 15 256 15biovec-4 7 59 64 59biovec-1 23 202 16 202bio 270 270 128 30utrace_engine_cache 0 0 64 59Cache Num Total Size Pagesutrace_cache 0 0 64 59sock_inode_cache 33 48 640 6skbuff_fclone_cache 7 7 512 7skbuff_head_cache 319 390 256 15file_lock_cache 1 22 176 22Acpi-Operand 4136 4248 64 59Acpi-ParseExt 0 0 64 59Acpi-Parse 0 0 40 92Acpi-State 0 0 80 48Acpi-Namespace 2871 2912 32 112delayacct_cache 81 295 64 59taskstats_cache 4 53 72 53proc_inode_cache 1427 1440 592 6sigqueue 0 0 160 24radix_tree_node 13166 13188 536 7bdev_cache 23 24 832 4sysfs_dir_cache 5370 5412 88 44mnt_cache 26 30 256 15inode_cache 2009 2009 560 7dentry_cache 60952 61020 216 18filp 479 1305 256 15names_cache 3 3 4096 1avc_node 14 53 72 53selinux_inode_security 994 1200 80 48key_jar 2 20 192 20idr_layer_cache 74 77 528 7buffer_head 164045 164800 96 40mm_struct 51 56 896 4vm_area_struct 1142 1958 176 22fs_cache 35 177 64 59files_cache 36 55 768 5signal_cache 72 162 832 9sighand_cache 68 84 2112 3task_struct 76 80 1888 2anon_vma 458 864 24 144pid 83 295 64 59shared_policy_node 0 0 48 77Cache Num Total Size Pagesnuma_policy 37 144 24 144size-131072(DMA) 0 0 131072 1size-131072 0 0 131072 1size-65536(DMA) 0 0 65536 1size-65536 1 1 65536 1size-32768(DMA) 0 0 32768 1size-32768 2 2 32768 1size-16384(DMA) 0 0 16384 1size-16384 5 5 16384 1size-8192(DMA) 0 0 8192 1size-8192 7 7 8192 1size-4096(DMA) 0 0 4096 1size-4096 110 111 4096 1size-2048(DMA) 0 0 2048 2size-2048 602 602 2048 2size-1024(DMA) 0 0 1024 4size-1024 344 352 1024 4size-512(DMA) 0 0 512 8size-512 433 480 512 8size-256(DMA) 0 0 256 15size-256 1139 1155 256 15size-128(DMA) 0 0 128 30size-64(DMA) 0 0 64 59size-64 5639 5782 64 59size-32(DMA) 0 0 32 112size-128 801 930 128 30size-32 3005 3024 32 112kmem_cache 137 137 2688 1
这组信息来自于/proc/slabinfo。
slab:由于内核会有许多小对象,这些对象构造销毁十分频繁,比如i-node,dentry,这些对象如果每次构建的时候就向内存要一个页(4kb),而其实只有几个字节,这样就会非常浪费,为了解决这个问题,就引入了一种新的机制来处理在同一个页框中如何分配小存储区,而slab可以对小对象进行分配,这样就不用为每一个对象分配页框,从而节省了空间,内核对一些小对象创建析构很频繁,slab对这些小对象进行缓冲,可以重复利用,减少内存分配次数。
总结:
目前说来,对于服务器监控有用处的度量主要有:
r(运行队列)pi(页导入)us(用户CPU)sy(系统CPU)id(空闲)注意:如果r经常大于4 ,且id经常少于40,表示cpu的负荷很重。如果bi,bo 长期不等于0,表示内存不足。
通过VMSTAT识别CPU瓶颈:r(运行队列)展示了正在执行和等待CPU资源的任务个数。当这个值超过了CPU数目,就会出现CPU瓶颈了。
Linux下查看CPU核心数的命令:
cat /proc/cpuinfo|grep processor|wc -l
当r值超过了CPU个数,就会出现CPU瓶颈,解决办法大体几种:
1. 最简单的就是增加CPU个数和核数2. 通过调整任务执行时间,如大任务放到系统不繁忙的情况下进行执行,进尔平衡系统任务3. 调整已有任务的优先级
通过vmstat识别CPU满负荷:
首先需要声明一点的是,vmstat中CPU的度量是百分比的。当us+sy的值接近100的时候,表示CPU正在接近满负荷工作。但要注意的是,CPU 满负荷工作并不能说明什么,Linux总是试图要CPU尽可能的繁忙,使得任务的吞吐量最大化。唯一能够确定CPU瓶颈的还是r(运行队列)的值。
通过vmstat识别RAM瓶颈:
数据库服务器都只有有限的RAM,出现内存争用现象是Oracle的常见问题。
首先用free查看RAM的数量:
[oracle@oracle-db02~]$free totalusedfreesharedbufferscached Mem:2074924207111238120406161598656 -/+buffers/cache:4318401643084 Swap:30684041958042872600
当内存的需求大于RAM的数量,服务器启动了虚拟内存机制,通过虚拟内存,可以将RAM段移到SWAP DISK的特殊磁盘段上,这样会 出现虚拟内存的页导出和页导入现象,页导出并不能说明RAM瓶颈,虚拟内存系统经常会对内存段进行页导出,但页导入操作就表明了服务器需要更多的内存了, 页导入需要从SWAP DISK上将内存段复制回RAM,导致服务器速度变慢。
解决的办法有几种:
1. 最简单的,加大RAM;2. 改小SGA,使得对RAM需求减少;3. 减少RAM的需求。(如:减少PGA)
看完上述内容,你们掌握如何在linux系统中使用vmstat命令的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!