當(dāng)前位置: 首頁IT技術(shù)操作系統(tǒng) → 管理員必備的Linux系統(tǒng)監(jiān)控工具

管理員必備的Linux系統(tǒng)監(jiān)控工具

更多

  #1: top - 進(jìn)程活動(dòng)

  top提供一個(gè)當(dāng)前運(yùn)行系統(tǒng)實(shí)時(shí)動(dòng)態(tài)的視圖,

  也就是正在運(yùn)行進(jìn)程。在默認(rèn)情況下,顯示系統(tǒng)

  中CPU使用率最高的任務(wù),并每5秒鐘刷新一次。

  #2: vmstat -系統(tǒng)活動(dòng)、硬件及系統(tǒng)信息

  使用vmstat命令可以得到關(guān)于進(jìn)程、內(nèi)存、

  內(nèi)存分頁、堵塞IO、traps及CPU活動(dòng)的信息。

  #3: w - 顯示誰已登錄,他們正在做什么?

  w命令顯示系統(tǒng)當(dāng)前用戶及其運(yùn)行進(jìn)程的信息。

  #4:uptime - 告訴系統(tǒng)已經(jīng)運(yùn)行了多久?

  uptime命令過去只顯示系統(tǒng)運(yùn)行多久。現(xiàn)在,

  可以顯示系統(tǒng)運(yùn)行多久、當(dāng)前有多少的用戶登錄、

  在過去的1,5,15分鐘里平均負(fù)載時(shí)多少。

  #5:ps - 顯示進(jìn)程

  ps命令顯示當(dāng)前運(yùn)行進(jìn)程的快照。使用-A或-

  e 顯示所有進(jìn)程。ps 與 top 非常相似,但ps 提

  供更多的信息。

  #6: free - 內(nèi)存使用情況

  free命令顯示系統(tǒng)中空閑的、已用的物理內(nèi)存

  及swap內(nèi)存,及被內(nèi)核使用的buffer。

  #7: iostat - CPU平均負(fù)載,硬盤活動(dòng)

  iostat命令可報(bào)告中央處理器(CPU)的統(tǒng)計(jì)

  信息,各種設(shè)備、分區(qū)及網(wǎng)絡(luò)文件系統(tǒng)輸入/輸出

  的統(tǒng)計(jì)信息。

  #8: sar - 搜集和報(bào)告系統(tǒng)活動(dòng)

  sar命令用來搜集、報(bào)告和儲(chǔ)存系統(tǒng)活動(dòng)信息。

  #9:mpstat - 多處理器使用率

  mpstat命令可以顯示所有可用處理器的使用

  情況,處理器編號(hào)從 0開始。mpstat -P ALL 顯

  示每個(gè)處理器的平均使用率。

  #10: pmap - 進(jìn)程的內(nèi)存使用

  pmap命令可以顯示進(jìn)程的內(nèi)存映射,使用這

  個(gè)命令可以找出造成內(nèi)存瓶頸的原因。

  #11:netstat - 網(wǎng)絡(luò)相關(guān)信息

  netstat 可以顯示網(wǎng)絡(luò)鏈接、路由表信息、接

  口統(tǒng)計(jì)信息、偽裝鏈接和多播成員(multicast

  memberships)

  #12:ss - 網(wǎng)絡(luò)相關(guān)信息

  ss命令用來顯示網(wǎng)絡(luò)套接字信息,它允許顯示

  類似netstat一樣的信息。

  #13: iptraf - 網(wǎng)絡(luò)實(shí)時(shí)信息

  iptraf是一個(gè)可交互式的IP網(wǎng)絡(luò)監(jiān)控工具。它

  可以生成多種網(wǎng)絡(luò)統(tǒng)計(jì)信息包括:TCP 信息、

  UDP數(shù)量、ICMP和OSPF信息、以太網(wǎng)負(fù)載信

  息、節(jié)點(diǎn)狀態(tài)、IP校驗(yàn)錯(cuò)誤等。

  #14:tcpdump:詳細(xì)的網(wǎng)絡(luò)流量分析

  tcpdump 是一個(gè)簡單網(wǎng)絡(luò)流量轉(zhuǎn)儲(chǔ)工具,然

  而要使用好需要對(duì)TCP/IP協(xié)議非常熟悉。

  #15:strace - 系統(tǒng)調(diào)用

  追蹤系統(tǒng)調(diào)用和型號(hào),這對(duì)于調(diào)試 Web服務(wù)

  器和其他服務(wù)器非常有用。了解怎樣追蹤進(jìn)程和

  他功能。

  #16:/proc文件系統(tǒng) - 各種內(nèi)核信息

  /proc目錄下文件提供了很多不同硬件設(shè)備和

  內(nèi)核的詳細(xì)信息。

  #17:Nagios - 服務(wù)器及網(wǎng)絡(luò)監(jiān)控

  Nagios 是一款非常流行的系統(tǒng)及網(wǎng)絡(luò)監(jiān)控軟

  件。你可以輕松監(jiān)控所有的主機(jī)、網(wǎng)絡(luò)設(shè)備及服

  務(wù)。它能在發(fā)生故障和重新恢復(fù)后發(fā)送警訊。

  #18:Cacti - 基于Web的監(jiān)控工具

  Cacti是一套完成的網(wǎng)絡(luò)圖形化解決方案,基

  于RRDTool的資料存儲(chǔ)和圖形化功能。Cacti提

  供一個(gè)快速的輪詢器、進(jìn)階的圖形化模板、多種

  數(shù)據(jù)采集方法和用戶管理功能。這些功能都擁有

  非常友好易用的界面,確?梢圆渴鹪谝粋(gè)包含

  數(shù)百臺(tái)設(shè)備的復(fù)雜網(wǎng)絡(luò)中。它提供關(guān)于網(wǎng)絡(luò)

  CPU、內(nèi)存、已登錄用戶、Apache、DNS等信

  息。

  #19:KDE System Guard

  KSysguard 是在 KDE 桌面下一個(gè)網(wǎng)絡(luò)化的系

  統(tǒng)監(jiān)控工具。這個(gè)工具可以通過SSH會(huì)話運(yùn)行。

  它提供很多功能,例如可以監(jiān)控本機(jī)和遠(yuǎn)程主機(jī)

  的客戶端/服務(wù)器架構(gòu),前端圖形界面使用所謂傳

  感器得到信息并展現(xiàn)出來。傳感器返回的可以是

  一個(gè)簡單的數(shù)值或是一組表格的信息。針對(duì)不同

  的信息類型,提供一個(gè)或多個(gè)顯示。這些顯示被

  組織多個(gè)工作表中,可以工作表可以獨(dú)體儲(chǔ)存和

  加載。所以,KSysguard不只是一個(gè)簡單的任務(wù)

  管理器,還是一個(gè)可以控制多臺(tái)服務(wù)器的強(qiáng)大工

  具。

  #20:Gnome System Monitor

  System Monitor可以顯示系統(tǒng)基本信息、監(jiān)

  控系統(tǒng)進(jìn)程、系統(tǒng)資源及文件系統(tǒng)使用率。你也

  可以使用System Monitor監(jiān)控和修改系統(tǒng)行為。

  盡管沒有KDE System Guard功能強(qiáng)大,但其提

  供的基本信息對(duì)于入門用戶還是非常有用的。

  Linux常用監(jiān)控命令簡介 - top

  指令介紹

  -b : 批次模式運(yùn)行。

  -c : 顯示執(zhí)行任務(wù)的命令行。

  -d : 設(shè)定延遲時(shí)間

  -h : 幫助

  -H : 顯示線程。將顯示所有進(jìn)程產(chǎn)生的線程。

  -i : 顯示空閑的進(jìn)程。

  -n : 執(zhí)行次數(shù)。一般與-b搭配使用

  -u : 監(jiān)控指定用戶相關(guān)進(jìn)程

  -U : 監(jiān)控指定用戶相關(guān)進(jìn)程

  -p : 監(jiān)控指定的進(jìn)程。

  -s : 安全模式操作

  -S : 累計(jì)時(shí)間模式

  -v : 顯示top版本,然后退出。

  -M : 自動(dòng)顯示內(nèi)存單位(k/M/G)

  top作為日常管理工作中最常用也是最重要的

  Linux 系統(tǒng)監(jiān)控工具之一,可以動(dòng)態(tài)觀察系統(tǒng)進(jìn)

  程狀況。top命令顯示的項(xiàng)目很多,默認(rèn)值是每

  5秒更新一次,按q鍵可以退出。顯示的各項(xiàng)目

  為:

  輸出數(shù)值解讀 為:

  15:06:57 up 129 days, 19:03, 5 users, load average: 1.21, 1.20, 1.25

  uptime 該項(xiàng)顯示的是系統(tǒng)啟動(dòng)時(shí)間、已經(jīng)運(yùn)行的時(shí)間和三個(gè)平均負(fù)載值(最近1秒,5秒,15秒的

  負(fù)載值)。

  222 processes: 219 sleeping, 2 running, 1 zombie, 0 stopped

  processes 自最近一次刷新以來的運(yùn)行進(jìn)程總數(shù)。這些進(jìn)程被分為正在運(yùn)行的,休眠的,停止的。

  CPU states: cpu user nice system irq softirq iowait idle

   total 0.9% 0.0% 27.4% 0.0% 0.0% 0.2% 71.2%

   cpu00 1.9% 0.0% 19.4% 0.0% 0.0% 0.0% 78.6%

   cpu01 0.0% 0.0% 33.0% 0.0% 0.0% 0.0% 66.9%

   cpu02 1.9% 0.0% 22.3% 0.0% 0.0% 0.9% 74.7%

   cpu03 0.0% 0.0% 35.2% 0.0% 0.0% 0.0% 64.7%

  CPU states 顯示用戶模式,系統(tǒng)模式,優(yōu)先級(jí)進(jìn)程(只有優(yōu)先級(jí)為負(fù)的列入考慮)和閑置等各種

  情況所占用CPU時(shí)間的百分比。優(yōu)先級(jí)進(jìn)程所消耗的時(shí)間也被列入到用戶和系統(tǒng)的時(shí)間中,所以總

  的百分比將大于100%。

  Mem: 16214336k av, 15682832k used, 531504k free, 0k shrd, 215016k buff

   10896844k actv, 3379680k in_d, 446432k in_c

  Mem 內(nèi)存使用情況統(tǒng)計(jì),其中包括總的可用內(nèi)存,空閑內(nèi)存,已用內(nèi)存,共享內(nèi)存和緩存所占內(nèi)存

  的情況。

  Swap: 10482404k av, 0k used, 10482404k free 14856500k cached

  Swap 交換空間統(tǒng)計(jì),其中包括總的交換空間,可用交換空間,已用交換空間。

  PID USER PRI NI SIZE rss SHARE STAT %CPU %MEM TIME CPU COMMAND

  27869 root 25 0 460M 460M 455M R 25.0 2.9 12559m 1 vmware-vmx

  31819 root 16 0 6016 6016 5048 S 1.6 0.0 17573m 2 magicdev

  27837 root 15 -10 460M 460M 455M S < 0.7 2.9 1328m 0 vmware-vmx

  27868 root 15 -10 460M 460M 455M S < 0.3 2.9 644:35 3 vmware-vmx

  PID 每個(gè)進(jìn)程的ID。PPID 每個(gè)進(jìn)程的父進(jìn)程ID。UID 每個(gè)進(jìn)程所有者的UID 。

  USER 每個(gè)進(jìn)程所有者的用戶名。

  PRI 每個(gè)進(jìn)程的優(yōu)先級(jí)別。

  NI 該進(jìn)程的優(yōu)先級(jí)值。

  SIZE 該進(jìn)程的代碼大小加上數(shù)據(jù)大小再加上堆棧空間大小的總數(shù)。單位是KB。

  TSIZE 該進(jìn)程的代碼大小。對(duì)于內(nèi)核進(jìn)程這是一個(gè)很奇怪的值。

  DSIZE 數(shù)據(jù)和堆棧的大小。

  TRS 文本駐留大小。

  D 被標(biāo)記為“不干凈”的頁項(xiàng)目。

  LIB 使用的庫頁的大小。對(duì)于ELF進(jìn)程沒有作用。

  RES 該進(jìn)程占用的物理內(nèi)存的總數(shù)量,單位是KB。

  SHARE 該進(jìn)程使用共享內(nèi)存的數(shù)量。

  STAT 該進(jìn)程的狀態(tài)。S=休眠;D=不可中斷的休眠;R=運(yùn)行;Z=僵死;T=停止或跟蹤。

  TIME 該進(jìn)程自啟動(dòng)以來所占用的總CPU時(shí)間。如果進(jìn)入的是累計(jì)模式,那么該時(shí)間還包括這個(gè)進(jìn)程

  子進(jìn)程所占用的時(shí)間。且標(biāo)題會(huì)變成CTIME。

  %CPU 該進(jìn)程自最近一次刷新以來所占用的CPU時(shí)間和總時(shí)間的百分比。

 。EM 該進(jìn)程占用的物理內(nèi)存占總內(nèi)存的百分比。

  COMMAND 該進(jìn)程的命令名稱,如果一行顯示不下,則會(huì)進(jìn)行截取。內(nèi)存中的進(jìn)程會(huì)有一個(gè)完整的命

  令行。

 。篖inux常用監(jiān)控命令簡介 – vmstat,ps等

  vmstat [-a] [-n] [delay [ count]]

  vmstat [-f] [-s] [-m]

  vmstat [-S unit]

  vmstat [-d]

  vmstat [-p disk partition]

  vmstat [-V]

  指令介紹

  -a:顯示活躍和非活躍內(nèi)存

  -f:顯示從系統(tǒng)啟動(dòng)至今的fork數(shù)量 。

  -m:顯示slabinfo

  -n:只在開始時(shí)顯示一次各字段名稱。

  -s:顯示內(nèi)存相關(guān)統(tǒng)計(jì)信息及多種系統(tǒng)活動(dòng)數(shù)。

  delay:刷新時(shí)間間隔。如果不指定,只顯示

  一條結(jié)果。

  count:刷新次數(shù)。如果不指定刷新次數(shù),但

  指定了刷新時(shí)間間隔,這時(shí)刷新次數(shù)為無窮。

  -d:顯示磁盤相關(guān)統(tǒng)計(jì)信息。

  -p:顯示指定磁盤分區(qū)統(tǒng)計(jì)信息

  -S:使用指定單位顯示。參數(shù)有 k , K, m, M,

  分別代表 1000, 1024, 1000000, 1048576

  字節(jié)。默認(rèn)單位為K(1024 bytes)

  -V:顯示vmstat版本信息。

  方便用法推薦

  每2秒輸出一條結(jié)果

  vmstat 2

  顯示活躍和非活躍內(nèi)存

  vmstat -a 2

  輸出數(shù)值解讀

  (Procs)r: 運(yùn)行隊(duì)列中進(jìn)程數(shù)量

  (Procs)b: 等待IO的進(jìn)程數(shù)量

  (Memory)swpd: 使用虛擬內(nèi)存大小

  (Memory)free: 可用內(nèi)存大小

  (Memory)buff: 用作緩沖的內(nèi)存大小

  (Memory)cache: 用作緩存的內(nèi)存大小

  (Swap)si: 每秒從交換區(qū)寫到內(nèi)存的大小

  (Swap)so: 每秒寫入交換區(qū)的內(nèi)存大小

  (IO)bi: 每秒讀取的塊數(shù)

  (IO)bo: 每秒寫入的塊數(shù)

  (System)in: 每秒中斷數(shù),包括時(shí)鐘中斷。

  (System)cs: 每秒上下文切換數(shù)。

  (CPU)us: 用戶進(jìn)程執(zhí)行時(shí)間(user time)

  (CPU)sy: 系統(tǒng)進(jìn)程執(zhí)行時(shí)間(system time)

  (CPU)id: 空閑時(shí)間(包括IO等待時(shí)間)

  (CPU)wa: 等待IO時(shí)間

  ps 命令

  ps [options]

  指令介紹

  -e 顯示所有進(jìn)程。

  -f 全格式。

  -h 不顯示標(biāo)題。

  -l 長格式。

  -w 寬輸出。

  a 顯示終端上的所有進(jìn)程,包括其他用戶的

  r 只顯示正在運(yùn)行的進(jìn)程。

  x 顯示沒有控制終端的進(jìn)程。

  方便用法推薦

  查看使用Vivek用戶名運(yùn)行的進(jìn)程

  # ps -U vivek -u vivek u

  只顯示Lighttpd的進(jìn)程ID

  # ps -C lighttpd -o pid=

  找出消耗內(nèi)存最多的前10名進(jìn)程

  # ps -auxf | sort -nr -k 4 | head -10

  找出使用CPU最多的前10名進(jìn)程

  # ps -auxf | sort -nr -k 3 | head -10

  free 命令

  free [-b|-k|-m][-o][-s delay][-t][-V]

  指令介紹

  -b 以Byte為單位顯示內(nèi)存使用情況。

  -k 以KB為單位顯示內(nèi)存使用情況。

  -m 以MB為單位顯示內(nèi)存使用情況。

  -o 不顯示緩沖區(qū)調(diào)節(jié)列。

  -s<間隔秒數(shù)> 持續(xù)觀察內(nèi)存使用狀況。

  -t 顯示內(nèi)存總和列。

  -V 顯示版本信息。

  輸出數(shù)值解讀

  total used free shared buffers cached

  Mem: 3266180 3250004 16176 0 110652

  2668236

  -/+ buffers/cache: 471116 2795064

  Swap: 2048276 80160 1968116

  total:總計(jì)物理內(nèi)存的大小。

  used:已使用多大。

  free:可用有多少。

  Shared:多個(gè)進(jìn)程共享的內(nèi)存總額。

  Buffers/cached:磁盤緩存的大小。

  used:已使用多大。

  free:可用有多少。

  uptime 命令

  uptime

  uptime [-V]

  輸出數(shù)值解讀

  18:02:41 up 41 days, 23:42, 1 user,

  load average: 0.00, 0.00, 0.00

  10:19:04:系統(tǒng)當(dāng)前時(shí)間

  up 257 days, 18:56:主機(jī)已運(yùn)行時(shí)間,時(shí)間越

  大,說明你的機(jī)器越穩(wěn)定。

  12 user:用戶連接數(shù),是總連接數(shù)而不是用戶

  數(shù)

  load average:系統(tǒng)平均負(fù)載,統(tǒng)計(jì)最近1, 5,

  15分鐘的系統(tǒng)平均負(fù)載

  如果每個(gè)CPU內(nèi)核的當(dāng)前活動(dòng)進(jìn)程數(shù)不大于3的

  話,那么系統(tǒng)的性能是良好的。如果每個(gè)CPU內(nèi)

  核的任務(wù)數(shù)大于5,那么這臺(tái)機(jī)器的性能有嚴(yán)重

  問題。

熱門評(píng)論
最新評(píng)論
發(fā)表評(píng)論 查看所有評(píng)論(0)
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過審核才能顯示)