视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
Linux操作系统监控手册
2025-10-03 14:38:27 责编:小OO
文档
TurboLinux 

监控手册

1系统维护操作方法

1.1 系统维护内容

操作系统是否正常运转主要通过系统资源的使用情况来判断。因此,对系统资源的监测是系统管理的关键所在。

系统日常维护主要从以下几个方面着手:

    查看cpu使用情况

    查看内存使用情况

查看磁盘使用情况

辅助监测项目包括查看进程,IO等

1.2 系统维护操作方法

使用客户端登录到服务器主机,然后执行系统命令进行检查。 可以使用Telnet或ssh方式登录。建议使用ssh方式登录服务器,可以使用putty,SecureCRT等工具。

一般设置情况下,系统不允许root用户直接远程登录到服务器,登录时可以使用普通用户,如: oracle。普通用户登录后,可以执行:

$ su –

输入root用户密码

#

即可获得root权限。

注意:root用户具有很高的操作权限,执行命令时应特别小心。root用户的误操作有可能造成系统损坏!

执行完检查操作后,应执行两次exit命令退出远程登录状态。最好不要采用直接关闭连接窗口的方式。

# exit

$ exit

即可关闭远程连接。

2查看CPU信息及相关命令

2.1.1 查看CPU类型,数量

# cat  /proc/cpuinfo

查看cpu类型,数量

# cat /proc/cpuinfo

processor       : 0

vendor_id       : GenuineIntel

cpu family      : 6

model           : 5

model name      : Pentium II (Deschutes)

stepping        : 0

cpu MHz         : 334.151

cache size      : 512 KB

fdiv_bug        : no

hlt_bug         : no

f00f_bug        : no

coma_bug        : no

fpu             : yes

fpu_exception   : yes

cpuid level     : 2

wp              : yes

flags           : fpu vme de pse tsc msr pae mce cx8 mtrr pge mca cmov pat pse36 mmx fxsr

bogomips        : 668.78

2.1.2 显示CPU使用情况

top  显示cpu使用情况

[命令]SHELL#  top

CPU states:  cpu    user    nice  system    irq  softirq  iowait    idle

           total   0.0%    0.0%    0.0%  0.0%  0.0%  0.0%    100.0%

Mem:   481412k av,   762k used,  404520k free,       0k shrd,    6880k buff

        56588k active,               84k inactive

Swap: 2666740k av,       0k used, 2666740k free                   37588k cached

   

 

 [说明] cpu状态显示的信息有:user – 用户应用占用的cpu ; nice 优先进程占用的cpu;    system 系统使用;irq 中断占用; softirq 软中断占用; iowait  idle 空闲cpu。

      top命令不加任何参数,默认显示的所有进程按照cpu的使用率排序。

      若服务器cpu的空闲率(idle)低于30%,应当引起管理员的注意,对服务器进行检查。

    进入top状态后

       输入 M 让进程根据内存使用量排序

       输入 P  让进程根据CPU使用量排序

2.2 查看内存信息及相关命令

 [命令]SHELL # free

                 total       used       free     shared    buffers     cached

Mem:           481412      81424     399988     0       8100      39324

-/+ buffers/cache:            34000      447412

Swap:      2666740          0        2666740

  [说明] 

 第一行是当前物理内存的使用情况。其中, cache是缓存器,是内存中对磁盘设备的映射,比如读入一个文件,这种内存页面在磁盘上能找到对应的部分。而buffer是在磁盘上找不到对应空间的内存,比如程序运行中数据段中的内容。剩下固定的部分就是内核占用的内存。

第二行显示的两个数据分别是:used-buffers-cached 和free+buffers+cached。这意味着,buffers和cached占用的空间仍然是可以利用的,当内存空间不够的时候,这两个占用的空间可以腾出来作新的用途。因此判断内存可用空间要以第二行数据为准。

当物理内存使用到一定程度时,系统会自动启用swap分区作为扩展内存。如果swap分区占用了一半,应当引起系统管理员的注意,因为这时候服务器的性能会受到很大的影响。

2.3 查看进程信息及相关命令

[命令] ps –ef   [ | grep 进程名 ]

UID        PID   PPID  C STIME TTY          TIME CMD

admin        1     0       0 14:49     ?        00:00:04 init

admin        2     1       0 14:49     ?        00:00:00 [keventd]

admin        3     1       0 14:49     ?        00:00:00 [kapmd]

admin        879   1       0 14:49    tty2     00:00:00 /sbin/mingetty vc/2

 

 [说明] 显示系统中的全部进程,得到进程所属用户id, 进程id, 父进程id, 进程启动时间, 进程对应终端,启动进程的命令等信息。

[命令] kill  [-9] 进程号

 [说明] 中止一个进程

2.4 查看磁盘使用信息及相关命令

[命令] df  -h  

Filesystem           1K-blocks      Used Available Use% Mounted on

/dev/hda2             10080520   6747532   2820920  71% /

/dev/hda1                46633      7795     330  18% /boot

/dev/hda5             46311240  37902792   6017980  87% /data

 [说明] 分别以K,M,G为单位显示磁盘使用情况。磁盘使用到70%-80%要引起注意。尤其在应用程序会导致磁盘用量迅速增长的情况下。

[命令] du  filename(path) 

# du -sh /root

428K    /root

[说明] 查看某个目录,文件占用磁盘情况

    du -s   只列出总量(多用于查看目录)

       -h   以K,M,G为单位列出占用量

[命令]fdisk 

# fdisk -l

Disk /dev/hda: 60.0 GB, 600224806 bytes

255 heads, 63 sectors/track, 7297 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot      Start         End      Blocks   Id  System

/dev/hda1   *           1           6       48163+  83  Linux

/dev/hda2               7        1281    10241437+  83  Linux

/dev/hda3            1282        1345      514080   82  Linux swap

/dev/hda4            1346        7297    47809440    5  Extended

/dev/hda5            1346        7297    47809408+  83  Linux

# fdisk /dev/hda

The number of cylinders for this disk is set to 4865.

There is nothing wrong with that, but this is larger than 1024,

and could in certain setups cause problems with:

1) software that runs at boot time (e.g., old versions of LILO)

2) booting and partitioning software from other OSs

   (e.g., DOS FDISK, OS/2 FDISK)

Command (m for help): m

[说明] fdisk  磁盘分区工具

    fdisk -l   显示系统所有能认到的磁盘分区

    fdisk  /dev/sda   操作磁盘/dev/sda的分区

2.5 文件系统管理及相关命令

[命令] mkfs.type 磁盘分区标识

# mkfs.ext3 /dev/sda1

[说明] 将分区格式化成type类型的系统

[命令] mount  磁盘分区标识  挂载点

# mount /dev/sdb1 /mnt/usb

[说明]用mount将分区挂载

   

[命令] fsck.type  磁盘分区标识

# fsck /dev/sda1

[说明]  修复type类型的文件系统 

       fsck是一个非常有用的命令。操作系统很多故障是由于文件系统被损坏,此时,只要对文件系统进行修复,系统就能够重新正常使用了。

   注意: 分区要先umount才能修复, 否则可能会损害文件系统。

2.6 IO带宽及相关命令

[命令] iostat

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn

dev3-0            0.60         7.06         5.06    78373      56192

dev3-1            0.01         0.07         0.00    817          0

[说明] device 显示设备名,格式为devm-n ,m表示主设备号,n表示此设备号。

tps 每秒向设备发出的IO请求数。

Blk_read /s 每秒读取的block数

Blk_wrtn/s 每秒写入的block数

Blk_read   读入的block总数

Blk_wrtn   写入的block总数

注意:2.4kernel及以后的版本中,block大小是512 K

io 带宽主要是由硬件性能来决定的,从系统中来看,io大可以从cpu使用率中看出来

2.7 其他

[命令] uname –a 

# uname -a

Linux m1 2.6.9-8.11 #1 Thu Aug 3 13:52:36 CST 2006 i686 i686 i386 GNU/Linux

[说明] 查看系统内核版本

[命令] lspci 

# lspci

00:00.0 Host bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX Host bridge (rev 03)

00:01.0 PCI bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX AGP bridge (rev 03)

00:04.0 ISA bridge: Intel Corporation 82371AB/EB/MB PIIX4 ISA (rev 02)

00:04.1 IDE interface: Intel Corporation 82371AB/EB/MB PIIX4 IDE (rev 01)

00:04.2 USB Controller: Intel Corporation 82371AB/EB/MB PIIX4 USB (rev 01)

00:04.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 02)

00:09.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)

00:0a.0 Ethernet controller: VIA Technologies, Inc. VT6102 [Rhine-II] (rev 42)

00:0b.0 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 50)

00:0b.1 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 50)

00:0b.2 USB Controller: VIA Technologies, Inc. USB 2.0 (rev 51)

01:00.0 VGA compatible controller: ATI Technologies Inc 3D Rage IIC AGP (rev 3a)

[说明] 查看系统硬件信息(网卡,scsi 卡,raid卡)

[命令] lspci –n  

# lspci -n

00:00.0 Class 0600: 8086:7190 (rev 03)

00:01.0 Class 0604: 8086:7191 (rev 03)

00:04.0 Class 0601: 8086:7110 (rev 02)

00:04.1 Class 0101: 8086:7111 (rev 01)

00:04.2 Class 0c03: 8086:7112 (rev 01)

00:04.3 Class 0680: 8086:7113 (rev 02)

00:09.0 Class 0200: 10ec:8139 (rev 10)

00:0a.0 Class 0200: 1106:3065 (rev 42)

00:0b.0 Class 0c03: 1106:3038 (rev 50)

00:0b.1 Class 0c03: 1106:3038 (rev 50)

00:0b.2 Class 0c03: 1106:3104 (rev 51)

01:00.0 Class 0300: 1002:475a (rev 3a)

[说明] 显示硬件ID号 下载本文

显示全文
专题