视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
运维工作规范
2025-09-25 17:37:53 责编:小OO
文档
运维工作规范                

1.运维工作规范概述

运维工作规范制定的主要目的在于指导运维方业务系统的日常运行,规范运维人员的日常行为,合理安排资源,降低系统在运维过程中存在的风险,最大程度地保障业务系统的正常运行,提升客户满意度。

1.1.运维工作规范主要内容

运维工作规范着重于规范运行活动的日常行为,提前发现系统运行过程中存在的问题与隐患,以便更好地支持业务系统的运行。其主要内容如下:

❑软件系统运行  

软件系统运行部分主要包括:相关软件许可是否有效、应用系统相关进程是否正常、数据库运行是否正常等部分。

❑硬件系统运行

硬件运行部分主要包括:服务器有无硬件故障、有无硬件报警、网络设备是否运行正常、存储设备是否运行正常等等。

❑性能管理

性能管理主要针对多用户、高负载的应用系统。性能管理确保应用系统能及时有效地响应用户请求,在出现性能问题时,分析和解决相关技术问题。

❑故障与告警管理

故障与告警管理主要通过查看操作系统日志和应用系统日志,查看和统计软、硬件系统在运行过程中出现的报警信息,分析其中存在的隐患,提前加以排除。

2.系统总体框架图

包括应用系统的整体软、硬件部署图,其中包括服务器部署、网络部署、存储部署、应用部署等。

3.软、硬件系统要求

3.1.软件部分组成

主要填写软件部分组成,包括操作系统、中间件等平台与版本信息等;

描述如下:

序号组成部分具体配置

备注说明

1操作系统版本与补丁集要求
2中间件版本要求
3数据库版本与补丁集要求
4其他应用软件版本要求
- - - - -- - -- - - - - - - - -
3.2.硬件部分组成

主要涉及硬件系统组成及其相关配置信息;

描述如下:

序号组成部分具体配置备注说明

1服务器
2网络状况
3存储设备
4其他IT设备

- - - 

- - - - - - - -- - - - - - - - - - -- - - - - - - --  -
4.日常巡检

日常巡检是指操作人员根据规定的标准,以感官为主借助相关的软件工具,每日对设备和系统的运行情况进行检查和监视,了解设备和系统的运行状态是否正常,并对设备进行维护和调整,同时将检查结果进行记录。

日常巡检的主要内容包括:

a.硬件设备状态

b.软件设备状态

c.应用运行状态

4.1.硬件部分

4.1.1.服务器状态

主要检查服务器硬件的状态,包括cpu、内存、电源等硬件。

序号检查内容目前状态是否正常采取的措施
1电源状态
2风扇状态
3
4.1.2.存储设备状态

    主要检查存储设备的运行情况,包括存储空间、电源、控制器状态等。

 

序号检查内容目前状态是否正常采取的措施
1电源
2控制器
3- - - -
4.1.3.网络设备状态

    主要检查与应用系统相关的网络设备状态,

序号检查内容目前状态是否正常采取的措施
1
2
3
4
5
4.2.OS与应用软件状态

  主要检查OS与软件部分的运行状态,包括OS、数据库、中间件、应用软件等。

序号检查内容目前状态是否正常采取的措施
1
2
3
4
5
- -- - - - - -- - - - - - - -
4.3.备份系统状态

主要检查备份系统的软、硬件状态,包括磁带库状态、备份作业运行状态等。

序号检查内容目前状态是否正常采取的措施
1备份软件运行
2备份设备
3
4
5
- -- - - - - -- - - - - - - -
4.4.故障与告警管理

主要从系统全局角度查看,系统出现的故障、告警信息及其解决办法,为以后的该应用系统的运维增加管理经验。

时间故障或告警描述故障分析最终解决办法
序号检查内容支持操作检查方法
1备份软件运行
2备份设备
3- - - -
5.日常维护

日常维护是指运维人员对设备、应用软件等利用相关工具,对其运行状态进行检查,对潜在的故障点进行检查。

5.1.服务器维护

主要检查服务器运行状态,包括cpu利用率、内存利用率、是否有系统死锁进程等等。

序号维护项执行操作检查方法
1CPU利用率

2内存利用率
3系统进程
-- - - - - - - - - -
5.2.存储设备维护

主要检查与应用系统挂接的存储空间的状态,包括存储挂接点的状态、存储空间的状态等。

序号检查内容支持操作检查方法
1存储挂接点状态
2存储空间 状态

3- - - -
5.3.网络设备维护

主要检查网络设备中网络流量等网络设备状态。

序号检查内容支持操作检查方法
1
2
3- - - -
5.4.OS与应用软件维护

主要检查OS与软件部分的运行状态,包括OS、数据库、中间件、应用软件等。

序号检查内容支持操作检查方法
1
2
3- - - -
6.备份系统维护

备份系统包括磁带库、存储设备等硬件的运行状态,此外还有备份软件的运行情况等。

应用系统备份软件备份策略全备份周期(周或月)

增量或差异备份周期(天)

- - - -

下载本文
显示全文
专题