视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
企业级数据中心运维管理研究
2025-09-25 17:53:58 责编:小OO
文档
企业级数据中心运维管理研究

一、企业级数据中心运维管理面临的挑战

众所周知,企业级数据中心是数据的传输、计算和存储的中心,集中了各种软硬件资源和关键业务系统,面临异构环境问题、业务融合问题、管理规范等非常复杂的问题,给数据中心的运行管理带来了巨大挑战:从上层业务的角度看,数据中心最重要的工作之一是计算,因此需要保障数据库、服务器、中间件、Web等各种关键业务的正常运行,并根据性能参数和业务流量进行优化调整;从基础设施角度看,需要将各种管理工具进行整合,在一个平台里管理路由器、交换机、安全、存储、服务器等各种设备,同时适应数据中心特有的可视化管理需求;从运维和服务的角度看,数据中心IT部门提供的服务流程是否合理,服务质量是否有保障,直接影响到业务部门的各种业务是否正常开展;从技术发展趋势看,数据中心在完成标准化之后,要向自动化方向发展,就必须管理好硬件设备、软件、网络、安全、存储等各种逻辑的、虚拟化的各种资源池等。

因此,对数据中心的运行管理需要采用全新的管理模型和灵活的功能架构,并且充分考虑基础设施、技术趋势、业务运行、运维服务等各种管理要素,建立一个开放式、标准化、易扩展、可联动的统一智能管理平台,实现数据中心自动化管理。

二、企业级数据中心IT运维管理的发展阶段

企业级数据中心IT运维管理的发展阶段从集中、共享、动态到面向服务。数据中心的集中阶段主要实现对数据中心应用的各种IT软硬件资源和人员大集中,硬件资源主要包括存储、服务器、网络设备、安全设备等;软件资源包括操作系统、数据库、中间件、应用程序等;管理工具包括了基础设施监控软件、IT监控软件、工作流管理平台、报表平台等;人员包括了数据中心的技术人员、IT运维人员、管理人员以及提供服务的厂商人员。通过对基础架构整合和虚拟化,实现数据中心资源整合,从而达到降低IT架构复杂度,降低人力资源需求,降低运维成本和提升业务弹性目的。

在数据中心共享阶段,将创造出一个可以快速部署、回收、扩展的共享的 IT 基础架构。企业可以创建一个虚拟的动态共享的服务器、存储、网络以及应用的资源池,这样就可以更加顺畅的将 IT 服务提供给用户。这样可以消除各种物理,提升硬件利用率,降低硬件成本,应用系统运用自动化简化部署。自动化可以提供对于基础架构性能和应用可用性方面的掌控,可以帮助企业减少手工任务中容易产生的人为错误,并提高人员的效率。

在数据中心动态阶段,IT 资源的创建和实施将被作为服务提供给需求部门,通过IT服务实现各种业务流程的自动化,将各种业务服务通过服务索引的方式提供给最终用户,每个服务通过一系列预定义的自动化工作流来实现,保证流程标准化,从而减少各种应用系统部署周期,数据中心基于新的流程和服务实现灵活服务交付,及时为客户提供服务,实现IT运维流程化。

在数据中心面向服务阶段,实现云计算面向服务,云计算的动态性特征可以真正地让用户体验到“云计算”所代表的 IT 服务交付的模式,云计算的基础架构正是一个基于面向服务的 IT 交付模型,它提供灵活的工作负载扩展以及快速的 IT 服务交付的能力,从而实现数据中心的“一站式服务”,业务的弹性扩展,自动服务衡量和计费,能够快速实现服务交付,使数据中心产生巨大的规模效益。

三、用生命周期法来指导企业级数据中心运维管理

从数据中心角度来看,企业级数据中心运维管理是为提供符合要求的信息系统服务,对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。

数据中心生命周期包含五个阶段:

1、数据中心战略阶段:通过需求与业务目标分析、发现可利用基础设施资源、确定IT与业务案例关系等活动,提供数据中心规划与发展蓝图、IT环境分析、高级执行计划。

2、数据中心设计阶段:通过设备与技术高级设计,提供数据中心工程与体系结构的详细设计及预算、数据中心运行与治理模型、以及迁移规划。

3、 数据中心转换阶段:通过数据中心建设项目的实施和实际的物理设备部署、应用迁移、试运转、验收等活动,逐步使新数据中心投入使用,转入生产运行阶段。

4、数据中心运行阶段:借助自动化管理软件,实现主动地管理复杂的异构数据中心环境,提供端到端的服务器、存储、网络、应用的运营管理,以及随后发生的审计管理及迁移管理。

5、数据中心持续改进阶段:通过ITIL/ITSM最佳实践的实施、持续的改进评估,最新IT技术与产品培训、外包选择,使数据中心不断提高服务质量,完成从成本中心向创新中心的转换。

  因此,数据中心生命周期法对于进行有效地数据中心建设,特别是建成后的运行管理及服务改进具有十分重要的现实意义和指导意义。从数据中心生命周期来看,数据中心的运维管理包括运行阶段和持续改进阶段,是经历时间最长的,只有运行维护管理得好,才能发挥数据中心的作用,保证数据中心业务系统的应用效果和产出效益。

三、企业级数据中心的运维管理规范

运维管理规范定义了数据中心运维服务的原则、数据中心运维服务提供方基本要求、数据中心服务框架、运维服务对象与服务类型、运维服务实施过程策略、以及运维服务内容及服务报告、数据中心服务评价、服务改进的要求。为数据中心运维服务提供规范,需求方可以提出规范的需求陈述,选择和评价服务提供商;服务方可使用规范改进服务能力,提高数据中心运维服务的工作效率以及与需求方建立规范化的对话机制。

企业级数据中心的服务对象按技术属性分为机房基础设施、网络及网络设备、服务器及存储、软件、数据五类,也包括这五类服务对象构成的应用系统。数据中心的服务方式包括例行操作、响应支持、优化改善和咨询评估四类服务作业过程。即按照约定条件触发或预先规定的常态服务,分为监控、预防性检查和常规作业;根据响应的前提不同,分为事件驱动响应、服务请求响应和应急响应;优化改善服务包括适应性改进、增强性改进和预防性改进三种类型;根据需求方、服务相关方或系统运行的需求,对服务对象的运行状况、运行环境进行现状调研、系统分析和评估,提出处理或改进的建议和方案。建立适当的服务管理流程、服务活动指导文件或实施规则,以保证服务过程的规范运作,采取适当措施,确保按服务协议提供长期、持续的优质服务,保持服务对象符合SLA的可用性要求等。

四、企业级数据中心的安全运维管理

企业级数据中心按照网络和应用系统的重要性、涉密程度和安全风险等因素,划分安全域,实施信息安全等(分)级保护。优化整合信息安全资源,构建数据中心应急响应系统和灾难备份系统,充分发挥各类信息安全基础设施的作用。加强安全保障体系建设,建立应用系统安全防范机制,完善安全保障管理制度,进一步提高数据中心安全保障与防护能力。因此,企业级数据中心安全防范体系的建设应在信息系统安全策略指导下,充分考虑所面临的安全威胁,根据目前数据中心的安全状况,遵循安全法规标准,采取安全措施,从管理制度等不同方面构建数据中心安全运维防范体系框架。

1、数据中心安全运维管理

  由于数据中心应用多样、运维复杂等特性,决定了其面临的安全威胁的特殊性和复杂性。根据数据中心的逻辑架构,其安全风险主要集中在网络层与业务层。网络层的安全风险主要是针对网络基础架构的攻击行为如Dos/DDos攻击、来自外部的网络攻击行为、各种蠕虫或木马等恶意代码的侵害等。网络层面的攻击行为往往与特定的应用无关,针对的是网络中的漏洞。业务层的安全风险主要针对后台业务运行的主机以及主机上承载的特定应用。其风险的表现形式如垃圾邮件、针对Web/DNS/FTP等服务器的应用层攻击、针对服务器本身系统级的入侵行为等。业务层的安全风险主要针对的是数据中心业务运行、托管等特定应用,与用户密切相关,需要进行重点防护。

2、数据中心安全运维防护

安全的数据中心应具备三大特征:第一,拥有完善的信息安全防护策略,维护人员了解数据中心的安全水平及风险,并据此制订短期及长期的安全升级方案;第二,充分利用目前拥有的资源,解决威胁最大的安全问题,满足数据中心的基本安全需求;第三,按照制定好的安全策略,对安全风险进行有计划的防范。

对于数据中心安全防护的发展趋势,数据中心的安全防护将由满足企业自身的安全需求发展到向企业的客户提供增值的差异化安全服务,安全防护不再只会消耗资源,还能创造财富。

3、数据中心虚拟化的安全运维管理

虚拟化的安全隐患主要来自两个方面。首先是虚拟化技术需要额外的软件支持,对于桌面电脑,虚拟化经常扮演的是应用软件的角色,它会在桌面电脑操作系统如Windows下作为程序运行。对于服务器而言,管理程序则是介于普通硬件和通用目的的操作系统间的硬件虚拟化层面上的首选。其次,所有的虚拟化厂商都将开出安全的管理程序作为优先考虑的重点,却没有相关的工具来对管理程序的漏洞进行探测。

   数据中心虚拟化的安全管理。首先,随着虚拟化逐渐成为市场的主流,硬件厂商也在从头开始设计终端用户系统,为用户提供管理员控制的虚拟机分区和管理程序层,来防止恶意软件入侵系统。其次就是在最新的X86平台系统中使用可信任平台模组(Trusted Platform Module)。通过运用可信任平台模组可以验证软件的真实性,还能更加简便的对虚拟机间的流量进行加密。使用TPM功能,软件能够方便的测定系统映像的变化情况。由于TPM是专门针对进行加密的硬件设计,它还能有效的帮助软件防止恶意木马和病毒程序的感染和入侵。再次就是确保所有的虚拟机在相近的操作系统上运行,并且每台虚拟机都能及时的进行补丁更新。最后使用安全工具来提高虚拟化环境的安全性。虚拟化工具是有着最小化操作系统的虚拟机,这个操作系统的配置能满足应用程序的需求。

4、云数据中心的安全运维管理

由于提供服务的系统和数据被转移到用户可掌控的范围之外,云数据中心服务的数据安全、隐私保护已成为用户对云服务最为担忧的方面。云数据中心服务引发的安全问题除了包括传统网络与信息安全问题(如系统防护、数据加密、用户访问控制、Dos攻击等问题)外,还包括由集中服务模式所引发的安全问题以及云计算技术引入的安全问题,例如防虚机隔离、多租户数据隔离、残余数据擦除以及多SaaS应用统一身份认证等问题。

要解决云数据中心服务引发的安全问题,云数据中心需要提升用户安全认知、强化服务运营管理和加强安全技术保障等。需加强用户对不同重要性数据迁移的认知,并在服务合同中强化用户自身的帐号保密意识,可以提升用户对安全的认知;在服务管理方面,严格设定关键系统的分级分权管理权限并辅之以相应规章制度,同时加强对合作供应商的资格审查与保密教育;加强安全技术保障,要充分利用网络安全、数据加密、身份认证等技术,消除用户对云服务使用的安全担忧,增强用户使用云服务的信心。另外,云数据中心的安全运维管理要做到以下几点:

(1)进入到云数据中心的业务平台,企业的敏感数据都存储在上面,必须对获准访问的IP地址加以或纳入某种形式的双因素认证,访问需要加密。

(2)采用强概况,为数据中心服务器配置建立工作流程。这将防止不必要的DMZ或生产服务器建设,并保护企业的知识产权不会被暴露在不安全的环境下。这些资料必须结合企业的活动目录基础设施,所以当某位雇员被解雇,其获得的平台访问权限将被删除。

(3)数据中心所有服务器都必须遵守配置管理如补丁管理、防病毒保护、禁用不必要的服务和管理。

(4)具有涉及可用性和需要足够的故障恢复、灾难恢复计划,并满足企业级数据中心SaaS配置的应用程序将符合SAS70或SSAE16规定。

(5)数据中心运维服务必须提供强大的报告和日志记录,方便企业可以识别的任何滥用或安全问题。当然,这些日志必须能够兼容,能够被转发到事件监测设施。

因此,我们应采取各种安全手段或措施,控制企业级数据中心运维管理服务的各个环节,保护数据中心运维管理服务中的物理安全、网络安全、系统安全、应用安全和数据安全等。

五、企业级灾备中心的运维管理

大型的数据中心都建有相应的灾备中心,灾备中心建设后,应当建立健全的灾难恢复管理制度及灾备中心运营管理制度:主要包括有灾难报告制度,灾难恢复审批制度、灾难恢复处理流程、备份系统日常运行管理制度、备份系统替代运行状态下的运行制度、数据一致性认可程序、生产系统复原后的回切处理流程、备份系统测试、灾难演习制度等等,这些制度都是确保灾备业务正常运营的强有力的措施,为今后的灾备业务的价值发挥起到关键支撑作用。

灾备中心的运营管理非常复杂,从日常的运维到灾难发生时的应急响应、恢复和回退,是一个专业的、持续运行的过程。

六、企业级数据中心运维管理的自动化

目前数据中心面临几个主要的挑战,都需要自动化的手段予以解决,包括数据中心架构和运维的复杂性、运维成本日益提高、满足内部服务要求和外部合规要求等,数据中心面临的最大挑战就是如何实现自动化管理,从而提高IT服务速度、降低管理成本和风险。日益增加的运维压力以及成熟的平台和技术使得IT运维自动化已经成为数据中心的重要内容,IT运维自动化可以帮助IT团队实现资源转型,从而提供更高水平的服务。

1、 整体功能

企业级数据中心自动化运维管理平台主要实现业务系统运维自动化、批处理作业操作自动化和同城灾备切换自动化等功能,通过运维流程整合,满足数据中心日常网络、系统、应用及环境监控,监控事件和告警等运行维护,建立一个基于ITIL的管理标准化平台,运用科学化、标准化的IT服务管理模式,实现配置、问题和事故处理、变更、应用和报表等多种变更请求管理的标准化。

2、 统一的运维管理平台

对企业级数据中心IT基础设施日常运维管理实现自动化操作,自动化运维平台完成数据中心管理规范强制自动化操作,实现数据中心运维管理全生命周期的自动化以及运维各种资源可视化展现等功能,通过众多运维团队和岗位的统一运维管理平台,最终实现数据中心IT运维管理的自动化。

3、 数据中心运维管理自动化

企业级数据中心运维管理自动化主要包括例行检查自动化、事件和故障处理自动化、软件安装部署自动化、资源调度自动化、变更控制自动化、合规审计自动化、操作流程标准化和自动化、CMDB更新自动化等。

八、总结

   企业级数据中心运维管理主要是降低运维的复杂度,减少人为操作失误带来的故障,强化管理人员对操作者和整个系统的控制和监管能力;减少日常重复运维工作的人力资源,使技术人员能够将主要的精力放在系统、流程的优化上面,整个运维工作步入良性循环。逐步完善数据中心运维管理自动化,实现虚拟化技术、运营协调、网络负荷管理、服务器自动化、存储自动化、策略设置等完整自动化功能,帮助用户充分应对业务和管理挑战,实现手工流程自动化,在节约成本的同时,真正帮助企业实现安全、高效和7x24无人值守的新一代数据中心。下载本文

显示全文
专题