1.1设计方案
1.1.1平台架构设计
XX高新区云计算平台将服务器等关键设备按照需要实现的功能划分为两个层面,分别对应业务层和计算平台层。
业务层中,功能区域的划分一般都是根据安全和管理需求进行划分,各个部门可能有所不同,云数据中心中一般有公共信息服务区(DMZ区)、运行管理区、等保二级业务区、等保三级业务区、开发测试区等功能区域,实际划分可以根据业务情况进行调整,总的原则是在满足安全的前提下尽量统一管理。
计算平台层中分为计算服务区和存储服务区,其中计算服务区为三层架构。计算服务区部署主要考虑三层架构,即表现层、应用层和数据层,同时考虑物理和虚拟部署。存储服务区主要分为IPSAN、FCSAN、NAS和虚拟化存储。
云计算平台中计算和存储支持的功能分区如下图所示:
图 云计算平台整体架构
图 平台分层架构
基础架构即服务:包括硬件基础实施层、虚拟化&资源池化层、资源调度与管理自动化层。
硬件基础实施层:包括主机、存储、网络及其他硬件在内的硬件设备,他们是实现云服务的最基础资源。
虚拟化&资源池化层:通过虚拟化技术进行整合,形成一个对外提供资源的池化管理(包括内存池、服务器池、存储池等),同时通过云管理平台,对外提供运行环境等基础服务。
资源调度层:在对资源(物理资源和虚拟资源)进行有效监控管理的基础上,通过对服务模型的抽取,提供弹性计算、负载均衡、动态迁移、按需供给和自动化部署等功能,是提供云服务的关键所在。
平台即服务:主要在IaaS基础上提供统一的平台化系统软件支撑服务,包括统一身份认证服务、访问控制服务、工作量引擎服务、通用报表、决策支持等。这一层不同于传统方式的平台服务,这些平台服务也要满足云架构的部署方式,通过虚拟化、集群和负载均衡等技术提供云状态服务,可以根据需要随时定制功能及相应的扩展。
软件即服务:对外提供终端服务,可以分为基础服务和专业服务。基础服务提供统一门户、公共认证、统一通讯等,专业服务主要指各种业务应用。通过应用部署模式底层的稍微变化,都可以在云计算架构下实现灵活的扩展和管理。
按需服务是SaaS应用的核心理念,可以满足不同用户的个性化需求,如通过负载均衡满足大并发量用户服务访问等。
信息安全管理体系,针对云计算平台建设以高性能高可靠的网络安全一体化防护体系、虚拟化为技术支撑的安全防护体系、集中的安全服务中心应对无边界的安全防护、利用云安全模式加强云端和用户端的关联耦合和采用非技术手段补充等保障云计算平台的安全。
运营管理体系,保障云计算平台的正常运行,提供故障管理、计费管理、性能管理、配置管理和安全管理等。
图 平台网络结构图
网络负载均衡设计
链路负载均衡器将多条互联网线路进行虚拟化处理,保障用户仍最好的线路访问内外部资源。任意一条ISP线路中断,都不会对服务造成仸何影响。通过链路负载均衡器可实现ISP接入线路的无缝扩展。
1) OutBound流量负载均衡
访问互联网的流量到达链路负载均衡器时,将通过链路负载均衡器多种链路状态检测结果选择最佳出口链路,提升用户体验。
2) InBound流量负载均衡
为使用户通过不同互联网链路访问互联网接入区应用系统,链路负载均衡器的智能DNS解析功能将不同用户访问的域名解析成不同的公网IP地址,加速应用访问,提升用户体验。
1.1.2资源规划
(1)云服务规划
50台弹性云服务器(Elastic Cloud Server )承载XX高新区市园区智慧服务业务系统。
50T云硬盘服务(Elastic Volume Service)做为50台云服务器的存储。
400T对象存储服务 (OBS, Object Storage Service)用于视频监控、GIS数据存储等。
Anti-DDoS流量清洗服务(Anti-DDoS Service)防护50台云服务器的流量攻击安全。
(2)资源配置
50台弹性云服务器(Elastic Cloud Server ),每台云服务器4 VCPU,16GB内存,80G系统盘,弹性IP服务,保障因网络不通,业务正常运行,租用年限2年。
50T云硬盘给50台云主机做存储使用,每台云主机分配云硬盘1T,租用年限2年。
400T对象存储用于视频监控、GIS数据存储使用,下行流量50G,保障正常高清视频的接入带宽,租用年限2年。
Anti-DDoS流量清洗服务防护上述所有云服务资源。
1.1.3云服务
(1)计算服务
云主机
弹性云服务器是由CPU、内存、镜像、云硬盘组成的一种可随时获取、弹性可扩展的计算服务器,同时它可以结合VPC、虚拟防火墙、数据多副本保存等能力,打造一个高效、可靠、安全的计算环境,确保服务的持久稳定运行。
弹性云主机基于OpenStack的OpenStack Nova、Cinder和Neutron服务进行编排。通过实现OpenStack 原生API、自动API和组合API(基于多种自动API的组合)为管理员和云服务控制台在云平台上提供弹性计算服务和运行新的云应用。
云服务资源主机具备以下功能:
安全:弹性云服务器利用资源隔离,网络隔离,安全组规格,Anti-DDos流量清洗、Web应用防火墙、Web漏洞扫描提供度防护去提供一个安全的环境。
可靠:故障自动迁移,服务可用性达99.95%,保障业务连续;数据多副本,数据持久性达99.99995%,保障数据不丢失。
灵活:支持随时调整主机规格和带宽,高效匹配业务要求、节省成本;支持“云服务器+物理机”的混合组网模式,提供卓越计算性能+灵活组网方式。
易用: 产品种类全面,提供通用型,计算密集型,高内存型,高计算,存储密集型,GPU等多种类型的弹性云服务器,可满足不同的使用场景,统一管理控制台,一站式开通部署。
利用弹性云服务器,用户可以轻松获得各种功能。
支持多类型,多规格云服务器的选择和变更。提供多种类型的弹性云服务器,可满足不同的使用场景;每种类型的弹性云服务器包含多种规格,同时支持规格变更。
混合组网,支持物理设备租赁/托管。支持“云服务器+物理机”混合组网模式;提供卓越的计算性能、灵活的组网方式。
海量存储,弹性扩容,支持备份与恢复,让数据更加安全。支持多种性能的云硬盘,提供超高IO,高IO,普通IO三种性能规格供用户选择; 支持云硬盘的扩容,当磁盘空间不足时,可以通过扩容原有磁盘空间满足需求;支持云硬盘备份,在磁盘故障或数据错误时可快速恢复,使您的数据更加安全可靠。
弹性伸缩,快速增加或减少云服务器数量。用户可以根据业务需求自行定义伸缩配置和伸缩策略,降低人为反复调整资源以应对业务变化和高峰压力的工作量,帮助用户节约资源和人力成本。
镜像服务
镜像是一个包含了软件及必要配置的云主机模版,至少包含操作系统,还可以包含应用软件(例如数据库软件)和私有软件。用户可以基于镜像申请云主机,也可以将已有云主机制作成为新镜像。镜像服务(Image Management Service)提供简单方便的镜像自助管理功能。用户可以灵活便捷的使用公共镜像或者私有镜像申请弹性云主机。同时,通过已有的云主机,用户还能创建私有镜像。镜像分为公共镜像和私有镜像,公共镜像为系统默认提供的镜像,用户可直接根据情况选用并创建云主机。私有镜像为用户自己创建的镜像,同样可以根据私有镜像创建云主机。
公有云镜像提供了自制镜像内容服务的同时支持平台配置,丰富了镜像,使镜像的更新更容易管理。对于想要快速部署应用的用户,在云服务有丰富灵活的私有镜像。用户可以通过批处理迅速启动包含同样内容的应用程序所需的弹性云主机。公有云镜像服务提供公共镜像服务和私有镜像服务。公共镜像服务方面,有一些包含普通操作系统的公共镜像,比如windows和linux。私有镜像服务方面,用户可以通过使用云主机或云主机备份文件定制私有镜像。私有镜像存储在用户的UDS存储空间内。
通过镜像服务,用户可以更加便捷、安全、灵活、统一地创建和管理镜像,以满足业务需求。
(2)存储服务
云硬盘
云硬盘为云主机提供块存储功能,于云主机使用。云硬盘是一种基于分布式架构的,可弹性扩展的虚拟块存储设备。用户可以在线进行操作,使用方式与传统服务器硬盘完全一致。同时,云主机的损坏不会影响云硬盘,云硬盘具有更高的数据可靠性,更高的I/O吞吐能力和更加简单易用等特点,适用于文件系统、数据库或者其他需要块存储设备的系统软件或应用。一台弹性云主机可以挂载多块云硬盘。一块云硬盘同时只能挂载到一台弹性云主机上。
多存储类型,满足不同性能要求的业务场景;提供普通IO(SATA)、高IO(SAS)、超高IO(SSD) 3种性能的硬盘,满足不同业务场景需求。
弹性可扩展,可随时扩容硬盘容量;单盘最大可扩容至32TB,单台云服务器最多可挂载10块云硬盘,满足数据容量扩容需要。
副本存储,数据可靠性高达99.99995%;分布式存储技术,多副本保存,安全可靠,保障数据不丢失。
备份与恢复,防止误删除、被篡改而导致数据丢失;支持云硬盘备份,可随时备份,以及基于时间点恢复硬盘数据。
实时云监控,随时掌握硬盘健康状态;实时监控云硬盘读写速率及吞吐信息,帮助您及时了解云硬盘运行状况。
对象存储服务
对象存储服务是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。OBS适合存放任意类型的文件,适合普通用户、网站、企业和开发者使用。
对象存储服务是一项面向Internet访问的服务,提供了基于HTTP/HTTPS协议的Web服务接口,用户可以随时随地在任意可以连接至Internet的电脑上,通过对象存储服务管理控制台或客户端访问和管理存储在对象存储服务中的数据。此外,对象存储服务兼容Amazon S3大部分原生接口,用户可以通过调用对象存储服务REST API接口、多语言的SDK开发工具包开发上层适配应用软件,或对接Amazon S3存储,从而可以使用户聚焦业务应用,而无需关注底层存储实现技术。
对象存储服务为用户提供了超大存储容量的能力。对象存储服务配套提供了基于浏览器的可视化统一管理控制台(B/S架构)、基于主机的客户端(C/S架构)、多语言的SDK开发工具包(Java、.NET、Python、PHP、Android、C++、Ruby)、以及兼容Amazon S3原生接口的REST API接口,可使用户方便管理自己存储在对象存储服务上的数据,以及开发多种类型的上层业务应用。
对象存储服务主要面向海量存储资源池,企业云盘,静态网站托管,云硬盘备份,视频监控归档,弹性大数据等应用场景提供存储服务。
(3)安全服务
Anti-DDoS流量清洗
Anti-DDoS流量清洗服务(以下简称Anti-DDoS)是对IP地址进行DDoS(Distributed Denial of Service)攻击防护的一种网络安全服务。
通过对访问IP地址的数据流量进行实时监控,在网络出口对访问流量进行检测,及时发现进行DDoS攻击的异常流量。在不影响正常业务的前提下,根据用户配置的防护策略,清洗掉异常流量。同时为用户生成监控报表,清晰展示网络流量的安全状况。
Anti-DDoS具有以下功能:
提供针对以下攻击的防护:SYN Flood攻击、CC(Challenge Collapsar)攻击、慢速连接类攻击、UDP Flood攻击、ACK Flood攻击、TCP类攻击等。
为单个IP地址提供监控记录,包括当前防护状态、当前防护配置参数、24小时内流量情况、24小时内异常事件。
为用户所有进行防护的IP地址提供拦截报告,支持查询四周内的统计数据,包括清洗次数、清洗流量、弹性云服务器被攻击次数Top10排名和共拦截攻击次数。
Anti-DDoS引导用户针对5G以下的流量自主配置防护参数,通过调用Anti-DDoS管理中心的能力在网络出口对访问流量进行检测和清洗,调用API下发策略到检测中心;按用户生成报表,并呈现给用户。对大于5G的流量,设置为黑洞状态或建议用户自主购买第三方清洗中心服务,从第三方获取报表。
Anti-DDoS对弹性云服务器提供攻击防护,检测中心根据用户配置的安全策略,检测网络访问流量。当发生攻击时,将数据引流 到清洗设备进行实时防御,清洗异常流量,转发正常流量。
1.1.4功能设计
(1)平台处理能力分析
1)计算处理能力
CPU
计算输入:每分钟业务交易量(TASK),复杂程度比例(S),CPU利用率(C),业务发展冗余(F),峰值交易时间(T)。
计算过程:tpmC=TASK x S x F / (T x C)
内存
计算输入:
关于内存的配置,根据我们以往的经验,认为内存的消耗主要包括如下几个部分:
主机系统正常运行所需消耗(主要指操作系统消耗);
数据库运行所需开销;
数据库SGA运行所需正常开销;
联机事务处理消耗;
计算过程:内存=操作系统+数据库管理系统+数据库SGA运行+连接数*3M。
虚拟化
本节主要介绍虚计算虚拟化中的VCPU和物理CPU之间的换算关系。计算虚拟化主要从两方面来考虑,一种是同构虚拟化,一种是异构虚拟化。其中同构指的是华为平台的服务器,异构是其他品牌的服务器。
计算输入:物理CPU的CINT和CFP,现网CPU利用率,Intel Xeon E5620的性能基线值
计算过程:
a)同构服务器,如使用RH2285、T6000、E6000可使用如下公式
b)异构服务器,可使用虚拟化折算系数来估算:
2)存储能力分析
业务通常会从三个维度提出存储的需求:
●存储的性能维度
●存储架构维度
●存储容量维度
业务提出存储资源的需求后,需要对设备的IOPS、存储容量、存储带宽进行计算。
(2)计算存储场景设计
1)物理服务器
物理服务器是传统数据中心使用的计算系统,它能够很好的将系统软件的性能表现出来。以下介绍物理服务器在相关场景的具体应用场景。
表 应用资源需求及业务场景分析
| 应用类型 | 应用需求 | CPU需求 | 内存需求 | 常见业务场景 |
| 通用管理应用系统 | 通用类型 | 低 | 低 | 一般基础管理系统(WEB、检索引擎、DNS、DHCP、AD、FTP、FileServer) |
| 工具类应用系统 | 工具类型 | 低 | 低 | 基本的工具类应用系统(如打印控制、报表、OCR、流媒体、网页抓取、) |
| 大访问量应用系统 | 浏览密集型 | 高 | 高 | 门户网站、气象查询系统、WEB中间件服务器等 |
| 大数据量应用系统 | 大IO小数据量 | 中 | 高 | 联机处理数据库 |
| 小IO大数据量 | 中 | 中 | 数据仓库分析 | |
| 访问读密集型 | 中 | 高 | 影视播放网站 | |
| 计算密集型 | 高 | 高 | 高性能计算集群 数据库应用服务器 数字 GIS地理信息系统等 图像渲染 | |
| 访问写密集型 | 高 | 高 | 流媒体 数据库 数据仓库 | |
| 其他¹ | 特殊需求 | 高 | 高 | 数据库 中间件 |
对于云计算平台业务的服务器需求,首先需要判断该业务服务器是否能够采用虚拟化方案,不能虚拟化的则需要采用满足实际需求的服务器进行配置,其他的则建议统一采用虚拟化方式,根据采集或预估的计算资源需要采用相应配置的虚拟机来满足该需求。
根据业务应用的特点,对应用的虚拟化建议如下表所示:
| 应用类型 | 应用需求 | CPU需求 | 内存需求 | 网络带宽需求 | 存储空间需求 | 存储IO需求 | 存储带宽需求 | 虚拟化适应性 |
| 通用管理应用系统 | 通用类型 | L | L | L | L | L | L | 适合 |
| 大计算量应用系统 | 计算密集型 | H | H | M | L | M | M | 适合 |
| 大访问量应用系统 | 浏览密集型 | H | H | H | M | M | L | 适合 |
| 大数据量应用系统 | 大IO小数据量 | M | H | M | M | H | M | 一般不建议 |
| 小IO大数据量 | M | M | H | H | M | H | 适合 | |
| 访问写密集型 | H | H | H | H | M | H | 一般不建议 | |
| 访问读密集型 | M | H | H | H | M | H | 适合 |
存储虚拟化特性能够将不同品牌、型号的存储设备整合为统一的存储池,既能灵活利用旧存储设备,又能增加新存储设备。虚拟化后可以对原有数据进行灵活的管理,包括数据整合、迁移、镜像、远程复制等。
适用于存储虚拟化的场景如下:
●要求异构SAN/IP-SAN存储系统的开放性
●要求存储产品利旧
●要求异构存储系统之间有效的数据迁移
●要求异构存储系统的资源管理
●对服务器和存储整合
●存储池的性能提升
●异构存储环境数据保护与恢复
●异构存储环境灾备能力
(3)业务区安全防护
用户身份鉴别
本方案采用统一运维审计系统和双因子强认证系统来实现用户的身份标识和鉴别。在对每一个用户注册到系统时,采用用户名和用户标识符标识用户身份,并确保在系统整个生存周期用户标识的唯一性;在每次用户登录系统时,采用受安全管理中心控制的口令、令牌、基于生物特征、数字证书以及其他具有相应安全强度的两种或两种以上的组合机制进行用户身份鉴别,并对鉴别数据进行保密性和完整性保护。
对统一运维审计系统做如下的安全策略,能够实现上述安全要求。
1)对各种不同角色的管理员进行身份标识,并保证身份标识的唯一性,账户与自然人相对应,禁用默认账户;
2)用户登录身份认证要采用双因子强认证系统,其中口令必须具备一定的长度和复杂性,并定期更换;
3)启用登录失败处理功能,登录失败后结束会话,并登录失败的测试,自动锁定账户,记录日志向管理员告警;
4)远程管理系统时,采取SSH等加密的数据传输方式,禁止鉴别信息和管理系统明文传输;
5)设定主机、网络设备和数据库等管理对象拒绝非“统一运维审计系统”进行管理;
访问控制
本方案采用主机核心安全增强系统并对操作系统的安全增强配置,共同实现对系统资源的自主访问控制和和强制访问控制。自主访问控制是指在安全策略控制范围内,使用户对其创建的客体具有相应的访问操作权限,并能将这些权限的部分或全部授予其他用户。自主访问控制主体的粒度为用户级,客体的粒度为文件或数据库表级和(或)记录或字段级。自主访问操作包括对客体的创建、读、写、修改和删除等。强制访问控制是指在对安全管理员进行身份鉴别和权限控制的基础上,应由安全管理员通过特定操作界面对主、客体进行安全标记;应按安全标记和强制访问控制规则,对确定主体访问客体的操作进行控制。强制访问控制主体的粒度为用户级,客体的粒度为文件或数据库表级。应确保安全计算环境内的所有主、客体具有一致的标记信息,并实施相同的强制访问控制规则。
对主机核心安全增强系统做如下的安全策略,能够实现上述安全要求。
1)对重要的主机,部署主机核心安全增强系统,提升主机操作系统的安全性;
2)开启访问控制功能,根据“最小授权原则”的安全策略要求,分别对主体和客体进行安全标识,严格限定用户对文件、数据库等访问,主体的控制粒度限定为用户级,客体的控制粒度为文件、数据库表级,实现强制访问控制;
3)开启权限管理功能,根据“三权分立”的安全策略要求,严格限定主体用户对客体目标的操作权限,同时参考“最小授权原则”的安全策略,在不同种类用户之间形成相互制约关系的基础上,赋予用户正常完成工作所需的最小权限。
系统安全审计
本方案采用主机核心增强系统、网络审计系统和数据审计系统来实现系统安全审计,记录系统的相关安全事件(审计记录包括安全事件的主体、客体、时间、类型和结果等内容,并提供审计记录查询、分类、分析和存储保护),对特定安全事件进行报警,确保审计记录不被破坏或非授权访问,并为安全管理中心提供接口,对不能由系立处理的安全事件,提供由安全管理中心调用的接口。
对主机核心安全增强系统、网络审计系统和数据库审计系统做如下的安全策略,能够实现上述安全要求。
(1)对重要的主机,部署主机核心安全增强系统,实现对主机系统的安全审计;
主机审计的内容包括:
1)对重要的服务、进程、硬件操作和重要的文件系统进行监控;
2)对打印机、USB接口等重要外部设备及其接口进行监控;
3)对浏览器访问外部网站和非法外联拨号进行监控;
4)对用户账户变更记性审计。
(2)对重要的网络通信区域部署网络审计系统,实现对网络通信的安全审计;
网络审计的内容包括:
1)重要的网络通信协议:Telnet、SSH、FTP、HTTP等进行审计;
2)非法的、异常的网络IP地址参与的网络通信进行审计。
(3)对重要的数据库,部署数据审计系统,实现对数据的安全审计;
数据库审计的内容包括:
1)对数据库关键表、字段的读、写、插入和删除等操作和执行结果;
2)对数据库的重要设置操作和执行结果;
3)对数据库的异常读、写、插入和删除等操作和执行结果。
用户数据完整性与保密性保护
本方案采用数据库加密系统和文档安全管理系统,通过密码等技术支持数据的完整性校验机制和保密性保护机制,检验存储和处理的用户数据的完整性、保密性,以发现其完整性是否被破坏,且在其受到破坏时能对重要数据进行恢复。
对数据库加密系统和文档安全管理系统做如下的安全策略,能够实现上述安全要求。
1)部署数据库加密系统,并设置对用户数据库中重要的表、记录、字段进行自动的加密和解密操作;
2)部署文档安全管理系统,并设置对用户敏感的文档进行保护,通过加密和解密等手段,保证其完整性和保密性。
客体安全重用
本方案采用主机核心安全增强系统保护用户客体资源重用的安全性。主机核心安全增强系统通过剩余信息完全删除等技术手段,使客体资源重新分配前,对其原使用者的信息进行清除,以确保信息不被泄露。
对重要的主机部署主机核心安全增强系统,利用其剩余信息完全删除等功能实现客体安全重用的安全要求。
程序可信执行保护
本方案采用主机核心安全增强系统,构建从操作系统到上层应用的信任链,实现系统运行过程中可执行程序的完整性检验,防范恶意代码等攻击,并在检测到其完整性受到破坏时采取措施恢复。
对重要的主机部署主机核心安全增强系统,并配置其对应用程序完整性校验,可满足程序可信执行的安全要求。
对Windows操作系统和Linux操作系统部署主机恶意代码防范系统客户端软件,在防病毒管理中心的统一监控管理下,防护来自病毒、木马等恶意软件的威胁。
(4)平台管理
集中监控管理
集中监控管理从架构层次上包括:数据采集层、数据分析处理层和数据展现层三层,三个层次相互依赖、紧密结合,实现集中的监控管理功能。
下面分别进行阐述。
1)数据采集功能
数据采集层,主要是完成各类数据的采集工作,建立相关的数据采集接口,并能够根据需要定制在特定的时间(或周期性)进行数据的采集,并为数据处理层提供相关的数据。目前采集可以支持的手段有:RPC、SNMP、SYSLOG、专用Agent、脚本方式、以及一些标准的协议如WMI、SSH、Perfmon、JMX等来实现无代理的数据采集。这一层主要是由通过设置在各个点的各类采集设备组成。
通过在各类系统上安装CA Agent或者采用特定Agent或技术来对系统运行的软件环境进行监控与管理,包括对系统、数据库、中间件、应用、存储等;通过与华为U2000网络管理系统、华为ISM存储管理系统的集成对网络和存储进行监控,最终将相关信息提供给数据处理层,并在同一用户界面上进行展现。
采集的数据包括配置数据、告警数据、性能数据等。对于不同的管理对象的采集方式如下:
云平台的监控:通过Huawei Galax来实现;(云平台上的虚拟机及其上部署的软件由CA相应模块来监控);
操作系统、数据库监控:通过CA Spectrum来实现;
中间件监控:通过CA Wily来实现;
网络设备监控:通过Huawei U2000来实现;U2000作为可选项,可以直接使用CA监控网络;
存储设备监控:通过Huawei ISM来实现。
2)数据分析和处理功能
数据处理层的主要任务是将采集的数据进行汇总和处理,并根据需要进行展现。
各个监控管理产品根据预定义的事件处理策略对接受到的事件进行处理实现初始的数据分析处理功能,包括告警触发条件设置、告警事件丰富、告警相关性分析、相同事件压缩、事件过滤、性能数据汇聚等。
Huawei OSS集中事件处理平台汇聚各类数据,并根据预定义的事件处理策略进行后续的各种处理动作,如以各种方式通知相关的处理人员、在IT服务管理平台中产生事件工单,实现在Huawei OSS集中事件管理平台与CA Service Desk Manager(IT服务管理平台)的事件工单之间状态的双向同步。
Huawei OSS完成数据统一梳理后,由公共报表系统进行报表的定制、生成。
3)数据呈现功能
展现层主要是由华为数据中心管理门户和报表系统等组成。云数据中心 Portal对相关数据进行呈现,根据用户的不同权限呈现给预定义的视图,通过地理区域视图或业务视图、报表、图形、声光等界面方式进行显示和汇报,界面展现支持B/S结构,各级维护和管理人员可以根据用户的角色和权限来定制个性化的用户界面。
报表管理根据汇总的数据来产生相应的报表,如告警分类报表、告警分时报表、告警来源报表、性能数据的日报、周报、月报、性能数据的对比分析报表、性能数据的趋势分析报表等。可以定制自己的报告,可以通过Web发布报告,或通过mail方式自动将日/周/月报发送至特定用户。管理员可以在内部网上使用Internet浏览器来查看和打印各种报告。可以运用这些有价值的历史数据来分析业务系统的运作情况,帮助指定服务目标,提高服务水准。
IT服务管理
IT服务管理平台在逻辑上包括:服务流程平台、Web访问层、对象处理层和数据存储层。
IT服务管理技术架构包括如下层次:
服务流程平台层:用来实现具体的服务管理流程和功能,在本方案中需要实现的流程和功能包括:服务台、服务请求管理、事件管理、问题管理、配置管理、变更管理;
Web访问层:用来提供用户访问功能,具体提供的特性包括:表单和页面组管理、数据分析、服务接口、安全管理;
对象处理层:用来对各个服务流程的后台逻辑分析和处理,具体提供的特性包括:流程引擎、数据分区、访问控制、集成接口、配置管理、开发定制;
数据存储层:用来存储IT服务管理的各种数据,具体提供的特性包括:虚拟数据服务、CMDB。
通过采用这种分层的架构模式,大大降低了各层次间的耦合程度,提供了系统的可用性和可扩展性,为企业实现一种高可用、高稳定性的平台提供了保障。
IT服务管理平台通过接口可以实现和集中监控管理平台的集成,达到事件的及时转发和同步。
IT服务管理平台通过接口可以实现和邮件系统、短信系统的集成,将需要转送的信息及时通知相关人员。
统一运维管理门户
统一运维管理门户可以实现整个云数据中心所有运营管理内容的统一展现和控制,包括服务器、数据库、中间件、存储、网络和机房监控的实时数据展现、历史报表展现,以及针对云系统的服务设计、发布、管理功能,并提供统一登录,集中用户管理功能。具体功能如下:
提供统一的监控管理平台数据统计分析报表,提供对各种数据进行统一分析和基于Web界面的数据展现;
提供告警统计分析报表,以及主机、网络、数据库、中间件、存储、机房的各种性能指标报表,针对维护层、管理层和决策层用户提供不同的定制化报表,从而提供决策依据;
能够对主要的条目进行组合过滤查询,在用户设置如时间、日期等查询条件时,应能提供对输入内容的合法性检查功能;提供多种复合条件组合的明细数据查询功能,能够按照某字段排序、分页显示、对主要指标的TopN的灵活设置;
具备监控数据的保留和再加工机制或数据结构开放,以便今后有新的报表需求时系统能够提供必要的基础数据;
基于策略的历史数据汇聚、加工和再存储功能,以便减少历史数据库的负载,并为长期报表提供汇总数据;
提供横向比对和纵向比对的功能,横向比对即若干台机器的同一个或几个性能指标在同一时间段内的性能曲线比对,纵向比对即同一台机器的某几个性能指标的当前情况与昨日、上周、上月、往年同期的比对分析;
报表系统提供用户分权功能,要求能够根据用户的不同职位、角色提供不同时间粒度、不同内容和不同类别报表;
所有报表数据能够通过Web方式进行发布浏览,能将结果以文本列表、图形方式〈直方图、曲线图、饼图等〉输出,能够转化成Excel、XML、PDF等格式并提供报表打印功能;
要求报表工具采用SOA构架,采用纯B/S方式,进行报表设计,分析,查询,发布等工作不安装客户端软件,不安装浏览器插件,不安装Applet;
实施中提供不少于10种报表模板。
云管理
云管理平台管理总体架构由如下部分组成:
云门户系统(Cloud Portal):云门户包括用户自助服务子系统和后台管理子系统两个部分,自助服务子系统支持用户对已有的虚拟资产进行管理,包括虚拟资产的使用、释放等。例如对于虚拟机,用户可以进行启动、停止及重启等操作,也可以释放这台虚拟机;后台管理子系统,融合了业务支持和运营的功能,用于业务发放,提供帐户管理、业务管理、资源管理功能。
运维管理系统(OMS Portal):通过此子系统可以实现EDC云资源的配置管理、性能管理和安全管理等管理维护操作。
Huawei Galax云软件平台,主要包括虚拟化平台系统UVP(Unified Virtualization Platform)、ARS自动资源调度和IMGS镜像管理。
报表系统:定期生成并且保存原始统计报表单据。
(5)业务运营管理
业务的管理方面可以从管理和运营两方面来划分:
业务管理:主要业务方面的规划与设计,包括服务目录管理,产品管理、服务定价策略,服务级别管理等功能的规划与设计。
业务运营:负责业务的日常运转,包括业务日常流程和业务的受理。涵盖客户关系管理、合同管理、订单管理、资源管理、计量管理、计费管理等功能,包括知识库的维护与管理。
客户自助服务是云数据中心运营管理的核心模块,客户通过自助服务自主管理所租用资源,包括查看合同信息(包括服务目录、计费信息、服务周期、服务级别等)、查看定购的服务状态、使用服务、管理业务。
业务运营技术架构
通过业务运营子系统的的设计来实现数据中心运营需要的客户管理、服务目录、产品管理、订单管理、计量管理、计费管理、支付管理、资源管理、服务请求等业务功能。
业务管理技术架构包括如下层次:
客户自助管理系统:用来为客户提供对订购资源的管理,包括用户管理、信息查询(合同、订单、费用等)、资源部署、资源状态监控
Web访问层:用来提供用户访问功能,具体提供的特性包括:表单和页面组管理、数据分析、服务接口、安全管理;
业务管理与运营层:用来实现具体的业务管理和运营流程和功能,在本方案中需要实现的流程和功能包括:客户关系管理、服务目录、产品管理、服务级别管理、计量管理、计费管理、合同管理、订单管理、价格管理及资源管理、服务请求管理等;
对象处理层:用来对各个业务管理和运营流程的后台逻辑分析和处理,具体提供的特性包括:流程引擎、数据管理、访问控制、集成接口、配置管理、开发定制;
数据存储层:用来存储业务及IT运营管理相关的各种数据,具体提供的特性包括:虚拟数据服务,把分散的数据进行收集集中并结构化,把异质的数据转化成统一的格式,并给应用程序提供统一的接口;Central Database(CDB),数据的集中存储、管理。
业务管理平台通过接口可以实现和IT运营管理平台的集成,达到信息的共享和IT对业务运营管理的支撑。
业务管理平台通过接口可以实现和邮件系统、短信系统等外部系统的集成,将需要转送的信息及时通知业务相关人员。
1.2实施方案
云计算平台的实施与运维是一项涉及面广、制度性强、管理要求高的系统工程。如果从管理和技术两个视角分析平台的运行保障,我们认为管理的权重是第一位,而技术权重是第二位。为了有效保障云计算平台的科学实施和高效运行,必须要在园区的统一领导下,各有关部门协同配合,积极落实好组织、制度、技术和资金等支撑条件。
1.2.1建设流程及进度安排
在建立和明确项目组织价构和人员安排后,如何组织和实施项目建设方案是项目能否成功的关键。
在项目实施过程中,对时间计划、安排进度、人力资源调配、设备采购和安装。测试、演练等多项工作需要进行仔细、合理的计划和严格管理,才可以保证项目符合监管机构要求,达到省信息中心工程建设目标。
XX高新区智慧园区云计算平台是一个复杂、长期的工程。在前期调研和可行性论证工作完成后应当进行具体设计和实施。主要工作包括:
团队组建
业务连续性计划规划
实施方案的详细设计
实施方案的设计会审
运维制度的设计
运维制度的会审
系统接入
系统联调
人员技术和制度培训
项目验收
以上各个阶段基本上顺序进行,但部分工作会同步进行,以配合时间和人力资源的合理安排。
在项目实施过程中,将采用标准的项目管理规范和工具进行项目管理通过项目管理组进行工作协调和监控,采用启动会议、周期性项目进展协调工作例会、多个自工作分工负责等方式对时间计划、工作安排进行良好的协调和管控。
下表是工程建设各阶段计划和时间进度的初步安排,其中,时间和人员安排将根据需求和实际情况作相应调整。
1.2.1.1团队组建
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 成立项目组确定职责分工; 确定项目实施计划(人员、时间、初步进度安排详细实施方案等); 进一步确定和细化项目目标和内容; 对实施计划进行协调匹配(协调集成项目和云计算推管项目) | 10工作日 | |
| 人员 | |||
| 成果 | 1.《项目组织架构及职责分工》 2. 《项目工作计划》 3. 《项目人员联络清单》 |
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 确定接入业务系统及云计算级别要求 确定接入业务系统接入方式 确定接入业务系统云计算方式、步骤。 | 20工作日 | |
| 人员 | 各单位业务主管和技术人员 | ||
| 成果 | 《各项目业务连续性计划》 |
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 设计接入业务系统的接入方案; 设计接入业务系统的实施方案; | 20工作日 | |
| 人员 | 各单位业务和技术人员 | ||
| 成果 | 《各项目业务接入方案》 《各项目业务接入方案》 |
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 确认接入业务系统的接入方案 确认接入业务系统的实施方案 | 5工作日 | |
| 人员 | 各单位业务主管和技术人员 | ||
| 成果 | 《个项目业务接入方案》 《个项目业务接入方案》 |
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 提供云计算预算模板,确定文档框架、结构及格式; 提供云计算切换脚本、操作手册模板和具体要求; 云计算预案(应急响应预案、和业务系统云计算预案、重续运行计划、云计算回切计划、预案维护与管理流程) 研究制定运行维护和安全管理管理制度,操作手册和相关记录表单; 配合云计算预案的初审; 配合制度建设文档的初审 | 15工作日 | |
| 人员 | 各单位业务和技术主管 | ||
| 成果 | 《云计算组织架构》 《云计算响应和行动流程》 《云计算系统详细切换流程》 《云计算系统详细回切流程》 《云计算预案维护手册》 《云计算预案书》 《云计算平台运行维护管理制度》 《云计算平台运行维护质量标准》 《云计算平台运行维护安全管理手册》 《云计算平台运行维护标准操作手册》 |
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 确定指定的运行维护制度 | 5工作日 | |
| 人员 | 各单位业务主管和技术人员主管 | ||
| 成果 | 《云计算组织架构》 《云计算和行动流程》 《云计算系统详细切换流程》 《云计算系统详细回切流程》 《云计算预案维护手册》 《云计算预案书》 《云计算平台运行维护管理制度》 《云计算平台运行维护质量标准》 《云计算平台运行维护安全管理手册》 《云计算平台运行维护标准操作手册》 |
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 云计算IT系统安装调试 云计算网络系统安装调试 跟踪云计算项目集成商安装网络和IT系统的实施进度,了解技术实施方案和系统关键点 项目集成商安装网络和软件系统后,跟踪和审核设计文档、安装配置文档 | 30工作日 | |
| 人员 | |||
| 成果 | 1.《云计算系统切换、支持和回切方案》 2.《云计算系统操作手册》 | ||
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 提供操作手册文档、切换脚本等文档模板,明确要求,系统集成商完成模板和操作手册的技术编写 参与并跟踪如下测试,审核测试结果。 云计算平台的数据恢复测试、介质可用性测试、数据可用性验证、切换脚本文档验证、主机存储等IT系统功能/性能测试、平台机房网络系统(局域网、SAN)性能测试广域网线路切换测试、应用系统切换测试、系统切换测试、云计算平台网络系统(广域网、互联网)性能测试。 网络系统性能测试中遇到电路问题,提供电路的配合 以上测试总结评估。 | 30工作日 | |
| 人员 | |||
| 成果 | 《云计算各子系统模拟切换测试报告》 | ||
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 应运行维护制度和技术要求对运维人员进行培训 | 15工作日 | |
| 人员 | |||
| 成果 | |||
| 工作内容 | 实施周期 | 备注 | |
| 项目 | 验收集成商云计算系统; 验收集成商相关文档的交付; 基础设施启用验收; 电路服务启用验收; 云计算预案验收; 制度建设咨询验收; 完成系统投产,转入运行维护。 | 10工作日 | |
| 人员 | |||
| 成果 | 1.《在被系统验收报告》 2.《项目启用验收报告》 | ||
在云计算平台基础设施建设完成之后,云计算平台需要经过长期检验和试运行,也就需要投入长期持续的运作,需要有专门机构和人员负责其运营和管理。
考虑到过去的云计算方面职能大多分散在各个部门和一些归口管理部门,在云计算平台投入运行之后,需要将某些核心职能划归信息中心管理机构。因此,建议XX高新区园区管委会设定专门信息中心来负责。同时需要对各个部门和归口管理机构与中心管理机构之间的工作关系进行调整,因此也需要调整各个部门和归口管理机构的相关职能范围。
1.2.2.1领导组织机构
加强对智慧园区云计算平台建设的指导、管理和协调,园区信息化领导小组办公室联合相关部门,专门成立智慧园区建设工程领导小组。
领导小组日常工作由园区管委会领导小组办公室负责。
1.2.2.2项目建设机构
(1)项目管理组
主要职责包括:负责项目总体指导和关键点监控,协调解决关键问题,负责项目进度管控,协调项目所需资源,负责项目服务质量管理,负责合同管理,负责与管理层的项目沟通和协调。
(2)规划建设组
主要职责包括:规划设计智慧园区云计算平台的实施方案(包括组织、流程、质量管理、工作环境、支撑系统等内容),负责构建园区信息中心的组织、人员、流程、制度等,负责省信息中心的培训、试运行等。
(3)工程建设组
主要职责包括:负责设计园区云计算平台工作环境的详细实施方案,负责园区云计算平台设备选型和统一部署。
(4)专项建设组
主要职责包括:负责设计和安装云计算平台安全设施,负责安装调试云计算平台的存储设备,负责安装调试云计算平台的其他设备和应用系统。
(5)后勤保障组
主要职责包括:负责协调智慧园区云计算平台项目中需要的场地、办公设施、车辆等相关资源。
1.2.2.3项目沟通
智慧园区云计算平台项目组通过面谈、电话、邮件和传真与有关领导沟通联系。
项目组将通过以下形式进行沟通管理:
| 沟通内容 | 描述 | 细节 |
| 项目进度报告 | 将项目当前进度情况以及重要的实施结果报告给项目领导小组和项目管理组 | 持续时间:项目全程 频度:每两周 方式:电子邮件/传真 沟通对象:项目领导组、项目管理组 负责人:项目管理组组长 |
| 项目例会 | 项目管理组讨论项目当前状态,检查问题解决情况,评估项目变更对项目进度的影响、讨论近期项目事件。项目领导小组根据需要参加。 | 持续时间:项目全程 频度:每周 会议纪要提交时间:会后3天内 方式:会议/电话会议 参与人:项目管理组 |
| 项目讨论会议 | 项目组成员就某些项目专项问题进行讨论和评估。 | 持续时间:项目全程 频度:根据需要 会议纪要提交时间:会后3天内 方式:会议/电话会议 参与人:双方项目关键成员 负责人:项目管理组 |
智慧园区云计算平台项目将进行严格的文档管理。在项目实施各个时期,严格参照ISO9000管理规范,组织编写项目文档并加强管理。
在整个项目阶段,编制的主要项目管理文档包括:
1)《项目进度报告》
2)《项目实施方案》
3)《项目实施管理办法》
4)《项目计划进度安排与说明》
5)《项目周报》
6)《变更情况报告》
7)《项目总结报告》
8)《项目协调会纪要》
9)《项目交付报告》
以上文档的规范性和完备性将由项目管理组进行审查,审查通过后由文档管理部门归档。
1.2.2.5运维及管理的组织机构
本项目建成后由项目承建单位负责运维与管理。
按照组织机构建设情况,各工作组工作要求如下:
| 工作组 | 工作内容 | 工作时间 |
| 网络运维组 | 对云计算平台网络设备、安全设备、服务器等资产进行配置、升级、管理等日常运维操作。按照网络运维管理制度执行日常操作,并做好配置变更等操作的详细记录。 | 5×8小时 |
| 交换对接组 | 负责平台日常使用管理,对云计算过程进行调试与配合, 对共享资源需求方与提供方使用交换平台进行资源交换的流量信息进行监控考核,并做好详细的考核记录。 | 5×8小时 |
| 平台机房运维组 | 对平台机房的物理环境进行定期巡检,保障平台机房环境要求,并对巡检情况进行详细记录。 | 7×24小时 |
| 安全管理组 | 对云计算平台的建设、使用过程进行安全管理,对平台软硬件系统及环境安全进行定期的评估与分析,并提出安全加固方案与安全操作规范,保障平台安全、稳定运行。 | 5×8小时 |
对云计算平台而言,缺乏系统性的运维管理体系将对未来信息资源云计算的大规模、大范围铺开造成严重制约。因此,在云计算平台履行职责、提供专业服务的过程中,需结合我省共享资源交换平台自身特点,建立一套制度化、流程化、标准化的中心运维管理体系,以保障中心平台规范、有序、持久地运行。
按照运维管理体系建设要求,各层面管理制度、操作手册及记录表单的详细内容如下:
| 文件名称 | 主要内容 |
| 管理方针和制度 | 明确各部门的职责、工作目标、主要原则和工作内容,并对岗位设置、岗位职责和主要的管理原则进行界定。 |
| 管理制度 | 明确部门与云计算项目相关的管理制度和单位分工,并对岗位设置、岗位职责以及日常规范进行说明。 |
| 项目管理规定 | 对省信息中心范围内的工作内容、管理规定、工作规范与流程进行说明,如安全管理规定、系统变更管理规定、生产故障处理和管理规定、平台机房进入管理规定等各方面的管理规定和制度。 |
| 合同约定款项 | 对于用户合同内要求但不在项目管理规定中的内容进行明确说明 |
| 云计算制度 | 对交换平台使用方(信息资源提供方、需求方)、平台运行管理方等进行要求、规范。主要涵盖云计算平台管理办法和管理要求。 |
| 信息安全规定 | 对人员规定、平台机房进出规定、数据操作、网络安全规定等进行明确要求,确保用户商业机密不外泄、共享平台使用安全。 |
| 操作手册 | 对具体的工作过程和操作进行规范,建立技术说明和操作手册,特别对日常经常需要进行的操作和在紧急状态下的操作过程均应建立操作手册,以确保有关操作和过程正确无误和稳定可靠,应至少包括运维管理、信息安全、平台使用标准操作等手册。 |
| 记录单 | 对日常维护、事件发生、设备系统的操作维护、人员设备的进出情况等建立记录,记录单需要操作人员、操作领班、·值班经理和有关人员按照规定记录、检查和复核,确保每天的工作有绪的进行并且可追踪。 |
| 服务报告 | 对系统运行情况结果作出的评价和改进性意见。 |
本项目建成后由项目中标方承担日常运维。项目集成方提供技术支持,各部门系统管理人员配合使用管理。
1.2.2.8人员配置和培训
云计算平台建设的人才培养,需要一大批既熟悉运作又熟悉信息资源管理的专门人才,来支撑未来园区管理机构的运营和管理,以及各个部门的信息资源开发和利用。
(1)首先做好人才队伍的保障工作,完善人才引进机制;
(2)积极加强与大学和研究机构合作,培养信息资源管理人才;
(3)充分利用外部人力资源,做好咨询规划、项目建设和课题研究等工作。
人员配置安排:计划安排8-10人完成平台的日常运行维护工作。云计算平台6人、平台机房2-4人。
| 人员 | 职责 | 数量 |
| 云计算平台管理员 | 负责交换平台服务受理、处置。 | 3 |
| 云计算平台网络管理员 | 负责通讯、网络设备配置、安全配置以及运维过程中的相关问题。 | 3 |
| 平台机房管理员 | 负责平台机房的总体运维工作。 | 2-4 |
| 培训项目 | 培训内容 | 时间安排 | 培训量(人天) |
| 共享平台、平台机房使用培训 | 共享平台基础设施、网络、主机、应用系统使用与维护培训。 | 2018年01月 | 3 |