实施方案
惠州启明信息技术有限公司
2017年5月
1.概述
1.1项目背景
华康医院现有机房位于医院的4楼,随着业务的发展现机房因供电及基础环境风险极高、机房容量不足等原因,选择在原址进行改造。原机房面积约约34平方米。标准拟满足信息系统基本运行、监测、控制的应用要求。规划设计上需预留一定升级扩容空间,并根据医院现场情况进行相应调整,使用年限需达到五年以上。本次建设重点在布局重整、电力供配、温湿度控制上。全面建设好新机房以达到标准化机房建设要求,并保证机房改造过程中现有系统运行风险降到最低。
本院搬迁项目主要分为:设备的搬迁,设备上架,设备安装调试等服务。
1.2项目目标与原则
1.2.1项目目标
华康医院机房搬迁项目,需要将原有机房改造及设备搬迁,我司需保障原有设备在拆除、搬迁及安装过程中安全无损,保障其在新机房的投入使用,其中涉及系统有计算机及网络设备、安防设备、环境监测设备、空调新风设备等。主要实现以下目标:
1、现状详细梳理。对现有信息系统的现状进行详细整理,梳理清楚现有机房内设备状况、设备和应用之间的对应关系、设备连接关系、信息点状况、信息系统架构、应用关联关系、应用服务要求等基础信息,形成当前IT系统的详细勘察报告,为本次搬迁策略的制定以及后期系统的维护提供重要的基础信息。
2、新机房合理规划。满足现有设备搬迁运行需求并考虑较长时期内业务发展需求,结合搬迁按设备类型、热量排放、网络分区、应用分类等规划设备部署。
3、业务平稳迁移。通过风险分析、应用关联分析、业务影响分析,制定安全有效的整体搬迁策略,减少业务影响,减少业务中断次数与时间,规避搬迁风险,保障业务连续性;制定充分、细致的搬迁实施方案,提供与搭建应急环境,进行充分详细的准备工作,根据搬迁策略,将业务系统顺利迁移回整改后的新机房。
4、资源有效投入。充分利用现有设备,控制新投入设备费用,分析需求在关键点合理投入过渡及更新设备,降低搬迁风险、提高整体运维水平。
5、搬迁周期可控。在可控的范围内尽量缩短新老机房并行周期,充分分析业务、存储、网络等各种关联分几批有计划搬迁。
1.2.2建设原则
系统搬迁过程中遵从安全性原则、先进性原则、开放性原则、高可靠性原则、可管理性原则。
1、安全性原则:在工程实施过程中,应通过安全技术和措施保证网络和系统的安全性、数据的安全性、用户访问的安全性,在技术保障的同时,从管理层面加强安全性管理。
2、先进性原则:系统搬迁过程中的新购及过渡软硬件产品应采用先进的、开放的系统结构;应可通过智能化的网络设备及网管软件实现对系统的有效管理与控制;工程应采用先进的现代管理方法,以保证项目实施与管理的科学性。
3、开放性原则:系统搬迁过程中的新购及过渡软硬件产品应遵循开放性和标准化基本原则,所选用的硬件设备、软件等必须遵循相应的国际标准,保证系统具有互操作性和开放性。各系统之间采用优化的原则,使各系统之间更好地配合,达到最佳的应用效果。
4、高可靠性原则:搬迁过程应满足各系统维护及业务部门高可靠性及高稳定性的要求。
5、可管理性原则:搬迁过程应保证系统的可管理、实施过程的可管理、实施风险的可控制。
2.需求分析
2.1搬迁设备需求
本次搬迁包括本医院机房内所有的IT系统,迁移设备包括服务器、交换机、网络设备、安全设备等。涉及搬迁的设备清单如下表:
现机柜配置:共计8 个机柜,具体如下:
| 序号 | 名称 | 数量 | 备注 |
| 1 | 综合布线柜 | 2 | 楼层骨干级联、外线接入、四楼水平配线、电话线路 |
| 2 | 网络设备柜 | 2 | 核心交换设备 |
| 3 | 视频前端柜 | 2 | 院内有线电视转换前端 |
| 4 | 移动终端机柜(32U) | 1 | 中国移动线路接入及终端设备 |
| 5 | 医疗业务服务器柜 | 1 | 医疗业务系统 |
| 原机柜位置 | 机型 | 设备用途 | U数 | 电源接口数 | 序列号 |
| A 机 | cisco catalyst 2960 | 1u | 1 | ||
| A 12U | cisco catalyst 2960 | 1u | 1 | ||
| A 18U-20U | AVAYA G450 | 3u | 1 | ||
| A 22U-23U | dell PE R710 | 2u | 1 | ||
| A 25U-26U | IBM X3650 M3 | 2u | 2 |
要求在2017年*月*日下午下班后开始搬迁,22日8:00完成现机房内全部IT设备至新整改机房的搬迁,并恢复系统的正常运行。其中网络部分要求在19日全部恢复正常运行。
3.搬迁实施方案
3.1总体方案
根据现场调研,目前机房内涉及搬迁的设备除个别设备外均处于在线运行使用状态,且旧、临时机房不考虑并行一段时间,因此必须在一次系统停机时间段内完成全部设备的搬迁工作。即,从某年9月18日18:00停机后,至某年9月22日12:00前为搬迁时间窗口,在该时间段内完成旧机房所有IT设备至新整改机房的搬迁及系统恢复工作。
在某年9月18日之前,需要完成机房的建设(装修、强电、弱电、空调、消防、安防等)、机房网络系统建设(局域网、互联网、专网等)、机房主机系统建设(存储、核心业务备机系统)、现机房运行系统健康检查、物流准备(搬迁环境、路线考察,物流方案制定等)等前期准备工作。
在某年9月18日搬迁开始后,首先停止业务系统的对外服务,之后进行系统数据的备份,然后进行系统停机。在某年9月19日12:00前完成搬迁系统网络部分的恢复上线,使系统能够正常提供服务。在某年9月22日8:00前完成所有业务系统的恢复上线,使系统能够正常提供服务。
在搬迁完成后,进行系统功能测试,并安排技术人员进行现场值守,保障系统正常运行。
3.2搬迁前准备工作
3.2.1机房环境检查
机房在某年9月9日需要具备先期网络、主机系统调试条件,即配电(市电)、新购空调、装修、新不间断电池系统、新购机柜安装等调试相关工程必须完成,且剩余机房工程不能影响先期进入的网络、主机、存储等设备正常使用(配电、温湿度、洁净度),如需要进行产生对设备不良影响的操作时,需要提前告知,以便进行相应设备保护措施。
搬迁前机房必须建设完毕,并通过相关测试。由于有一台20KUPS系统使用利旧设备,因此必须提前做好配电系统安装、调试、切换方案,保证配电系统的施工不会影响系统电力供应,并配备相应技术、设备资源。使用这些机柜的综合布线系统配线架需要在当日进行安装,为了降低线路故障造成的影响,需要配备综合布线工程师及线缆测试、安装工具,以便及时修复。
落实机房通信线路准备情况(电信、联通,数据、语音,互联网、专网)。
责任人:*工(甲方)、张工(乙方)
3.2.2搬迁设备统计
对搬迁涉及的设备进行统计,确认设备型号、实际安装位置、电源、数据线缆、IP地址、系统安装、应用安装、保修等信息,形成统计表和设备机柜安装图。具体见附件一:现机房设备安装情况统计表、附件二:现机房设备系统情况统计表、附件三:现机房机柜布局图、附件四:现机房设备机柜安装图。
责任人:*工(甲方)、张工(乙方)
3.2.3系统关联性分析
分析应用系统之间的相互联系、逻辑依存关系、数据交换情况、共用硬件设备情况等,从而得出停机顺序及开机顺序。
责任人:*工(甲方)、张工(乙方)
3.2.4系统拓扑结构
1
2
3
3.1
3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.2.4.1搬迁前拓扑结构
现在运行系统拓扑图如下:
图3.2.4-1 现在运行系统拓扑图
网络为单核心二层结构(核心、接入),专线路由器连接总部和医院楼,互联网为中国电信4M光纤。
3.2.4.2搬迁后拓扑结构
办公地点网络系统结构在现有的单核心基础上增加到双核心冗余,采用双核心冗余二层结构,其中一台路由器利旧,新购4台锐捷网络设备,一台路由器,两台核心交换机,一台网关行为安全设备,在出口增加链路负载均衡设备。拓扑变动部分如下图:
图3.2.4-2 办公地点系统拓扑图
3.2.5IP地址规划
本次搬迁不对系统IP地址进行调整,依旧采用原有地址。
责任人:*工(甲方)、张工(乙方)
3.2.6设备位置规划
机房机柜布局按照机房承重、最大限度利用空间、网络线缆连接最短、应用系统设备归类等原则,进行机柜及设备安装的重新规划。因此搬迁设备需要全部下架,至新机房后重新安装。
责任人:*工(甲方)、张工(乙方)
3.2.7系统健康检查
1
2
3
3.1
3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.2.5
3.2.6
3.2.7
3.2.7.1系统健康检查
对运行状态中的系统进行状态检查,查看设备外观,是否有故障报警灯;查看系统运行情况,CPU、内存、磁盘使用情况,系统日志分析。
责任人:*工(甲方)、张工(乙方)
3.2.7.2开关机测试
进行系统开关机测试,一方面可以提前发现系统故障,尽早解决;二是可以比较精确的估计系统停机时间,便于更好的掌握搬迁时间进度。为了尽可能的规避风险,首先停止业务系统对外服务(关闭互联网、专网路由器,关闭用户接入交换机),对数据进行备份,然后停止应用、关机、开机、启动应用、测试业务系统。开关机的顺序受到系统关联关系的影响,需要按照系统关联性分析结果进行顺序开关机。
责任人:*工(甲方)、张工(乙方)
3.2.8机房网络系统建设
在机房初步具备设备进场调试条件后,将现运行中的核心路由器、出口防火墙停机,搬运至新机柜,按照新办公地网络规划进行组网安装调试。需要尽早落实ISP线路(互联网、专网)。
责任人:*工(甲方)、张工(乙方)
3.2.9新机房主机系统建设
在新机房初步具备设备进场调试条件后,服务器、网络等设备运抵现场,进行安装调试。
医院系统由维保厂家负责安装和调试。安装完成后进行一次数据恢复测试,然后在新环境中进行恢复,验证方案的可行性。
责任人:*工(甲方)、张工(乙方)、维保厂家
3.2.10设备标签制作
按照设备在新机房的安装位置,制作设备标签及对应表。标签一式三份,其中两份在设备下架时分别粘贴在设备及包装箱上,另一份留作备用。设备标签对应表见附件八。
责任人:张工(乙方)
3.2.11搬迁物流方案
制定搬迁详细物流方案,包括现场环境保护、设备下架、清点、设备上架等过程。方案制定后。
责任人:*工(甲方)、张工(乙方)
3.2.12搬迁通知
下达搬迁通知的前提条件:
●已经完成了网络扩展连接测试;
●系统统计及确认完成;
●改造后机房环境检查完成;
●已经获得相关部门进入机房的批准。
需要在搬迁前3天通知相关部门具体的搬迁时间和搬迁实施要求:
1、业务部门:
1)对业务影响
搬迁从某年9月18日18:00开始,至某年9月22日8:00止,其中实时投保类和实时核保类业务系统至某年9月19日12:00止。期间业务中断,无法使用。
2)需要配合的工作
验证测试和集成测试时需要业务参与配合测试。
3)向业务部门提供相关搬迁资料及方案
责任人:*工(甲方)、张工(乙方)
2、维护部门(甲方信息部)
3、工程实施部门(乙方、运营商、设备供货商、医院系统维护商)
4、维保厂商
1)程控交换机;
2)业务系统开发、维护厂商。
5、搬运公司(乙方)
责任人:*工(甲方)、张工(乙方)
3.3搬迁实施
3.3.1现场环境保护
由实施单位(乙方)对机房内部通道,及以上地点的地面、墙面、门及门把手等所有在作业中可能会受到破坏的区域进行保护作业。
在搬迁设备运抵新址后,开始对新址的环境保护作业。
作业时间:现址某年9月19:00~某年9月18日21:00,共2小时
新址某年9月18日23:30~某年9月18日24:00,共半小时
责任人:*工(甲方)、张工(乙方)
3.3.2数据备份
停止业务系统对外服务(关闭互联网、专网路由器,关闭用户接入交换机),完成搬迁前最后一次系统数据备份。
作业时间:某年9月18日18:00~某年9月18日20:00,共2小时
责任人:*工(甲方)、张工(乙方)
3.3.3系统停机
系统按照先业务系统后网络系统的顺序进行业务停机。先关停服务器、呼叫中心设备,然后关闭网络系统设备。
作业时间:某年9月18日20:00~某年9月18日21:00,共2小时
责任人:*工(甲方)、张工(乙方)
3.3.4搬迁设备拆卸、清点
搬迁设备停机完成后,进行下架、打包工作,同时拆除*个配线柜中配线架,将这两个机柜随设备同时搬迁,用作该批设备在新机房的安装机柜。UPS、空调系统也同时进行搬迁(原厂负责)。设备打包完成后进行清点。
作业时间:
某年9月18日21:00~某年9月18日23:00,共2小时
责任人:*工(甲方)、张工(乙方)
3.3.5监督设备搬运过程
设备清点完毕后从现址搬迁至新址,期间对设备的搬迁过程进行全程监督。
作业时间: 某年9月18日23:00~某年9月18日23:30,共半小时
责任人:*工(甲方)、张工(乙方)
3.3.6目的地设备清点、拆包、上架
设备搬迁至新址临时机房后拆包、清点。如果一些部件必须在设备加电后才能进行清点,则可以在安装完成后的检测时再进行剩余部件的清点。之后,进行设备的上架工作。
作业时间: 某年9月18日24:00~某年9月19日2:00,共2小时
责任人:*工(甲方)、张工(乙方)
3.3.7设备功能恢复
对完成上架的设备进行线缆(电源线、数据线)连接,按照应用系统关联关系,依序启动主机设备。
作业时间:
某年9月19日2:00~某年9月19日3:00,共1小时
责任人:*工(甲方)、张工(乙方)
3.3.8启动应用系统
设备加电启动完毕后,按照应用系统关联关系,依序启动业务应用。
作业时间:
某年9月19日3:00~某年9月19日5:00,共2小时
责任人:*工(甲方)、张工(乙方)
3.3.9系统功能测试
测试网络功能是否正常,业务系统是否可以正常提供服务。
作业时间:
某年9月19日5:00~某年9月19日12:00,共7小时
责任人:*工(甲方)、张工(乙方)
3.4搬迁后系统保障
在系统搬迁完成后,为保障系统顺利运行,我们将提供技术支持服务。主要服务内容包括:
●设备软/硬件维修:
✧发现设备软/硬件故障,协助用户报修
✧协助用户配合厂商完成维修工作
●处理用户临时技术服务要求:
✧临时故障处理
✧网络配置变更
✧系统配置变更
✧系统补丁安装
4.
方案关键步骤
4.1搬迁技术方案必须周密细致、切实可行。
重点是如何将生产服务器的搬迁与网络迁移方案有机结合。网络的迁移是最基础的工作,只有在网络畅通的前提下才能考虑服务器的搬迁。同时,网络迁移又势必造成维护重心的转移,最关键的应用必须随着网络的迁移而同步迁移。因此线路割接、交换机调整等网络迁移操作不能与生产服务器的迁移分开而单独实施。
4.2提前预测搬迁风险。
根据多次的搬迁经验,我们总结出对于机房的搬迁主要存在四方面的风险,包括:
设备故障风险,即设备在搬迁过程中所出现的损坏;
操作风险,即线路割接、上联路由器切换、集中存储系统迁移、关键应用数据迁移(包括数据备份与恢复)、大型设备搬迁等均属于高风险操作,这些环节虽经反复论证在理论上可实施,但操作复杂且无法进行演练,在搬迁过程中很可能由于操作问题带来安全隐患;
人员风险,即在搬迁过程中现有技术人员既要负责搬迁工作,又要负责日常生产运行的维护管理,搬迁人员少或精力不够也容易产生风险;
其余不可预知风险,如系统的意外瘫痪、运营商线路问题等。在预知这些风险以后才能提前做好预防工作。
4.3充分调动一切资源。
机房搬迁是一项极为复杂的工作,不仅涉及行内众多的技术人员,还涉及相关业务部门、服务商、搬运公司等各个方面的人员及各种搬迁所用的器材,其中任何一项都与搬迁进度紧密相关。我们除了与各业务部门密切分工协作外,还提前召集所有相关的服务商进行了方案论证,并要求各服务厂商最大限度地准备技术支持人员和相关配件。
4.4采用流程化搬迁方式。
搬迁前,机房管理员专门绘制图纸,详细对比搬迁前后的情况;提前规划各个机柜、各个网络设备的摆放位置,还要事先量好机器的具体尺寸,对所有设备进行编号,并填入登记表中之后到现场规划机器的具体摆放位置,力争最合理、最充分地利用机房的有效空间。搬迁工作大致分为关机、拆卸、装箱、运输、装机、连线、验证等几个环节,由于每次搬迁都有严格的时间要求,而且涉及人员较多,所以搬迁要有条不紊、高效有序。在搬迁之前,对所有设备信息进行了详细的统计,在此基础上形成了每次搬迁的搬迁调度表和搬迁流程表,交由各组掌握。在搬迁过程中要求各组必须按照这两份表格进行,每完成一个环节,该组组长都必须要在搬迁调度表上确认后,下一环节才能继续进行。按照这样的流程执行之后,我们每次搬迁都没有出现因各环节的衔接问题而耽误进度的情况,更没有出现误操作的现象。
4.5做好系统的充分验证。
根据每一批搬迁的特点我们提前与相关的业务部门沟通,由业务部门负责根据在变更时间内对业务的影响程度及时向外发布公告,同时,在系统恢复后进行系统验证。
5.
风险及应对措施
| 编号 | 风险 | 几率/影响 | 应对措施 |
| 1 | 项目组内部配合 | 中/中 | 制定详细的实施计划,明确各方职责 及时通报项目组进行协调 |
| 2 | 机房工程工期延误 | 高/大 | 加快机房工程进度 加快新机房网络、主机调试进度 |
| 3 | 搬迁需采购设备到货延期 | 低/大 | 密切关注并推动采购流程 调整系统技术方案/加快到货后调试进度 |
| 4 | 新机房综合布线系统故障 | 中/中 | 提前做好综合布线系统测试工作 准备布线工程师及工具,及时处理 使用其他线路或临时线缆替代 |
| 5 | 新机房设备出现故障 | 低/大 | 尽早接入线路,提前测试 准备相应备机、备件进行替代 安排设备商在搬迁时现场配合 |
| 6 | 业务系统单机运行环境 | 中/大 | 提前准备好安装相同业务系统的备机 做好系统数据备份 |
| 7 | 业务停止窗口超出计划 | 低/中 | 提前做好业务系统健康检查和测试 及时通报项目组调整计划 |
| 8 | 搬迁中硬件发生损坏 | 低/大 | 安排专业硬件平台专家 安排可能损坏硬件的相关现场备件或备机 设备运输保险 |
| 9 | 搬迁中软件故障 | 低/大 | 搬迁前健康检查 搬迁前进行备份 相关产品技术支持人员现场待命 |
| 10 | 备份介质损坏 | 低/大 | 使用可靠性高的介质备份 核心业务多拷贝备份 搬迁前进行备份恢复演练 |
| 11 | 设备运输过程中出现冷凝水珠 | 中/大 | 在机房内用防静电膜包裹设备 设备运抵现场后延迟加电时间 |
| 12 | 搬迁过程中设备丢失 | 低/大 | 设备运输保险 设备清单多次多方核查 搬迁过程专人监控 |
| 13 | 搬迁过程中数据泄露 | 低/大 | 项目组成员签订保密协议 设备清单多次多方核查 搬迁过程专人监控 |
| 14 | 备机、备件损坏 | 低/小 | 备机到场后进行测试 多个相同备件 专业技术支持 |
| 15 | 备机、备件数量不够 | 低/中 | 优先满足核心业务系统 备件库有足够的备件 |
| 16 | 搬迁后设备无法正常开机 | 中/大 | 在搬迁前进行系统健康检查及开关机测试 使用备机、备件进行替代 按照应急预案处理 |
| 17 | 搬迁后应用系统异常 | 中/大 | 在搬迁前进行系统健康检查及开关机测试 使用备机、备件进行替代 按照应急预案处理 |
6.应急预案
6.1.1搬迁过程中设备硬件损坏
针对系统运输过程中硬件损坏,我们采用加强运输管理来规避此处风险。另外对网络设备采用备份操作系统文件、配置文件进行应急,应用系统采用数据级备份进行系统应急,同时准备相应备机、备件,紧急时进行硬件或系统替换,并及时联系进行设备维修。
6.2设备开机无法正常运行
在搬迁前进行设备开关机测试及搬迁后设备开机过程中,如果发生设备无法正常运行故障时,按照下图所示流程进行处理:
图5.2-1 设备维修流程图
附件一:现机房设备安装情况统计表
| 原机柜位置 | 机型 | 设备用途 | U数 | 电源接口数 | 序列号 |
| A 10U | cisco catalyst 2960 | 1u | 1 | ||
| A 12U | cisco catalyst 2960 | 1u | 1 | ||
| A 18U-20U | AVAYA G450 | 3u | 1 | ||
| A 22U-23U | dell PE R710 | 2u | 1 | ||
| A 25U-26U | IBM X3650 M3 | 2u | 2 | ||
| 原机柜位置 | 机型 | 设备用途 | U数 | 电源接口数 | 序列号 |
| B 1U-4U | 工控机 | 4u | 1 | ||
| B 5U-8U | 联想服务器 | 4u | 1 | ||
| B 9U-12U | 研华工控机 | 4u | 1 | ||
| B 16U-17U | IBM X3650 M3 | 2u | 1(只配1个) | ||
| B 19U-20U | IBM X3650 M3 | 2u | 1(只配1个) | ||
| 原机柜位置 | 机型 | 设备用途 | U数 | 电源接口数 | 序列号 |
| C 17U-19U | AVAYA G450 | 3u | 1 | ||
| C 37U | cisco catalyst 2960 | 1u | 1 | ||
| C 38U-39U | cisco 2821 | 2u | 1 | ||
| C 41U | cisco ASA5510 | 1u | 1 |
附件二:现机房设备机柜安装图
附件三:现有网络拓扑图
附件四:现有网络设备连接图
| 设备名称 | 端口 | IP地址 | 用途 | 备注 |
| cisco 2821 | GigabitEthernet0/0 | |||
| GigabitEthernet0/1 | ||||
| Serial0/0/0:0 | ||||
| FastEthernet0/1/0 | ||||
| FastEthernet0/1/1 | ||||
| Serial0/2/0 | ||||
| Serial0/2/1 | ||||
| Serial0/3/0 | ||||
| Serial0/3/1 | ||||
| cisco 2960 | FastEthernet0/1 | |||
| FastEthernet0/2 | ||||
| FastEthernet0/5 | ||||
| FastEthernet0/11 | ||||
| FastEthernet0/12 | ||||
| FastEthernet0/13 | ||||
| FastEthernet0/14 | ||||
| FastEthernet0/16 | ||||
| FastEthernet0/19 | ||||
| FastEthernet0/21 | ||||
| FastEthernet0/22 | ||||
| FastEthernet0/23 | ||||
| FastEthernet0/25 | ||||
| FastEthernet0/33 | ||||
| FastEthernet0/34 | ||||
| FastEthernet0/35 | ||||
| FastEthernet0/36 | ||||
| FastEthernet0/37 | ||||
| FastEthernet0/38 | ||||
| FastEthernet0/39 | ||||
| FastEthernet0/42 | ||||
| FastEthernet0/43 | ||||
| FastEthernet0/44 | ||||
| GigabitEthernet0/1 | ||||
| GigabitEthernet0/2 | ||||
| Vlan1 |
附件五:新机房机柜布局图
附件六:新机房设备机柜安装图
附件七:新机房网络拓扑图
附件八:新机房设备连接表(规划)
| 设备名称 | 端口 | IP地址 | 用途 | 备注 |
| ASA | ||||
| RG-EG1000S | ||||
| cisco 2821 | ||||
| RG-RSR30-44 | ||||
| RG-S5750-24GT-1 | ||||
| RG-S5750-24GT-2 | ||||
| cisco 2960 | ||||
| cisco 2960 | ||||
| cisco 2960 | ||||