张彦全 高继森
(兰州交通大学 电子与信息工程学院, 甘肃 兰州 730070)
摘要:云存储伴随着云计算的发展而产生,如何搭建云存储系统,成为目前很多企业,科研机构研究的重点.介绍了云计算的架构、云存储需要突破的技术问题及云存储潜在的安全问题及可行的解决方案.
关键词:云计算;云存储;云安全
中图分类号:TP393 文献标识码:A
0 引言
电子计算机出现以前,人类就采用多种工具进行计算,如算筹、算盘、计算器等.随着第一台电子计算机ENIAC诞生,电磁学、电工学、电子学的发展,晶体管、集成电路的应用,PC应用而生.操作系统的诞生给计算机嵌入灵魂.互联网的高速发展孕育了“云计算”的出现.云计算经历了单机计算、并行计算、分布式计算、网格计算和SaaS(软件即服务)等阶段后,终于逐渐成为了未来计算技术发展的一个重要方向.有计算就有存储,计算机存储技术伴随着计算机的产生而发展起来,同理,云存储伴随着云计算的快速发展而产生.
1 云计算
云计算就是一个透过网络庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户的技术[1].通过云计算技术,网络服务提供者可以在数秒之内,处理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大的网络服务.云计算系统的建设目标是将运行在PC上、或单个服务器上的的、个人化的运算迁移到一个数量庞大服务器“云”中,由这个云系统来负责处理用户的请求,并输出结果,它是一个以数据运算和处理为核心的系统.云计算机作为一种新兴的技术,将随着时间的推移而发展壮大,人们也会在不知不觉中使用到一些简单的云计算,如网络中的在线处理程序,包括图片处理、动画处理、文档处理等.云计算机的真正价值是能够对主要的商业和市场趋势做出应有的反应,引领市场发展和壮大.目前,IBM、微软、Google、Amazon等信息巨头都已经参与到云计算研究和开发中.2006年Sun公司推出基于云计算理论的“黑盒子计划”,2007年11月,蓝色巨人IBM在上海推出了“蓝云(Blue Cloud)”计划,2008年,微软推出Windows Azure云计算平台,Google的搜索引擎,其开放式的平台体现了云计算模式的精髓等说明云计算的巨大潜力.可以把云计算的核心系统设想为一个处理所有用户请求的云中心,称为“云脑[2]”.图1为云脑图.
2 云存储
2.1 什么是云存储
云存储产品随着云计算的落地,已经得到了诸多厂商的支持和关注,云存储是在云计算概念上衍生和发展出来的一种新的技术或者服务,云存储是将网络中各类存储设备通过应用软件集合起来协同工作,对外提供数据存储和业务访问功能的一个系统[3].云存储服务器通常是宿主在第三方公司,它们拥有大的数据中心.数据方面讲,云存储服务可能提供几倍的千亿万字节,今天最知名的云存储服务可能是亚马逊(Amazon.com)的简单存储服务(S3)等.当我们使用某一个的存储设备时,我们必须非常清楚这个存储设备是什么型号,什么接口和传输协议,必须清楚地知道存储系统中有多少块磁盘,分别是什么型号、多大容量,必须清楚存储设备和服务器之间采用什么样的连接线缆.为了保证数据安全和业务的连续性,我们还需要建立相应的数据备份系统和容灾系统.除此之外,对存储设备进行定期地状态监控、维护、软硬件更新和升级也是必须的.
图1 云脑
Cloud brain
如果采用云存储,那么上面所提到的一切对使用者来讲都不需要了.云状存储系统中的所有设备对使用者来讲都是完全透明的,任何地方的任何一个经过授权的使用者都可以通过一根接入线缆与云存储连接,对云存储进行数据访问.
2.2 云存储的特点
2.2.1 扩展性
当用户租用云空间时,用户可选择使用用户需要的可大可小的空间.用户不必购置另外的计算机来存放额外的数据,而是可以多利用一些云上的可用空间.而且使用空间上也很自由.
2.2.2 可靠性
云存储能作为一个巨大的在线备份数据驱动器使用,即使用户依赖云服务进行原始的数据存储,用户仍然可以因为知道其数据是有多个服务器保存多份数据而不必担心数据安全.
2.2.3 低成本
用户使用云中的虚拟器仍然是便宜的.云存储服务能提供较高的存储性价比,因为它们能更有效地利用服务器空间,基于需求,存储空间几乎能即时地对用户进行重新分配.
2.2.4 自动容错能力
因为低成本的,存储组件的损耗率应该很高,云储厂商应该能在软件层做到自动容错而不是依赖硬件本身的容错.
2.2.5 易管理性
构建云存储系统,可管理性应该在设计之初就考虑到的,如果管理太复杂,很难做到低成本,稳定性,可靠性也会受到挑战.
2.3 云存储的简易架构
云存储产品,旨在为用户提供互联网服务形式同时提供更强的存储和计算功能.云存储的简易架构可以看作是四层架构,由下至上分别为存储层,基础管理层,应用接口层及访问层.
存储层:存储层是云存储最基础的部分,数据存储虚拟化、存储集中管理、状态监控和维护升级等.
基础管理层:对集群系统、分布式文件系统、网格计算、重复数据的删除、数据的压缩、数据加密及数据备份等.基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能.
应用接口层:负责网络接入、用户认证、权限管理、Web服务等.不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务.
访问层:用户空间的租赁、数据归档和远程共享、视频控制等。
图2云存储的简易架构
The Simple structure of Cloud storage
2.4 云存储中的技术问题
2.4.1 云存储的性能
云计算方案必须采用高于或者目前正在使用的企业级技术.此外,如何使用技术与技术本身同等重要.在一个系统管理环境里,企业级需求下的虚拟机配置必须能够持续提供高性能.
2.4.2 云存储的安全性
在大多数云计算市场里,无有的还是私有的,数据安全性都是基于信任的,这信任通常都在管理程序里,管理程序确保数据是否毁坏或者被错误的虚拟机访问.
2.4.3 宽带网络的发展
真正的云存储系统将会是一个多区域分布、遍布全国、甚至于遍布全球的庞大公用系统,使用者需要通过ADSL、DDN等宽带接入设备来连接云存储,只有宽带网络得到充足的发展,使用者才有可能获得足够大的数据传输带宽,实现大量容量数据的传输,真正享受到云存储服务,否则只能是空谈.
2.4.4 WEB2.0技术
Web2.0 技术的核心是分享.只有通过web2.0技术,云存储的使用者才有可能通过 PC、手机、移动多媒体等多种设备,实现数据、文档、图片和视音频等内容的集中存储和资料共享.
2.4.5 应用存储的发展
应用存储是一种在存储设备中集成了应用软件功能的存储设备,它不仅具有数据存储功能,还具有应用软件功能,可以看作是服务器和存储设备的集合体[4].应用存储技术的发展可以大量减少云存储中服务器的数量,从而降低系统建设成本,减少系统中由服务器造成单点故障和性能瓶颈,减少数据传输环节,提供系统性能和效率,保证整个系统的高效稳定运行.
2.4.6 集群技术、网格技术和分布式文件系统
云存储系统是一个多存储设备、多应用、多服务协同工作的集合体,不同存储设备之间就需要通过集群技术、分布式文件系统和网格计算等技术,实现多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能,从而形成云状结构.
2.4.7 云存储的存储访问模式
市场上大多数云计算平台利用Web服务的接口,虽然,这是最灵活的方式,但有性能的影响.理想的情况是,企业云提供全部的三种访问存储的方式来支持不同应用架构.
2.4.8 云存储的可用性
在高端的企业级云计算中,存储系统够出来企业内的企业级存储方案,包括多路径、控制器、不同的光纤网、RAID技术、端到端的架构控制/监控,和成熟的变更管理过程.在低端的企业级云计算中,存储可用性与今天市场上云计算平台的服务水平相当.为了提供企业需要的服务水平,企业级云存储供应商必须利用健全的架构设计和被充分验证过的创新技术.
2.4.9 云存储的存储报表
当公司考虑将其全部或部分IT架构外包的时候,经常顾虑的是这些特定技术的不可见性.客户需要包括从容量和性能角度了解运行环境的状态.为了达到这个目的,通过用户管理界面,输出丰富的存储报表成为必须,使得客户对于存储高效的运行充满信心.
3 云存储安全性
尽管云存储以其低价及灵活诱惑着用户,同时也提供了一些诱人的优势.但是用户必须对存储在云中的数据以及提供云服务的供应商表示出足够的信任.但云存储带来的安全问题也应该引起重视.
3.1 云存储中的主要安全问题
(1)数据位置
在使用云计算服务时,用户并不清楚自己的数据储存在哪里,用户甚至都不知道数据位于哪个国家.用户应当询问服务提供商数据是否存储在专门管辖的位置,以及他们是否遵循当地的隐私协议.
(2)数据隔离
在云计算的体系下,所有用户的数据都位于共享环境之中.加密能够起一定作用,但是仍然不够.用户应当了解云计算提供商是否将一些数据与另一些隔离开,以及加密服务是否是由专家设计并侧试的.如果加密系统出现问题,那么所有数据都将不能再使用.
(3)数据恢复
就算用户不知道数据存储的位置,云计算提供商也应当告诉用户在发生灾难时,用户数据和服务将会面临什么样的情况.任何没有经过备份的数据和应用程序都将出现问题.用户需要询问服务提供商是否有能力恢复数据,以及需要多长时间.
(4)用户的接入
在公司外的场所处理敏感信息可能会带来风险,因为这将绕过企业IT部门对这些信息“物理、逻辑和人工的控制”.企业需要对处理这些信息的管理员进行充分了解,并要求服务提供商提供详尽的管理员信息.
3.2 云存储中安全解决
(1)加密文件
加密让用户可以保护数据,哪怕是数据上传到别人在远处的数据中心时.只要用户使用无法破解的密码,那么除了用户,没人能访问用户的敏感信息.
(2)使用信誉良好的服务
就算用户对文件进行了加密,有些在线活动(尤其是涉及在网上处理文件、而不是仅仅保存文件的活动)仍很难保护.这惫味着用户仍需要认真考虑自己使用叮些服务.专家们建议使用名气大的服务,它们不大可能拿自己的名牌来冒险,不会任由数据泄密事件发生,也不会与营销商共享数据.
(3)阅读隐私声明
几乎有关互联网应用的每项隐私里面都有漏洞,以便在某些情况下可以共享数据.大多数互联网应用提供商在自己的条欲中承认:如果执提出要求,自己会交出相关数据.但了解到底哪些信息可能会披尽,以帮用户确定把哪些数据保存在云计算环境、哪些数据保存在桌面上.
(4)使用过滤器
Vontu、Websense和Vericept等公司提供一种系统,目的在于监视那些数据离开了用户的网络从而自动阻止敏感数据.
4 结束语
基于云计算机的云存储技术虽然存在不稳定、不可信等问题,但相信在众多因素的推动下,基于云计算的云存储已经成为世界IT界发展的趋势,它涉及了各行各业方方面面的人们,最终将彻底影响和改变人们使用计算机和网络的方式.
参考文献:下载本文