科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网CIO与应用频道云存储中的数据迁移分析

云存储中的数据迁移分析

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

如今, 由于数据成本的不断飙升、技术管理人员的水平参差不齐等原因,云存储已经成为了各个机构数据存储的重要举措和发展方向。

来源:e-works 2013年6月18日

关键字: 数据迁移 云存储

  • 评论
  • 分享微博
  • 分享邮件

如今, 由于数据成本的不断飙升、技术管理人员的水平参差不齐等原因,云存储已经成为了各个机构数据存储的重要举措和发展方向。云存储作为云中的一项重要服务, 它通过集群应用、网格技术或分布式文件系统等将各种存储设备通过应用软件集合起来, 对外提供数据存储和业务访问。对于数据存储, 当我们从一个物理环境和单个阵列过渡到完全虚拟化的、高度动态的的存储环境时,需要面对很多问题。而数据迁移作为采用云存储方案中最为基础、关键的步骤。它将历史数据进行清洗,转换, 并装载到新系统,它是保证数据系统平滑升级和更新的重要环节, 也是将来系统稳定运行的有效保障。在整个云存储方案中占有了举足轻重的作用, 下面我们将对数据迁移进行探讨。

企业的数据要转向云存储,首先要做的就是明确被转移的数据范围。不能简单的把各个服务器数据库照搬放入云数据中心,这样会增加数据转移耗费的时间、增大企业的运营成本, 同时,数据冗余大、垃圾数据多会对系统造成很大的隐患,导致系统工作异常。这里建议各个企业把重要的核心数据保留在传统的烟囱式体系架构之中,对于一些类似于归档、提供查询等不是很重要的信息, 则可以放入云存储中心。这样,各机构就可以有效利用云存储按需付费的操作模式,将原本在固定数据存储设备上的投入转变为可以预算评估的运营成本,节约投入。

其次, 云的网络连接能力将是对数据云迁移操作的重要考验。企业与云数据中心之间数PB的数据的来回切换是比较困难的。根据企业数据量大小不同以及网络连接能力的高低,初次的数据迁移可能会持续相当长一段时间。这里,我建议各个机构在做数据云迁移前仔细检查本机构的网络情况并对内部网络的安全现状进行评估。虽然有些云供应商提出了用物理迁移的方法来代替网络传输数据,但是我们要看到, 由于工作性质的原因, 有些类似于病人病历、企业核心数据等敏感数据是不能被复制或采取物理迁移的方法带走的。鉴于此,这里我推荐两种方法: 当企业的数据吞吐量较大但是数据量不是特别多, 对传输延迟也没过多要求时, 云供应商可以提供从企业到供应商某个存储节点之间的私人链接, 方便企业迁移数据。企业可以根据自己的时间,在不影响公司正常运行的情况下做数据的转移安排; 当企业的数据可以提供拷贝, 那么我们可以采用sneakernet的方式,即:人工网络模式。将数据通过磁盘、移动存储设备等从企业服务器拷入到云数据中心或者从云数据中心拷贝出米, 目前一些云供应商为了加快数据的转移, 在给企业进行数据转移时会采取一些切实有效的人工网络模式, 例如某公司在给客户进行数据转移时会提供一个配置了双干兆级以太网接口的存储服务器, 当客户的数据拷贝完毕, 公司就会带走服务器并将数据拷贝到云数据中心。

再者, 为了将数据仓库有效地转移到云端,我们得适当结构化数据并使用正确的数据分析工具及迁移方法。目前,数据迁移主要有三种方式,即:系统切换前通过工具迁移、系统切换前采用手工录入、系统切换后通过新系统生成。结合目前各个机构的情况, 我们采用“系统切换前通过工具迁移”方式居多。传统关系型数据库中的数据要转移到云端非关系型数据库需要面临很多的问题,一是要解决如何从关系型数据库中快速有效地抽取大量的数据到云文件系统和数据库, 二是数据的转换问题。不管采用什么方法和策略,数据迁移后一定要对数据进行校验,检查数据的完整性、一致性等。

接下来, 我们要关心数据云迁移过程中的安全性问题,制定一套安全有效的数据迁移方案对数据迁移进行安全管理是十分重要的。不管企业采用什么安全性数据转移方案, 都必须注意数据的丢失和备份。对于敏感数据, 很多云供应是缺乏长期处理的经验的。况且数据在云服务中采用的是共享存储的方式,这会使得原本在传统烟囱式架构中很易于实现的安全策略在云环境下变得具有风险性。这里建议企业在选择云存储服务商时应仔细评估, 认真查看云供应商提供的安全防护措施和采用的标准,并结合自己的实际情况提出适当的调整和修改。再者,数据的备份工作都是必不可少的。还应该对备份的数据进行测试,确保当出现一些异常情况时备份的数据可以使用。虽然一些云供应商会做这一步操作, 我们还是建议企业自己备份,企业可以利用云供应商提供的备份或数据导出功能来做这个操作。不管备份在什么地方, 我们都必须确保在数据转移过程中受到严密的保护。并且要求云供应商提供监控功能,监控访问数据的人员以及对核心数据的加密。

最后,如果企业对当前云供应商提供的服务不满意需要更换服务商,如何在两个服务商的云之间转移数据?这应该是当前一一个很棘手的问题。由于目前云存储还处在初级阶段, 各个云供应商都采用自己的加密或传输机制以区别其它厂商。因此没有一个规范和约束的统一标准。很多云存储供应商无法直接将客户数据迁移到另 一家供应商, 当服务出现故障时,数据将返还给客户, 然后客户要冉找另一家云供应商, 或者将数据存储在本地服务器。这样会无形中增加很多繁琐的工作量。这里建议各个云供应商提供一组云数据管理的应用编程接口API, 可以实现不同云供应商之间的数据传输, 让数据迁移更为便捷。

通过以上分析我们可以看到完善的存储和数据管理策略才会让云存储变得切实可行。这里给要采取云存储的企业几点建议, 一是在迁移过程中必须确保包含了全部数据源。不能只专注某个局部数据,否则会导致数据的失真和信息最的不完整,为以后的使用埋下祸端。二是优化存储。企业在做数据迁移前必须要明确迁移数据的范围, 然后再从不同的数据库中把有用的数据提取出来进行智能分析。确保能整合一些孤立的存储和低效应用的存储,把存储状态恢复到最佳状态。三是尽可能的采用“自动化转移” 的方式。即我们在选择数据迁移工具时,必须确保它能加快数据转移, 减少人工干预, 提高迁移数据的效率和灵活性。四是应该根据不同环境有区别的复制, 这样可以尽可能的回收孤立的数据或者将他们移动到更有效的平台。

总之,合理的数据转移方案和配套的保障措施会让云存储越来越多的被各个机构认可。相信随着云技术的不断完善和提高,数据的云迁移将会变得越来越简单。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章