快捷搜索:

大数据时代的冷数据该怎么处理

大年夜数据期间,人们的生活、事情都在数据化,时时刻刻都有新的数据孕育发生,数据正在呈几何倍数爆炸式增长。若何存储、治理和应用这些数据,是今世企业面临的难题。

Forrester申报显示,组织中常常有多达73%的数据未应用,但很少稀有据被丢弃。这些组织仍旧保留旧的但很少或从未造访过的数据,缘故原由主如果:

新的阐发类型,比如经久趋势阐发可能会使这些险些被遗忘的数据变得需要。

诉讼的可能性,这可能要追溯到几年前的旧文档和电子邮件。

这些数据可以被称作“冷数据”,顾名思义,冷数据等于那些不常常造访、但又无法删除的信息,比如用户在社交媒体上存储的大年夜量信息、企业备份数据、营业与操作日志数据、话单与统计数据等信息。

组织在这方面面临的寻衅是,若何有效治理此类数据的存储,纵然大年夜部分光阴组织看不到也用不到这些数据。

此中一个问题是,存储被IT界视为一种商品。存储很便宜,以是没有人会斟酌在必要的时刻订购更多的磁盘。

然则存储真的便宜吗?

带宽和根基架构资源赓续增长,而这些资源平日必要支持更多存储(以致便宜的存储)以及包孕大年夜数据的更大年夜文件。更多的存储空间必要更多的资金用于处置惩罚、收集和职员等支持资本。与存储相关的资源会增添的另一个缘故原由是,保留大年夜型文件的多个版本时劫难规复和备份历程变得繁杂。

结果是,必要为很少应用或根本不应用的数据留出额外的存储空间,尤其是大年夜数据的必要越过了存储空间的规模。这增添了总体IT支出。

公司可以采取以下四个措施来有效地治理其冷存储数据。

1、应用便宜但靠得住的冷存储

对付很少应用或存档的数据,慢速硬盘驱动器和磁带是最常用的存储介质。紧张的是按期测试磁盘和磁带,以确保它们事情正常。别的,要避免将旧的驱动器和磁带降级为归档和数据备份功能——这些资本仍旧有应用寿命,假如它们太旧,则更有可能呈现故障。

2.斟酌基于云的冷存储

假如您不想在现场或物理外部举措措施中存储大年夜数据,则可以选择应用云。基于云的冷存储有很多选择,您可能会找到一种存储所有冷数据最相宜的选择。

3.对冷数据进行年度评估

纵然您已经有存储冷数据的措施,也并不料味着您应该存储所稀有据。假如您还没有,您可以与治理层和司法部门商榷确定应该保留哪些数据、丢弃哪些数据,每年评估一次即可。

4. 应用数据/存储自动化

大年夜多半存储供给商供给分层的数据存储,这种存储是经由过程人工智能实现的。人工智能会采纳您定义的存储数据的规则,并自动利用它们来确定命据的存储位置。

数据存储的主要层是内存存储或固态驱动器,您常常造访的数据存储就在此中。不常造访的数据可以存储在更便宜的硬盘存储的二级数据层上。

很少应用的数据或冷数据将被分配给速率较慢的磁盘驱动器或磁带,这些磁盘或磁带是您最便宜的存储介质。经由过程使用这种自动化,您可以确保常常以最低的资源存储冷数据的同时,始终可以将大年夜量热数据供给给用户。

停止语

大年夜多半大年夜数据存储治理策略的重点是让用户随时可以实时得到数据,但这也增添了存储和处置惩罚的预算支出。公司可以经由过程治理很少应用的数据来赞助抵消这些较大年夜的支出,这样就可以以最低的资源存储这些数据。对付这些数据,冷存储是一种安然、靠得住、经济的办理规划。

滥觞:IT168企业级

您可能还会对下面的文章感兴趣: