Copyright (C) 1999-2009 Chinabyte.com, All Rights Reserved 版权所有 天极网络
渝ICP证B2-20030003号 商务联系、网站内容、合作建议:010-82657868
这周我们的话题还是与重复数据删除有关。
上一期《存储e周刊》,我们为您讲述了这个混乱、复杂的重复数据删除市场,理清了IBM、惠普、Sun、Diligent、昆腾、Data Domain、飞康以及其它业内公司在重复数据删除技术市场上错综复杂的OEM、分销与授权协议。我们甚至由此激发出了飞康公司此前颇有些低调的与Sun在重复数据删除领域合作的细节:飞康公司在新闻稿表示,Sun公司在其Sun StorageTek VTL Prime产品中,应用了飞康重复数据删除解决方案,这表明,在Sun与飞康的战略合作伙伴关系中,实际上也包括重复数据删除技术——这一点需要在本周的文章中予以补充一下。
我们这周,不会再去谈重复数据删除市场的市场格局了——之前我们已经谈的够多了,我们也不想去谈各家的重复数据删除技术孰优孰劣,因为很显然,每一种技术的出现都有其适合伸展的市场,即使这个市场有大有小,我们也必须要以辨证的看法去看问题,而不能一杠到底,所以,最后的答案往往是这样的:“哪一种重复数据删除技术比较好,还是要看用户的实际情况。”
所以,本周我们想谈另一个与重复数据删除技术有关的话题:你是否能够在主存储上应用重复数据删除技术?对于这个问题,我们希望我们能够给予一个明晰的答案,哪怕仍然是一个“一分为二”的答案,我们也力图将分开的“二”,分的更加明确一点,就像楚河汉界那样。
主存储:是能随便动的么?
Storage Switzerland 及 Storage Switzerland Events的创始人兼主席George Crump认为,在主存储上进行重复数据删除可不是闹着玩的。
这位存储专家认为,主存储是对性能十分敏感的而且生怕出现问题,如果因为执行重复数据删除而影响了生产环境的性能表现,企业是肯定不能接受的,因此,重复数据删除技术必须是高效快速的,它不能影响性能,或者在重复数据删除的过程中绝不能有任何的“性能波段”。而且,还涉及到另外一个问题:主存储都是生产系统,存储在上面的数据会是“静止”的么?
答案肯定是否定的,既然是生产系统,就肯定是在线系统,那么,肯定会是经常访问的,但是,重复数据删除技术与压缩技术有一个共同的特点,那就是压缩技术的压缩比越高,所需的解压缩的时间越长(用WinRAR的人肯定都见过标准、最快、最好等多个选项),重复数据删除也是如此:重复删除的水平越高,数据读回时对性能的影响越大
除了在性能上的担忧之外,主存储应用重复数据删除是否会出问题也是我们不得不考虑的问题,当然,我们在此没有怀疑任何一家重复数据删除公司会错误的删除数据,只是我们想到一个问题,在任何一个IT系统中,部署的应用越多,系统的风险也越大,那么,用户到底做没做好准备去再在其系统上加装一个系统?尤其是,这个系统将会将会在每一次存储和读取数据时现身,这是另外一个需要考虑的问题——或许用户可以尝试重复数据删除卡,也是个不错的选择,只是我们是不是要去考虑一下标准化和兼容性的问题呢?目前我还没有遇到这个产品的用户,或许过几个月会有答案。
主存储:有多少的“删除”余地?
重复数据删除出生的初衷是什么?是因为有很多像我一样每天做备份,而且不仅做一个备份的用户——自从我的移动硬盘丢失过一次数据之后,我每天都要把新文件在移动硬盘和闪存上存两份,对于许多企业来说也是这样,像工商银行这样的金融用户,几乎每天的交易数据都要存三份:本地备份系统一份,长期归档系统一份,异地的灾备中心还要有一份,有时候,甚至还会另备份一份在其它备份系统上,因为他们的数据太宝贵了,如果丢失,造成的损失绝不是个小数目,但是这里面有个问题:过多的备份,尤其是很多用户的全备份(而不是增量备份),让存储系统不堪重负,所以才想起去压缩,去删除重复数据。
但是生产系统显然不太一样。
首先,生产系统是独一无二的,我们的生产系统中,能够有多少数据是重复的?10%?20%还是50%,很显然,除了抄送了多人的电子邮件和某些标准格式的调查表之外,或许没有太多的数据让我们去删除重复数据,像George Crump就觉得,对于生产数据来说,尽管可能会有一些重复--比如同一个数据库的“额外”副本,但大多数情况下,数据冗余并不像备份或归档那么多。
随着基于磁盘的归档和磁盘备份变得更加普遍,主存储的冗余数据更少了。过去,保存数据库或文件的额外副本的价值是“以防万一”。现在这些副本,可以很容易地发送到磁盘归档或磁盘备份设备当中。(这是一件好事! )注意:当前用户期望看到的存储效率提升20倍或更多,在主存储就不要想了。一个更现实的目标可能是3倍,最多5倍。
另一个现象是:大部分的主存储的数据已经是预压缩格式。文件,如图片,媒体文件,和特定行业的数据集,是已经预先压缩过的。即使最新版本的流行的office应用也是预先压缩的。这些预压缩文件,往往代表了企业增长最快的最大的数据集。为应对生产数据的“独特性”和“预压缩”,一个成功的主存储精简技术需要“挖的更深”。内置的数据精简(重复数据删除)在备份和存档有明显的优势,但生产存储中,带外管理会更有效。
当然,在主存储上,我们仍然有一些关于重复数据删除的建议。
