多年以来,我的许多客户都碰到一个令人烦恼的问题,即他们必须不断地投资购买容量越来越大的存储系统。每次当他们根据原先的存储需求增长率来建立一个存储系统时,最终的结果都会使他们失望。存储需求的增长趋势是一种令人讨厌的“间断平衡”模式,即沿着一条正常的曲线增长,但是在某些时间点上会忽然产生爆炸性的增长。追踪那些忽然呈现爆炸性增长的存储需求的主要来源,将可以使我们更准确地估算存储需求,由此还可以节省日后重新规划存储容量的工作。
存储需求的主要来源
当我检查我的存储项目记录时,我意识到了问题所在。我的原始记录包含了大量关于存储系统使用的信息。通过这些信息,我们估算出了多年来的一个单一的增长率。不幸的是,我们犯了数据分析中的一个典型错误,把一个一段时间的整体数字当作一个实时样本中的数字。当然,随着时间的推移,这两个数字会趋于一致。但是,在一些非凡的情况下,两者会呈现巨大的差距。
正是在这两个数字不一致的时候,我的客户碰到了麻烦。例如,一个客户根据过去十年的数据,猜测在未来的四年里,每年存储需求将增长20%。不幸的是,两年后,他的商业用户却要求他的存储系统扩容100%。当他查看短期而不是长期趋势时,他发现这个要求在合理的猜测范围之内,但他已经无法及时满足这个需求了。我在搜集关于这件事情的信息的同时,与他一道尽快地安装了额外的存储系统。
在上述的特例中,我的客户没有考虑到公司以6年为周期的转换ERP解决方案的影响。在过去的30年中,他们每3到4年就要安装一套新的系统来支持公司的运营。由于存储小组既要维护“旧系统”,又要发展“新系统”,所以在每个周期中开始备份的时候,存储需求都要增加一倍。
通过深入研究,我发现大多数客户都有类似的存储需求增长周期,假如排除无关用户的话,正常的数据(例如文件,数据和电子邮件)相对呈线形增长。但是,大多数公司的存储需求都有间隔性的高速增长,这些高速增长是由依靠于商业周期的一些特定项目引发的。
这些项目包括但不限于:
安装新系统(例如电子邮件系统,新的档案系统)。这需要在一段时间内,对多种现有数据集进行操作。
新的开发方法的产生。每次开发小组分离或创造出一种新的方法,他们都要为复制的数据要求额外的存储空间。开发人员越谨慎,他们就需要越多的存储空间。这种存储需求一方面来自开发人员想要保留历史的开发数据,另一方面来自他们需要多版本的数据进行开发和测试。
由审计和行业检查所带来的数据收集和恢复。处于某个治理机构监管下的客户,在审计或行业检查前的三个月到一年,为了达到监管的要求,都有可能产生存储需求的忽然增加。
此外,许多公司也受到了周期性、相对不可猜测的、活动数据库规模膨胀等因素的影响。在每种活动数据库的开发环境下,数据库的规模会偶然因为编码错误而膨胀。除了这方面之外,也可以通过猜测来避免所有这些错误对数据产生影响。然而,即使猜测到了错误的后果:24小时之内,数据库规模膨胀超过50%。在大约一半的这种案例中,我们也无法将数据库恢复到膨胀前的状态。
估算公式
除了说“你至少需要十年的历史数据,才能正确地估算你的基于周期的而不是基于合计数据的存储需求”,上述的内容还告诉了我们什么?假如我们没有这些数据或我们没有时间去得到这些数据,那我们应该怎么办?
幸运的是,从我面前的数据中,出现了一些单凭经验猜测的方法:把每个开发通道扩大四倍;把每个邮件系统扩大三倍;假定所有的非IT数据库每年以100%的速度膨胀,不管它们膨胀与否。非IT数据库的存储需求一般不会发生突变,除非碰到并购(不论并购别人还是被人并购),这时,存储需求要么因为经理人清除文件而变小,要么因为人们创建文档而膨胀。
真正的要害是治理开发通道的增长。根据你公司的开发方法和档案要求,你可能要在一到三年之内,为任何地方治理六个版本的当前数据(开发,质量治理,当前两套同时运行的系统)。每个通道至少需要两倍于它现有的容量;倘若你需要进行快速拷贝和恢复,更好的办法是使系统运营状态保持在最大负荷的25%左右。
在大多数机构,其它的存储需求(例如电子邮件,较小的数据库和文件)给我们找的麻烦要少得多。电子邮件的增长相对可以猜测;文件增长也是一样。由shadow erp构成的较小的数据库通常在IT经理的监视之下,所以你可以依靠“开发者”来控制它们。假如他们没有这样做的话,一些运行适当的数据库控制工具的友好提醒,可以为IT团队赢得某些在其它情况下可用的额外政治资本。
间断性的工作计划
对于有规律的间断,你不必马上解决它们。当你把握了它们何时会发生,你就可以把它们的需求列入一个顺延的2至4年的扩展计划中,而不是进行忽然的采购。当进行计划合并时,把额外的容量计入下一年的预算。这样做,既能延缓开支,又能向决策者表明你有清楚的未来计划。
假如你最近建立了新的档案/备份/存储解决方案,回头去寻找那些间断点,它们会给你提供对未来有价值的建议。当那些不可避免的“突发”存储需求来临时,你可以冷静地使用现存的和可用资源来安排你的计划,从而满足那些需求。这样就避免了许多让你头痛的事情,同时使你的基础设施治理方式从被动转向主动。