2004-06-21 14:47
引言
信息生命周期管理(Information Lifecycle Management)对企业用户而言是一种信息技术战略、是一种理念,而不仅仅是一个产品或方案。信息化建设中最关键的是数据,数据代表着信息,它可以构成企业的核心竞争力。信息从产生的那一刻起就自然地进入到了一个循环,经过收集、复制、访问、迁移、退出等多个步骤,最终完成一个生命周期,而这个过程必然需要良好管理的配合,如果不能进行很好地规划,结果就会是,要么是浪费了过多的资源;要么是资源不足降低了工作效率。
上图表明了一般情况下,数据引用概率与数据寿命之间的关系,这是理解数据应当如何管理的关键所在。为信息在它的整个生命过程中规划存储和迁移的方案是ILM的核心内容。
信息生命周期管理最初由StorageTek首先提出来的,经过EMC的发展和大力宣传,进入市场化阶段指日可待。然而我们应当认识到,信息生命周期管理作为一项企业信息化战略,不可能一蹴而就,而是一项相对长期的工作。当代的企业或多或少都已经有自己的信息系统,信息生命周期管理不可避免地要利用和继承企业目前所拥有的技术和体系结构。
EMC公司的三阶段论
EMC公司建议客户分三个阶段实施信息生命周期管理:第一步,实施自动网络存储,优化存储基础设施;第二步,提高服务等级,优化信息管理;第三步,实施集成式生命周期管理环境。
第一个阶段,各机构应消除直连存储,逐步将存储完全网络化,然后实现存储环境自动化。以便经济有效地融合和控制存储资源,保证业务连续性。
第二个阶段,服务等级阶段的任务是:在存储网络中建立服务等级层次,然后部署初始信息管理工具,按照企业要求的变化,将信息转移到相应的服务等级层次中。利用这些工具,许多机构都能够按照相关法规的要求,优化其信息管理资源。
前两个阶段是最后实现价值的基础,一般情况下,需要若干年时间才能实现信息生命周期管理的自动化。在这种集成式环境中,客户将能够在整个混合IT基础设施中贯彻企业战略精神,并在适当的时候从一个控制台为一定的服务等级提供相应的应用。
第三个阶段,借助信息生命周期管理,企业不但能经常自动制定决策,保证按照预定的业务准则和战略,以便在适当的时候,为适当的应用提供适当的信息,还能按照信息价值变化的敏感性实时地进行调整。
这三个阶段使IT人员能够利用各项新技能和新方法了解自身的信息需求,并随着实际经验的积累提高自动化水平。
ILM的实施方案--自动化ILM体系
我们通过分析EMC提出的自动化ILM体系,来看看整个ILM的实施方案。
一、总体结构
图1 自动化ILM体系
如图1所示,自动化ILM体系分为三个功能区域:
管理服务
通用服务
自动化模块
每个功能区域都包含很多的具体的服务模块。每个模块都清楚自己在整个自动化ILM系统内的位置和作用。通过一个称为ILM知识库的数据库来与其他服务共享基础数据。模块化的设计方式使得用户可以根据需要,自主决定ILM解决方案的组成。下面我们来讨论这些组成部分以及它们对于整个体系的作用。
二、管理服务
自动化ILM体系的管理服务提供系统的操作管理功能。如图2所示,管理服务由四部分组成:应用程序、信息组、存储网络和平台。每层中都包括一组管理服务,每个服务提供一项具体的ILM流程功能。譬如,LEGATO网络服务可向信息组层提供备份/复位服务。
图2 管理服务
管理服务可以单独安装,也可以与其他的服务组合使用。自动化ILM框架并不限制使用的具体产品,通过通用标准的使用,自动化ILM为通用服务和自动化模块提供了公开的接口。这些开放性的接口允许任何的第三方管理服务、用户接口或是业务应用程序可以利用自动化ILM系统内各部分的功能,并整合它们。为了得到支持,管理服务必须和通用服务层的衔接,并在自动化ILM知识库中注册名称和服务类型。基础数据用来描述业务应用、信息组以及服务水平协议。举例来说,一个第三方复制产品必须在知识库中注册名称和服务类型,并为信息组提供一个复制。
1、应用服务
应用服务负责业务应用程序及其运行的主机环境操作。该服务包括高度的资产可用性、自动化和监控服务。这些服务通过监控应用程序及其运行环境和自动化恢复与服务流程,从而改进信息存取的可靠性。譬如,LEGATO的自动化可用性管理工具就是一个提供资产可用度保证的服务。这一服务对受控程序提供故障处理和重新启动的功能,从而为用户提供近似连续的应用服务和信息服务。
应用服务层通过ILM知识库中的基础数据进行定义。包括全部自动化ILM服务可识别的名称和服务水平协议。
2、信息组服务
信息组为某一个应用程序或业务流程相关的所有数据子集提供一个特殊命名的对象。该 名称和信息组的内容将为所有自动化ILM服务知晓并共享。由于信息组是管理服务经常操作的对象,它就构成了自动化ILM环境中的基本管理单元。举例来说,一个名为OracleInfoSet的信息组可能包括与Oracle数据库有关的数据表文件。信息组的名称和它的文件内容和属性也由自动化ILM知识库中的基础数据进行定义,信息组提供了每个管理服务所需要的输入信息。举例来说,备份服务会向信息组服务请求获得它所要备份的文件列表。基于信息组的协议,它还决定备份的目的地、频率和保存期间长度。这种配置信息的能力为所有ILM服务提供了标准化管理的可能。
3、存储网络服务
存储网络服务为物理存储设备与应用程序之间提供了一个管理接口。这些服务构成了一个抽象层,简化并提高了物理存储设备的分配和管理能力。存储网络服务可以对固定存储和移动存储设备进行操作,并对不同设备类型的细微差别进行调整适应。
图3 存储网络服务结构
固定存储管理
固定存储管理提供磁盘虚拟服务和卷管理服务。磁盘虚拟服务负责将不同类型的硬件设备集中化,形成一个统一的存储池。它通过将底层存储网络的复杂性隐藏起来,从而大大简化了存储管理工作。而卷管理服务则负责对不同存储设备的特征进行平滑处理,为应用程序和文件系统操作存储设备提供了一个抽象层面,它们使得物理上分散的多个磁盘看上去就象一个完整的存储系统。信息卷是自动化ILM主要依赖的功能之一。信息卷与传统意义的卷十分相似,只不过它是专门为具体应用的信息组服务并以ILM服务为最终目的。譬如备份和复制服务正是通过信息卷来完成的。
移动存储管理
移动存储有着自己独有的管理特点。它们包括设备虚拟、设备共享和介质跟踪。存储网络服务的设计就是针对这三项困难的。设备虚拟服务为移动存储设备提供一个通用的接口,该服务为不同的磁带、光盘驱动器以及它们的自动换片装置提供数据通道和控制功能。它也是一个隐藏了不同接口差异和管理的抽象层,从而为信息组服务提供了一套有效利用移动存储资源的管理方法。
由于移动存储设备比较昂贵,而且如果它们仅为特定目标服务(比如归档和备份)的话,就无法得到充分的利用,所以人们总是想方设法要共享这些设备,譬如磁带驱动器和自动换片装置。为了解决这个问题,存储网络层提供一个存储选择服务。这个服务功能负责控制设备的通道,并确定在出现两个以上服务同时请求使用一个共享装置的时候,只有其中一个得到控制权。这使得多个服务共享存储设备成为可能,尽管它们实际上是通过分时执行来实现的。多个服务共享设备做法可以节省大笔购买存储设备的费用并提供每个设备的利用效率。
IT部门的人员经常为查找一个移动存储介质(磁带和光盘等信息介质)头痛不已,更不用说在该信息的生命周期各阶段实施有效的管理了。问题的关键就在于,当一个磁带或是光盘脱离了驱动器和自动换片装置以后,要继续跟踪它摆放的位置和决定它的保存期限就变得十分困难。正是由于及时找到这些介质很困难,将信息复制移动存储设备的方法很少得到充分使用。而这正是跟踪服务对于ILM流程的重要性所在。它负责跟踪每个媒体的内容和位置(磁带或光盘)并记录好每个介质位置移动的过程。这为快速查找和充分利用移动存储设备提供了坚实的基础。跟踪服务同时也为用户提供保存管理,让用户及时了解每个移动介质的可使用期限。 期满的媒体能够得到及时处理和再循环利用。通过管理这些介质的合理数量,从而降低了存储成本和费用。同时建立应用程序与移动存储设备之间的索引,大大提高了系统执行的速度。
检测和分配服务
这项服务涉及整个存储网络层的平台操作,帮助管理整个系统的硬件和软件存储资源。分配服务对从信息卷增加或移走的存储设备提供动态控制,而检测服务则检查当前可用的存储资源,并为可供分配的资源编制目录。这二项服务一起为磁盘虚拟和卷管理提供支持功能。当信息卷需要增加存储空间的时候,分配服务搜寻可用资源并为它分派新的存储空间。而分配服务依赖检测服务为其提供存储网络硬件的信息,包括磁盘驱动器、存储阵列、SAN、磁带驱动等等网络存储资源。检测到的存储资源由ILM知识库共享给其余的ILM服务,从而节省了系统冗余。
三、通用服务
通用服务提供了一组可以共享的功能,为自动化ILM其他功能部分集中处理一些统一的
通用功能方法和模型。通用服务提供下列:
1、服务间通讯,提供了自动化模块与管理服务之间的通讯渠道。这一服务定义一个通用数据格式作为通讯的基础。它也提供一个目录服务使不同应用之间相互了解。
2、安全服务,为所有服务提供证明和授权服务。为不同的用户提供一套统一的授权控制机制。
3、报告,提供了关于ILM服务历史统计和数据汇集的工具。通用报告系统允许用户组合不同的服务信息,并通过应用程序的视角,进一步挖掘信息背后的内容。举例来说,它可产生关于某个特殊电子邮件应用的全部信息报告。
4、事件管理,提供一个集中的知识库,为查看和保存系统内各ILM服务事件实施有效管理。
5、通用资源检测,检测可用的通用硬件和软件, 编制目录使所有自动化ILM流程可以共享它们。这将减少每个应用各自检测的工作,并为资源提供一个通用的名称。
6、监控和服务服务,为自动化ILM环境提供了自我修复的功能。这些服务结合在一起,为系统内各问题的识别和自动纠正提供了通用的方法。
7、安装和配置服务,提供一种安装和更新软件的通用方法。这一服务管理软件模块的新版本更新和整个系统环境中的分配。
8、许可服务,提供全部自动化ILM软件模块的许可协议控制、统一的管理和报告。
四、自动化模块
自动化模块利用自动化ILM系统的管理服务和通用服务提供的功能,来完成更高级操作。它包括:
1、协议管理模块
在所有自动化ILM给企业带来的效益中,协议驱动管理可能是受益最大的。这个自动化模块通过使用服务水平定义来自动化配置操作和服务水平管理,从而简化了ILM流程并降低了费用。协议驱动管理通过引入业务需求,为提供提供管理服务智能。
自动化ILM协议管理负责系统协议管理。如图 4 所示,协议管理使用协议和资源数据来控制和协调服务水平。
图4 协议管理
通过读取知识库中的分类基础数据和服务水平协议,协议管理确定对具体应用程序和信息组提供怎样的服务支持,它负责配置需求服务来保证协议得到贯彻。当服务水平配置完成后,协议管理通过监控低层管理服务的运行,来保证和验证它们的正确执行。
举例来说,如果一个应用被归入接受“标准的保护服务”类别,并且这一服务水平定义为应用数据每个晚上都需要备份,那么协议管理工具将检测备份服务的执行,确保信息得到正确的保护。如果应用数据没有被备份,一个可见的通知将送达管理控制平台,提醒管理人员,服务水平协议没有得到执行,同时一份电子邮件或短信将送到适当管理者的手中。
服务水平协议被用来定义广泛的管理能力,包括:
“关键的”核心应用程序,必须在20分钟内得到恢复。
对于业务来说“重要的”应用信息,必须每个晚上进行备份。
连续六个月不使用的数据可以被迁移慢速存储设备上
经纪业部门的所有电子邮件必须在WORM(写一次,可读多次的存储设备,譬如CD-R)上保存五年。
协议管理使得管理人员可以容易管理一组应用程序的服务水平,增加或降低服务等级,而修改服务水平协议可以影响所有受控的应用程序。这种能力将配置工作的复杂性简化了,并为ILM提供了量化的配置方法。
2、情景管理模块
当ILM的自动化程度越来越高的时候,用户可能会在启动服务水平协议前,想了解它的可能结果。而ILM本身也需要具备为服务水平目标(SLO)提供推荐协议的能力。这些能力就是我们知道的“情景分析”(what-if),或者说是预测模型。情节管理是帮助这方面的支持,它仰仗于对不同情景影响的叙述、探究和评估的能力。在某项改动之前,通过情景分析,可以使用户对改动后的影响有一个直观的了解,做到心中有数。
3、工作流管理模块
工作流管理负责协调复杂的ILM工作流程,这些流程经常需要人员操作的介入。工作流程管理需要自动化ILM系统与IT部门和业务部门共同合作。
图5 工作流管理
工作流程定义工作的顺序步骤和必要的批准环节,而批准环节就需要集IT部门人员的参与。譬如说,协议管理需要一个附加的存储空间,这将启动一个工作流请求。第一步是识别符合应用程序需要的存储设备,这可以由分配服务自动完成。在空间得到分配之前,这项需求的业务线经理拥有成本费用批准权。工作流程管理将请求通过电子邮件发往业务经理,业务经理批准后,存储扩展流程得以继续。
图5说明了工作流程控制操作的基本步骤。流程从请求(1)开始到达工作流管理系统,流程经理查询(2)自动化ILM知识库获得工作流程定义作为操作依据,而且启动第一个自动化流程(3)。该流程完成后,送出一个请求(4)给指定的用户并等候批准(5),接到批准后继续下一个自动步骤。
4、分类管理模块
对信息进行识别和分类是管理人员最头痛的一件事情。分类管理模块负责帮助管理人员
识别和分类已存在的应用程序和信息。使用信息检测技术,和分类模板来刻画程序和数据使用特征,分类管理模块帮助用户建立适合企业的初始分类,并对现有程序和信息的分类提供建议,然后用户可以接受、拒绝或修改这些分类建议。分类定义完成以后,通过基础数据记录在自动化ILM知识库中,可以被其他ILM服务调用。当企业环境中有大量的数据要处理,分类管理模块能够大大地提高信息分类处理速度。
5、服务水平管理
服务水平管理位于自动化ILM结构的顶层。服务水平管理监控并处理在业务部门和IT部门之间建立的服务水平协议(SLA)。服务水平管理维护应用程序、ILM服务以及业务部门之间的三方关系。服务水平管理获取业务部门对某项应用程序的服务水平需求,然后提供评估和跟踪功能,以确保该项服务水平得到实施。如果服务水平没有达到标准,业务部门和IT部门将接到通知,他们要么修改需求,要么纠正系统来解决问题。服务水平管理也提供“费用反馈”功能,它向业务部门报告该部门使用的IT资源和相关费用。
一些实施建议
从以上介绍,我们可以看到整个自动化ILM体系是相当庞大和复杂的。在实施过程中,
1、企业需要考虑自身的规模和实力。庞大的ILM系统显然更适用于信息量大,数据处理要求复杂的大企业和大集团,对于中小企业来说整体实施ILM,成本过大而又难以充分利用它来节约费用。
2、企业应当仔细分析自己特殊的需求。ILM体系是可以灵活组合的,同时如何利用好现有的存储设备也是企业的一大课题。所以在实施ILM之前,企业一定要自己,或是请专业服务公司对现有存储资产和IT资产进行全面的评估,在此基础上挑选合适的ILM模块来实现,从而达到事半功倍的效果。
3、当然,并不是说中小企业就不需要信息生命周期管理,中小企业也可以通过分析自己的需求,借鉴一下ILM的管理思想,因为ILM更主要的是作为一种管理方法为企业降低成本合提高效率服务的。同时,还可以考虑一下ASP方式,将存储服务外包,由一些专业数据中心来代为处理存储业务。
信息生命周期管理引入中国的时间还不长,还需要观察它的实施成功率,为企业的决策提供进一步的依据。
参考文献
1、 EMC,Information Lifecycle Management,An automated approach
2、 EMC,信息生命周期管理:存储界的新浪潮
3、 存储在线,聚焦“信息生命周期管理”
4、 Fred moore, Information Lifecycle Management,whitepaper