2002-12-23 11:20
建立一个元数据库
dwway 余友波
建立数据仓库一个重要的工作是元数据管理。元数据(Metadata)就是数据的数据,用于建立、管理、维护和使用数据仓库。元数据管理是企业级数据仓库中的关键组件,贯穿于建立数据仓库的整个过程。
通常把元数据分为技术元数据(Technical Metadata)和业务元数据(Business Metadata)。技术元数据是描述关于数据仓库技术细节的数据,这些元数据应用于开发、管理和维护数据仓库;业务元数据从商业和业务的角度描述数据仓库的数据,提供了良好的语义层定义,业务元数据使业务人员能够更好地理解数据仓库分析出来的数据。
元数据贯彻于建立数据仓库的整个过程,不只是ETL过程需要元数据的支持。
元数据库是用于存储元数据的地方,元数据库最好选用主流的关系数据库管理系统,支持CWM标准。一个元数据库还包含那些用于操作和查询元数据的机制。建立元数据库的主要好处是提供了统一的关键数据结构和业务规则,易于将企业内部的多个数据集市有机地结合起来。特别是现在一些客户倾向建立多个数据集市,而不是一个庞大无比的数据仓库。
可以考虑在建立数据仓库(或数据集市)之前,先建立一个用于描述数据的、用于应用集成的元数据库,做好数据仓库实施的初期支持工作,对后续开发和维护有很大的帮助。
在整个数据仓库环境中,元数据管理工具可以从各个数据仓库组件中收集元数据,存储到元数据库中,然后向业务用户传递和展示正确的信息。
元数据库保证了数据仓库数据的一致性和准确性,为企业进行数据质量管理提供数据依据。
本文原载于中国计算机报