数据仓储建设的优劣,很大程度上依赖于对不同数据库元数据字段分析的准确与否以及映射关系的建立是否恰当。推广工程元数据仓储的建立,要对百余个外购数据库、自建数据库的元数据进行整合。这些数据库的元素定义各不相同,尤其是外购数据库的元数据与图书馆界的元数据区别更大,不同类型资源用不同的元数据标准实现对资源的描述,不同层次的应用和不同的需求也产生不同的元数据格式。同时为了使用方便,一条元数据兼具描述型、管理型、结构型功能。但出于技术保护的需要,厂商一般不愿提供数据库结构、元数据语义等信息。主要提供用户浏览。
另外,在*终应用的导航分类的设置中充分考虑资源分类问题,由于仓储与信息来源在物理上是分离的,因此必须要解决元数据的同步更新问题,确保用户在元数据仓储中查询到的是各个信息源中的*新资源。在元数据更新方面遇到的问题主要有:(1)更新周期的问题。为使元数据仓储中的数据能尽量和原始数据库中的数据保持一致,元数据仓储的建设者希望更新周期要短、更新频率要快,但这无疑给元数据的贡献者增加了很多难题。(2)数据一致性问题。在实际操作中,我们发现,数据库建设者经常会对所建设的数据库进行变动,很难保证数次提交数据的一致性,如:会增加或删除部分字段,会变更元数据提交的格式等。
网页评论共有0条评论