收藏本页 | 设为主页 | 随便看看 | 手机版
普通会员

上海隆凯仓储设备有限公司

供应分类
  • 暂无分类
联系方式
  • 联系人:
  • 电话:0512-81638092
  • 邮件:lkcc@qq.com
  • 传真:-
荣誉资质
  • 暂未上传
您当前的位置:首页 » 新闻中心 » 鉴于子数值仓储的书籍消息来源控制探讨
新闻中心
鉴于子数值仓储的书籍消息来源控制探讨
发布时间:2011-10-19        浏览次数:615        返回列表
 

  1 引言  经过多年的信息化建设, 图书馆积累了大量信息资源, 如何有效开发利用它们已成为图书馆当前信息化工作的重点。目前国内图书馆信息资源的现状有以下特点: ( 1) 资源类型多样, 如关系型的数据、早期的网状和层次数据库中的数据等; ( 2)资源环境异构, 不同的信息系统使用不同的数据库。即使同是关系型数据库, ORACLE 数据库和 SQL SERVER、DB2 之间也都存在差异; ( 3) 资源格式不同, 即使同是音频信息, 也可能有 mp3、wav或者 rm格式。

  因此, 上述资源现状决定了图书馆已有信息资源普遍存在标准缺乏、冗余严重、数据质量较差等问题, 而读者对信息资源利用的需求又普遍具有动态性、多样性和专业性等特点, 所以图书馆信息资源开发利用是一项比较复杂的任务。为此, 结合当前国内图书馆信息资源实际情况, 并借鉴国内外信息资源开发利用的经验, 本文提出了一种基于元数据仓储的信息资源管理方法, 同时设计了图书馆信息资源管理系统。

  2 相关研究工作在信息资源建设中, 以元数据描述框架为支撑的信息集成、检索、资源共享等信息服务系统的形成, 实现了科技信息资源从无序状态变为有序状态,为各种数字化信息单元和资源集合提供了规范描述方法和检索工具, 也为分布、多种数字化资源构成的信息体系提供了整合工具与纽带, 因此, 利用元数据管理信息资源是实现其检索、交换、共享、开发利用的有效途径。根据对元数据的不同定义和描述, 信息资源元数据主要分为四类,对数字图书馆中处于生命周期不同阶段的信息资源的管理机制进行描述, 是元数据在数字图书馆建设中的又一重要应用领域, 人们把这一类元数据称为管理性元数据。管理性元数据对信息资源采集、加工、利用过程的管理信息加以规范化、开放性的揭示, 有助于用户或第三方系统方便地、无障碍地识别、选择与共享本系统的信息资源与相应的服务,有助于各个信息系统在安全机制保障下, 有效地交流管理机制与政策, 促进信息系统不同层面以及不同信息系统之间的互操作。

  但是由于资源特色、面向用户、服务形式不同,这些系统所依赖的元数据是根据需要各自建立, 形成了不同的定义和应用规则, 即使使用某种标准的元数据, 大多也进行了不同的扩展, 形成不同的应用格式。随着信息资源网络化和信息化的发展, 众多的分布、异构、自主、变化的信息资源和服务系统构成了越来越开放的信息环境, 对已建成的信息化资源的管理提出了新的挑战。

  不仅包括全面著录描述信息, 还包括权利管理、电子签名、资源评鉴、使用管理等方面信息资源保护与长期保存支持对资源进行长期保存不仅对资源进行描述和确认, 还包括格式信息、制作信息、保护条件、转换方式、保存责任等内容因此, 基于元数据仓储技术, 本文提出了一种信息资源管理方法。首先, 借鉴图书分类目录管理的方法对信息资源分类, 建立用户信息资源目录, 与政府信息定位服务体系 ( Government In formation Locator Service, G ILS)相似, 该目录构建了科学、合理、实用的用户全局信息体系架构; 然后利用元数据仓储和数据交换平台, 实现对信息资源目录的创建、检索、更新以及权限管理。基于该方法, 设计了一个信息资源管理系统。

  3 系统总体结构及工作流程3. 1系统总体结构整个系统由 5部分组成, 下面分别进行详细介绍。

  3. 1. 1信息资源目录管理器。信息资源目录管理是整个系统的核心, 其功能主要是管理信息资源目录。信息资源目录主要实现两个不同领域的抽象: 一方面从根目录开始, 按照大类、小类逐步延伸到元数据, 把信息从业务管理逻辑向数据和技术逻辑逐步抽象后映射到元数据; 另一方面是反过来, 信息资源目录又将元数据向业务管理方向抽象。通过这种抽象, 底层数据就变为业务人员熟悉的知识, 从而帮助他们迅速定位所需信息。尽管业务人员和管理人员比较熟悉业务和管理领域, 但他们一般不了解元数据, 因此, 当业务人员与管理人员想解决一些问题时, 找到解决问题的相关信息比较困难, 而目录分类则有效填补了他们与元数据之间的鸿沟。

  目录管理器一般应具备以下五种功能:根据信息资源目录, 自动生成信息分类树, 同时将对应元数据包含在相应子节点中, 用户从而通过分类树找到所需信息;满足不同目录视图的构建, 支持设计并生成适合不同用户视角的目录视图;实现对元数据仓储中元数据的检索, 帮助用户发现相关数据的信息 (元数据 );显示与被检索的元数据相关字段以及对应数据, 支持图形显示功能;对信息资源的使用情况进行统计分析, 发现用户使用模式。

  除上述功能外, 信息资源目录管理器还需要实现用户管理、权限管理等功能。

  3. 1. 2 元数据仓储。元数据仓储是根据公共仓储元模型 (即关于模型的模型 ), 实现对元数据的存储和管理 (包括查询与更新 )。其主要功能是依照给定的条件采集元数据, 形成一个元数据仓库, 并维护本地数据与图书馆数据的一致性。

  元数据仓储中的元数据是标准化的, 能有效支持数据的交换与共享, 其主要由以下几部分信息构成: ( 1)标识信息。对元数据进行标识, 包括标识名、别名等; ( 2)类型信息。不同信息资源有不同的类型信息, 例如, 数据库中的属性, 其类型信息包括字段长度、数据类型等; 对视频资源, 其类型信息包括媒体格式、大小等; ( 3)管理信息。管理信息是关于元数据管理、保护和存储的信息, 包括密级、生产者、管理者、创建日期、有效时间等信息; ( 4)业务信息。通过业务信息字段内容, 实现元数据逻辑分类,支持树形结构目录, 从而进行高效检索, 包括主题、关键词、分类类别等。

  元数据仓储得主要工作过程如下: ( 1) 根据设定的图书馆数据库访问参数、采集条件和更新策略,生成一个采集任务; ( 2)启动采集任务, 将收割获得的元数据存储起来, 并为这些元数据记录建立必要的索引 (命名为 ID索引 ) , 为将来信息检索做好准备; ( 3)执行更新策略, 同步更新本地的元数据。

  根据元数据仓储模块的主要工作过程, 可以划分为如下几个子模块: ( 1)条件验证模块 ( V alida tion) : 接收管理员的任务配置条件, 并检查条件的合法性; ( 2 )元数据采集模块 ( Collection) : 登陆远程图书馆的数据库, 按照指定的协议构造采集语句,并将获取的元数据存在本地缓冲区; ( 3)存储模块 (S torage) : 将缓存中的元数据记录保存在本地, 并建立 ID索引; ( 4)策略管理模块 ( Strategy) : 管理更新策略, 满足更新条件时负责启动相应的更新模块;( 5)元数据更新模块 ( Update) : 与元数据采集模块对应, 保持本地数据与远程数据的一致性; ( 6)调度模块 ( Scheduler) : 负责以上模块的协调运作。

  元数据更新模块与元数据管理模块具有某些相同的功能, 它们都可以登陆到远程的数据库, 但构造的查询语句不同, 这又与选择的协议有关。调度模块将管理员的命令导向正确的模块。策略管理模块管理已经登记的策略, 满足更新条件时启动更新模块。

  3. 1. 3 元数据著录工具。人工著录元数据仓储中的元数据, 工作量大且易产生错误, 所以信息资源管理系统需要自动化的元数据著录工具, 其主要完成以下任务: 根据业务需求目标自动抽取结构化数据的元数据, 并进行映射与转换以及规范化元数据。

  自动生成标识信息显示给用户, 并允许用户进行修正。利用信息资源目录树选择元数据所属节点, 确定其业务管理类别, 允许用户添加关键字、划分主题等。

  3. 1. 4数据交换平台。数据交换平台可有效降低数据交换代价, 因为基于数据交换平台, m 个相互交换数据的系统只需要 m 个适配器, 否则, 需要定制m( m- 1) /2 个双向抽取程序才能实现这些系统相互之间的数据交换。数据交换平台利用用户给定的元数据, 通过适配器从对应系统中获得数据并对其进行规范化, 然后返回给目标系统 (管理分析系统或目录管理器 )。

  3. 1. 5信息资源利用模块。信息资源利用模块主要参考信息资源目录对信息资源重组, 并将其应用到新领域, 主要完成以下功能:将满足条件的重要的、高质量的数据导入管理分析系统, 利用 OLAP、数据挖掘等技术进行分析, 辅助进行科学决策;将满足条件的数据进行集成后导入新的业务系统, 提高开发新系统的数据质量, 从而缩短开发周期, 降低成本; 实现数据的逻辑集中, 形成完整的图书馆信息体系结构和全局信息视图, 指导图书馆进行信息化建设的规划和施实。

  3. 2 工作流程借助于图书馆信息资源管理系统,用户可方便管理和利用其拥有的信息资源。针对一项信息查询任务, 本文所提出的信息资源管理系统整个工作流程如下:( 1)通过分类树探查或使用关键字检索, 显示与信息分类对应的元数据, 看其是否满足需要, 若满足继续下一步, 否则返回第 ( 1)步;( 2)在元数据仓储中找到对应的元数据以及定位信息, 并对使用情况记录和统计, 利用使用频率确定重要数据;( 3)利用数据交换平台到源系统中获取数据,然后返回数据给数据交换平台, 交换平台根据数据标准进行规范化, 返回给用户或管理分析系统;( 4)将规范化后数据返回给信息资源目录管理器, 若满足需求则返回结果, 否则返回第 ( 1)步。

  4结论与展望本文基于元数据仓储技术, 并使用灵活的目录设计和管理方法, 构建了具有全局视图的信息体系架构, 提出的信息资源管理方法可以很好地实现图书馆信息资源的逻辑整合。