图书馆数字资源模板(10篇)

时间:2022-02-28 10:01:22

导言:作为写作爱好者,不可错过为您精心挑选的10篇图书馆数字资源,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。

图书馆数字资源

篇1

鉴于数字图书馆的形成和发展是建立在传统图书馆建设基础上的原因,其人力资源管理的观念依然存留着传统图书馆人事管理的影子。

在我国现阶段数字图书馆人力资源管理中,“人本主义”仍然还只停留在表面的认识阶段。造成这种现象的主要原因有以下几个方面。其一,我国是人口大国,人力资源极其丰富,人力资源质量的两极化特点明显,平均的质量水平较为低下,且传统图书馆人力资本的可替代性也较大,这给我们造成了“找人容易,随便一个人便可从事图书馆工作”的表面现象。其二,在传统图书馆中,图书、设备等图书馆组成要素的作用环境是确定的,效率也是线性的,而人力资源要素的作用又是不显著的,因此投资于人力资源要素的风险比投资图书、设备要大得多。对于传统图书馆来说,其工作的中心还是更偏重于确定的、有形的物质要素。

而在数字图书馆中,人们对人的价值的感受才第一次真正超过了对物质要素(特别是图书、设备)的感受。人们越来越认识到,给数字图书馆创造价值的不是先进的设备,而是优秀的人力资源要素。由于网络的畅通,信息传播速度的加快,数字图书馆的竞争也早已转变为数字图书馆技术专家能力的竞争,主要体现在技术专家在信息内容组织、数字化加工、图书馆馆藏数据库服务、数字图书馆技术总体解决方案、数字图书馆资源库建设与应用服务等方面的经验与专业素养。

二、缺乏有效的薪酬福利体系

从大环境看,由于我国人力资源要素市场的分割性和残缺性,未能形成一个标准范式的薪酬福利标准和薪酬福利制度,图书馆的工资政策基本上是“因岗设酬、因职付酬、因职称给工资”,同先进国家相比,我国数字图书馆员工长期处于低收入水平。从历史上看,由于多年形成的惯例,图书馆报酬体系是货币与实物相结合的形式,这也在不同程度上影响了数字图书馆。

另外,在现实的经济、政治背景的复杂关系下,薪酬福利制度具有太强的激励色彩和其他因素,使得数字图书馆管理阶层不敢妄动。因为工资具有地位象征的意义,提高工资对于提高后的“高薪”阶层而言,工资数目的大小就具有了主观感觉上的效应。但如果薪酬福利水平过低,就会使灰色收入成为数字图书馆员工收入中的重要部分。

所以,对于数字图书馆而言,如何利用宏观政策背景以及信息市场环境,结合实际情况,设计出一套有效的薪酬福利体系已经成为其发展的一个重点。

三、缺乏完善的激励约束机制

篇2

[中图分类号]G2[文献标识码]A

[文章编号]1007-4309(2012)02-0103-1.5

一、我国图书馆数字资源典藏管理存在的问题

数字资源组织中的规范控制问题。所谓数字资源组织,是指对摄取的数字资源进行分析、选择、标引和处理,为数字资源提供有序化的结构,使之形成一个有机的整体。数字资源在有序化的基础上必须有足够存储空间和简单快速的存储算法,从而有利于对数字资源的快速存取。根据关联性、结构性和功能性的方法原则,在对数字资源的组织中,需要揭示数字资源的关联、层次和功能的组织,即如何反映数字资源对象间的结构和语义的内在关系,来保持数字资源对象学科的完整性,同时对数字资源进行多维整合,体现资源整合的结构性和层次性。这需要运用一定的技术手段和方法,才能使数字资源得到优化组合,取得最好的组织结构和功能。

数字资源典藏管理存储问题。随着馆藏资源建设中产生的数字对象越来越多,海量数据的生成和积累意味着馆藏知识财富的增加。但也意味着这些宝贵的馆藏记录和文档面临因技术过时和载体变质而引起损失的危险。Jeff Rothenberg指出,“‘21专家组’的研究给出了令人印象深刻的结论:目前根本无法对数字信息存储的效果做出任何保证”存储问题在档案馆和图书馆表现得尤其突出,其突出问题表现在:数字对象被永久存储于物理媒体并不等于具有持久的可用性。数字图书馆联盟指出了数字对象的存储和永久性之间的一个重要区别:存储涉及一个对象的技术寿命和质量,持久性是一个更广泛的概念,包含了存储,但也指对象是否仍然在将来以任何形式存在。持久性暗含了对对象维护的概念,同时也意味着对其可访问性的持续保持,否则会缩短数字图书馆的平均寿命,降低被存储资源的可访问性。存储策略、存储框架、政策、法律等相关问题是数字资源存储中需要解决的主要问题。

数字资源典藏管理的权限控制机制问题。目前,仍然有相当一部分图书馆没有专门的典藏部门,典藏工作只是作为采编工作的一部分,即使是设立了专门典藏部门的图书馆,其典藏部门的管理工作也多是有责无权。从知识产权管理的角度,如果典藏权不明确,那么馆藏资源的调拨、分配、清点等各项工作的监督,以及协调馆藏建设与用户工作部门在馆藏资源利用上的关系等将无法进行,况且在网络环境下,典藏工作的内涵增加了,其职能也必将得到延伸,典藏管理权限的不明确将成为新时期典藏工作职能发挥的一大障碍。从以上分析已经看出,在对数字资源摄取、组织、标引、存储过程中必须获得授权才可得到典藏的权利。但数字资源涉及的权限关系比较复杂,因此有必要针对具体问题分析具体的权利归属。

二、数字资源典藏管理政策及内容

数字资源典藏管理的内容及其定位。传统典藏是文献加工过程中的最后一个环节,典藏质量的高低决定着文献布局是否合理。数字化及网络化技术的发展,使传统馆藏建设发生了深刻的变化,不仅馆藏资源的概念被重新定义为”现实资源+虚拟资源”,而且馆藏结构也呈现出多元化、信息化、动态化的特征。从理论上讲数字资源典藏管理就是一种馆藏数字资源的组织与管理,它包括了馆藏数字资源组织和馆藏数字资源管理两个方面。简单地说,馆藏数字资源组织就是将摄取的数字资源按照一定要求,进行合理布局、排列、保护和清点的过程;馆藏数字资源管理则是对馆藏数字资源组织的控制、调节活动,它是按照一定目标,通过馆藏资源利用效果、统计、评价等信息反馈,有效地控制馆藏资源运行的方向、速度、范围和密度,从而使馆藏系统和用户系统有序结合运转,并处于均衡饱和的最佳状态。因此,数字资源典藏管理工作定位于既是记载、验收、统计、存储、保护馆藏数字资源的技术性工作,同时又有复审、分配、清点、核查、处理馆藏数字资源的行政职能。

数字资源组织中的规范控制政策。数字资源组织政策,就是按照一定科学规则和方法,来对数字资源的特征进行描述和序化的过程,以方便用户对馆藏资源的检索和利用为目的。数字资源馆藏由”现实资源馆藏+虚拟资源馆藏”复合组成,因此数字资源馆藏政策也据此复合而成:现实资源组织方法包括:按照学科内容的组织法、数据库组织法和数字资源整合工具法。虚拟资源组织方法较为复杂,从数字资源组织的类型看,有一次虚拟资源组织和二次虚拟资源组织两大类。一次虚拟资源组织法包括WWW信息组织、FTP信息的组织等;二次虚拟资源组织法有导航网站、数字图书馆、搜索引擎等。但图书馆目前常用的组织方法主要为:学科导航、联机编目法、数据组织法。Calis联机编目系统已成为我国高校图书馆对数字资源组织的成功范例。XML被广泛应用于对数字资源进行组织,通过XML可将数字资源、目次信息及其标引信息有机地组织在一起。据专家预测,在未来的几年里,元数据和内容标准将继续朝着以XML框架及与之相关的技术环境发展。这些发展将使得图书馆应用技术更少专门化和领域特定性(Domain Specific)。实际上我们已经看到MARC等已经在向适应XML的方向发展,如美国国会图书馆的MARCXML Schema等。数字资源组织的方式有多种,各馆数字资源数量种类和服务对象不同,组织方式也要因馆而异,也就是各馆要制定具有自己个性化特色的数字资源组织政策。

元数据可以理解为关于数据的数据或描述其他数据的数据”。元数据具有对数字对象的描述、定位、搜索、评估和选择的功能。元数据与数字对象的关系就如同书目数据与图书的关系一样,能比较完整地反映出数字对象的全貌。为了便于用户有效获取数字资源,进行资源共享,图书馆在对数字资源典藏入库时,有必要对数字资源进行标准化标引。对此,国际上制定了对数字资源的标引方法,即DC元数据。DC元数据集是元数据格式发展中比较熟悉和成功的一种,已成为对数字资源标引事实上的标准。DC元数据标准的创建,是通过对数字资源的提供者对资源属性的描述并对其内容进行缺省的标引方法,进一步保证了数字资源建设的标准化。在提供标准化标引方法的同时,数字资源库与应用软件系统也可以提供图书馆创建自己的标引方法,即系统提供标引模版,图书馆可以根据本馆的性质设计具有自己的个性特征。同时,DC元数据资源描述方案又称为网上资源的编目。由于DC元数据已被结构化,并支持字段查询,为从根本上解决网络环境下的信息资源的编目问题提供了切实有效的方法。

数字资源典藏保护和存取政策。作为对数字资源管理政策的一部分,典藏保护和存取是有长期计划的。任何政策的制定必须解决对典藏资源的安全性跟踪并保证经过一段时间后资源的可存取性。这包括两个含义:一是保护政策也称安全管理政策:在制定安全管理政策时,应考虑数字资源的保护与纸质文献保护的区别。在制定对数字资源安全管理政策时,各馆应考虑本馆各因素的重要性和不可预见的灾难事故,也要考虑典藏员素质的因素。科学的安全管理政策应是一个全面的、系统的、动态的防护体系,在这个体系中对不同的因素,依据其重要性的不同分类分级分别采取不同的安全防护措施。二是存取政策,这需要解决三个问题:(1)历史遗留典藏资源如何存取和激活;(2)当前典藏资源怎样快速存取;(3)未来典藏资源如何存取及控制。这三个问题涉及潜在复杂的法律问题,在对这样的数字资源进行存取时应持慎重的态度。因此,存取政策的制定应包括:连续存取数字资源的特定策略,移植策略的不断发展及标准。数字资源存取需要在法定许可范围内进行规范操作。

数字资源典藏管理权限控制政策。数字资源典藏管理权限控制政策不同于对纸质文献的典藏规则,对数字资源典藏控制过程中涉及的法律问题包括许可授权、法律障碍及解决、技术解决方案等问题。当前最紧迫的是如何解决这几个问题:(1)如何确定数字资源的存储等级,由谁管理;(2)哪些数字对象可以被移植至永久存储;(3)数字对象如何合法对外传输;(4)呈缴数字版本典藏操作与权利如何界定;(5)如何对被典藏资源进行灾难防范与安全管理;(6)如何确定数字对象的生命周期;(7)多馆协同合作典藏系统的对外服务权限。妥善解决数字资源典藏的管理权限问题,是建立可信赖的数字资源典藏机制的基础,否则图书馆难以获得资源商和版权拥有者的积极合作,也难以形成可靠的协同合作典藏关系。就图书馆现状看,作为数字资源保存和服务机构,图书馆应该充分利用知识产权法中的合理使用与法定许可的相关规定,通过与版权所有者或拥有者签订典藏许可协议等方式保证图书馆的典藏权利,同时建立可靠的用户管理机制,加强对图书馆馆员和用户的法制观念,并积极解决或协助解决可能出现的侵权行为,从而建立良好的法律环境、管理机制和合作氛围。

在制定数字资源典藏管理政策时,国家有关部门应组织信息产业界、图书情报界和软件开发商参与讨论制定纸质资源、电子资源、各种元数据、多媒体资源能相互包容的标准,数字资源协同管理机制建立的关键在于能否发挥政策、法规和市场调节的作用,形成合理的具有互惠互利经济结算机制的数字资源利用共同体,以实现在统一的协议下,充分地满足各方对数字资源共享的需求。

[参考文献]

篇3

DOI:10.3969/j.issn.1008-0821.2012.02.012

〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2012)02-0048-03

Cloud Storage Model Research of Digital Library ResourcesLi Aiqin Bao Lingyun Feng Xiaona

(Library,Shandong University of Technology,Zibo 255049,China)

〔Abstract〕On the basis of the introduction of related concepts and unique advantage of cloud storage,the article brought cloud storage into digital library resources storage,moreover,it established a system structure from the topology structure and function modules of the three aspects of the digital library resources and pointed out the defects of cloud storage in the secure storage and the library intellectual property rights.

〔Key words〕digital library;resources storage;cloud storage model

1 云存储

1.1 云存储概念与特征

云计算(Cloud Computing)作为IT产业继个人计算机和因特网之后的第三次变革,在社会各界引起了轩然大波。而云计算的资源存储即云存储(Cloud Storage),它是通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统[1]。

与以往存储方式不同的是,云存储中不仅仅是硬件的整合,更多的融合了网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序。通过结合应用软件与存储设备,云存储为用户提供的不只是单纯云端存储设备的存储服务,而是整个云存储系统带给用户的一种数据访问服务[2]。此外,由于集成统一,云存储更是具有其他存储所不具有的的规模经济性、资源虚拟性、弹性收缩性、高安全性、高可靠性以及可根据自身需要即买即用的云存储服务。

1.2 常见的云存储服务

云存储提倡的是利用云服务厂商的系统而不是本地系统来存储资源,用户则需要接入互联网,通过网络来访问存储在云上的数据。目前,国内外已经有数百种不同的云存储服务,如专门面向特定环境、特定用户的,专门存储电子邮件或数字图片的,专门负责存储视频、音频文件的等等。目前较常见的一些云存储服务有:

(1)电子邮件提供商,如Google的Hotmail和Yahoo!Mail,他们可以允许用户在厂商服务器上存储电子邮件消息。用户只要接入互联网就可以随时随地访问自己的电子邮件。

(2)YouTube为用户提供了在线的存储服务器,方便用户上传视频文件;而Flickr和Picasa,则是让用户通过创建自己的在线图库,任意上传数字图片。

(3)社交类网站,如Facebook和人人网、博客等则建立大型的服务器中心,方便其用户将文字、图片、视频、音频等各种数据存储在云存储厂商的服务器上。

(4)Amazon的ES3是一种可扩展、高速、低成本的基于Web的存储服务,可以为个人和企业用户提供各种数据及应用程序的在线备份和存档。

(5)IBM的Smart Business Storage和MicroSoft的Windows Azure则是一种基于私有云技术,为企业用户提供应用程序存储支持的云存储服务。

(6)金山的快盘,华为的DBANK数据银行,也都做到了以用户为中心,以企业服务器集群为基础,为用户提供方便快捷的在线云存储服务。

2 数字图书馆资源云存储研究

2.1 数字图书馆资源云存储体系结构

云存储的理念就是尽可能的整合资源,实现资源的共享利用。在利用各大高校图书馆原有资源的基础上,整合搭建可以共享的云数字图书馆,能够有效减少图书馆的硬件费用支出,最大程度上实现图书馆资源的有效利用。结合云存储的结构模型,本文构建了针对数字图书馆应用的数字资源云存储体系结构,如图1所示。

访问层数字图书馆用户各类存储应用统计访问入口、用户认证授权管理应用层数字图书馆资源存储平台、数字图书馆各种Web服务基础管理层集群系统、分布式文件系统、网络计算CDN、P2P、重复数据删除、数据压缩数据加密、数据备份、数据容灾存储层文件系统、数据库、元数据集存储设备、存储虚拟化、存储管理设备图1 数字图书馆云存储体系结构

2012年2月第32卷第2期数字图书馆资源云存储模型研究Feb.,2012Vol.32 No.2系统模型体系结构共分4层,从底层依次是存储层、基础管理层、服务应用层和访问层[3]。

最底层是存储层,也是数字图书馆云存储体系的硬件层。该层为整个云存储系统提供基本的网络环境、物理存储资源和逻辑存储资源,包括存储设备(磁盘阵列、光盘库和磁带库、FC光纤通道存储设备、NAS和iSCSI等IP存储设备、SCSI或SAN、DAS等存储设备)、存储管理设备、数据逻辑存储系统(文件系统、数据库和元数据集)等。其中云存储系统中的存储设备大部分是现有的存储设备通过网络连接整合形成。而统一的存储设备管理系统,可以实现所整合存储设备的逻辑虚拟化管理、多链路冗余管理,以及各种硬件设备的状态实时监控和故障维护。

第二层是基础管理层,是数字图书馆云存储体系的核心层。该层通过集群、分布式文件系统、网格计算等技术,实现云存储中的多个存储设备间的协同工作,包括存储监控、调度、副本管理等,可以根据数字图书馆的需求在某个时刻对外提供同一种服务,并提供更大更强更好的数据访问性能,保证众多用户可以同时访问使用数字图书馆资源。此外,该层还采用CDN内容分发、数据加密技术保证云存储中的数据不会被未授权的用户所访问,还利用数据备份和数据容灾技术保证数字图书馆云存储系统中数据的自身安全和稳定。

第三层是服务应用层,为用户提供了数字图书馆资源云存储平台和数字图书馆各类Web服务,包括信息采集、加工、管理所需的存储;信息的与服务所需的存储以及容灾备份等所需的存储。同时,数字图书馆中的业务管理、书目管理OPAC等,通过应用层共享云端平台,图书馆管理人员都可以更方便地访问与管理。

最上层是访问层。任何一个获得授权的用户,只要拥有能够接入互联网的终端设备,诸如PC、手机、移动多媒体等,就可以在任何时候任何地点通过应用层的数字图书馆资源存储平台使用数字图书馆资源的云存储服务,满足自己的信息需求。

2.2 数字图书馆资源云存储模型

2.2.1 数字图书馆资源云存储模型拓扑结构

图书馆的职责就是为社会公众提供他们所需要的知识服务,数字图书馆的出现更是将图书馆的服务进一步提升。在构建数字图书馆资源云存储模型时,可以借鉴IT界著名的服务管理最佳实践――ITIL(IT Infrastructure Library),ITIL最新版本三主要包含5个部分的流程:服务策略、服务设计、服务转移、服务运营和持续服务改善[4]。根据实际需求,在构建的云存储模型系统中并没有集成所有的ITIL流程,具体的系统拓扑结构如图2所示。

2.2.2 数字图书馆云存储模型功能模块

云存储的核心就是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变。在构建的数字图书馆云存储系统中,图书馆所使用的云存储不仅仅是单纯的存储设备的集合体,而是由众多存储设备集合带来的数据访问服务。从功能上划分,可以将整个数字图书馆云存储模型系统分成七大模块:物理存储设备和管理模块,虚拟化存储管理模块,存储网络连接设备管理模块,资源管理模块,存储管理模块,备份管理模块和I/O管理模块[5]。

(1)物理存储设备和管理模块。利用该模块可以对云存储系统中所有的物理设备监控,实时收集、管理各个设备的运行信息,保证云存储系统中各设备能联合起来协同工作,为数字图书馆工作的正常运行作保障。

(2)虚拟化存储管理模块。此模块作为数字图书馆资源云存储系统中的关键模块,它在物理设备整合的基础之上,对形成的巨大的逻辑资源池进行管理。

(3)存储网络连接设备管理模块。利用该模块,当整个云存储系统中某个设备不能正常工作或遇到某个设备被集中访问时,则可以及时地将任务转移到其他设备,来保证云存储服务的可靠。

(4)资源管理模块。该模块可以通过对所存储的信息资源进行合理调配和规划,根据用户的访问需求,自动地查找云存储系统中的可用资源来及时响应应用程序需求。图2 数字图书馆云存储模型系统拓扑结构

(5)存储管理模块。用户向存储管理模块提供的应用程序接口(API)提出数据访问请求后,此模块利用元数据目录中的信息进行协议转接,并将转接后的数据访问请求发向不同的存储设备,利用虚拟化存储实现对异构存储资源的统一访问。

(6)备份管理模块。云存储系统中数据是被集中存储在云数据中心,云数据中心的构建又是集合了数量庞大的服务器、存储设备等,设备的出故障率自然明显提高。为了在某个或某些设备出现故障,而不影响图书馆数据的安全、可靠及服务的正常提供,云存储提供中的备份管理模块发挥了很大作用。

(7)I/O管理模块。在云存储中,动态存储给数字图书馆带来了解决途径,通过I/O管理模块,可以很好的分配图书馆存储系统中的服务器资源,为用户提供实时不间断的服务。

3 结束语

随着计算机性能的不断提高和网络通信技术的迅猛发展,应用需求日益朝着高性能、大规模、多样性、多功能的方向发展,要求将地理上分布的、异构的各种高性能计算资源、存储资源、数据资源和其他特殊资源通过高速网络连接起来,实现高性能联合计算,共同完成重大应用问题。云计算和云存储的提出,使得高性能运算、大范围共享和低成本运营成为可能。

可以说,云计算与云存储的出现,不仅是IT界的又一个里程碑,也给图书馆界带来新的发展活力,尤其是将会带动互联网下数字图书馆的新发展。利用云存储来构建数字图书馆的资源存储系统,可以实现近乎无限的系统容量扩展,便于集中式统一管理,能有效减少图书馆的成本支出,满足众多用户并发访问的实时响应等。它能够在资源分布较广的范围内实现大范围联合为更多用户提供服务,真正消除数字图书馆的信息孤岛,实现数字图书馆资源的共享,发挥数字图书馆知识宝藏的潜能。但是由于云存储是通过硬件设备的共用以及虚拟存储等技术来完成存储,数据的安全性以及图书馆中资源的版权等问题还需要进一步探讨。

参考文献

[1]Anthony T etc.Cloud Computing:A Practical Approach[M].The McGraw-Hill Companies,Inc,2010:106-111.

[2]Mesnier M,Ganger G R,Riedel E.Object-based Storage:Pushing More Functionality into Storage[J].Potentials,IEEE,2005,24(2).

篇4

美国和欧盟针对图书馆数字资源的访问统计已经展开了一些针对性的研究计划,比如,由美国研究图书馆协会资助的E-Metric项目、美国多个机构(包括ARL、JISC、NISO等)资助的COUNIER项目、欧盟Telematics for Libraries Programme支持的EQUINOX项目等,这些项目多为研究制定描述电子信息服务和资源的统计指标和绩效测度及其方法。

1.2 相关标准

在相关的标准方面,面对新的信息环境和图书馆形态,一些组织开始尝试将新的电子资源绩效评估标准融入原有相关标准/指南的框架。例如NISO在2004年批准了图书馆和信息提供者信息服务和利用的测度和统计数据字典(NISO Z39.7-2004 Information Services and Use:Metrics & statistics for libraries and infomation providers--Data Dictionary),该标准在传统图书馆工作的基础上,还特别增加了网络服务、网络资源、网络运行的新的测度方法,这套数据字典将逐渐纳入美国图书馆统计工作,成为美国图书馆统计工作的参考依据,

ICOLC1998年制定的《网上索引、文摘和全文资源使用统计测度指南》(Guidelines for Statistical MeaSures of Usage of Web-Based Indexed,Abstracted and Full Text Resources)提供了一套网络化信息资源使用的绩效测度指南。2001年的修订版明确了网络信息使用数据统计的最基本要求,并提供在隐私、保密、获取、传递和报告形式方面的指导。

ISO ISO/CD 11620也在传统服务统计指标的基础上,结合ICOLC和COUNTER的研究,进行了图书涫数字资源测度及其定义、方法的描述。

1.3 国内图书馆数字资源访问统计的研究和应用

国内随着公共图书馆、大学图书馆、科学图书馆系统图书馆评估工作的进行,图书馆界开始逐步重视对图书馆数字馆藏、图书馆数字化信息服务的评估。

参考文献2中提出了数字资源后评估的概念,但是对图书馆数字资源访问统计等后评估的方法和指标体系尚未全面展开评论。一些图书馆自行开发了基于jsp或者asp的图书馆网站访问统计软件,一些数字图书馆系统,如清华同方的TPI、北京拓尔思的TRS、浙江天宇的CGRS等等也提供了相应的统计功能,但是尚没有一款商业化的软件针对图书馆的各种类型的数字资源提供一揽子的访问统计方案。

2 图书馆数字资源访问统计的方式

2.1 WEB日志方式

web服务器在工作时,时刻将WWW访问的结果记录在一些log(日志)文件中,通过对服务器日志的分析可以得到以下信息

(1)通过对访问时间进行统计,可以得到服务器在某些时段的访问情况;

(2)对访问者的IP进行统计,从中可以判断主要是那些用户在访问Web服务器;

(3)对访问请求的错误进行统计和分析,可以找出有问题的页面加以改正;

(4)对访问者清求的URL进行统计,就可以判断出读者对那些页面的内容最感兴趣,对哪些页面的内容不感兴趣。

各种web服务器日志文件的格式和内容大致相同。根据W3C的际准[2],一般Web日志都包括诸如用户的IP地址、请求时间、方法(GET/POST等)、被请求网页或文件的URL、发送/接收字节数、协议版本等信息。表1列出了几种不同类型的Web日志。

但这些日志文件信息量很大,用户难以直接从log文件获得直观的结果。对日志文件的分析,可以借助一些商业性的或者源代码开放的软件完成。其中比较好的开放源代码的日志分析软件有:AWStats、webalizer等。

从日志文件提供的信息进行统计和分析,就可以对整个网站有一个数字化、精确的认识,从而对网站的设计和内容进行改善和调整,使图书馆网站更好地为读者提供服务。

2.2 资源提供商提供

数据库的使用情况属于后评估指标,主要用于更新、续订数据库时使用,一般在图书馆购买资源提供商的数字资源时,应该要求由出版商或数据库商提供使用报告,再据此进行各类分析。

目前出版商/数据库商提供的统计报告常用的相关统计指标有:

①检索次数(searfh/query):用户在某一个数据库中提出检索式的次数。

②登录次数(session/sign on):用户打开某个数据库的次数。

③下载文摘/全文(abstract/fulltext page/image):用户在某一个数据库中下载到本地客户机中的文摘或全文篇数。

2.3 通过网络proxy

服务器(Proxy Server)是一种服务器软件,它的主要功能有:设置用户验证和记帐功能,可按用户进行记帐,没有登记的用户无权通过服务器访问Internet网,可以对用户的访问时间、访问地点、信息流量进行统计。

目前服务器软件产品十分成熟,功能也很强大,可供选择的服务器软件很多。主要的服务器软件有WinGate公司的WinGate Pro、微软公司的Microsoft Proxy、Netscape的Netscape Proxy、Sybergen Netwo rks公司的SyGate等,这些软件不仅可以为局域网内的PC机提供服务,还可以为基于Novell网络的用户,甚至UNLX的用户提供服务。目前绝大部分Intemet的应用都可以通过方式实现。大多数服务器软件产品具有登记内部网用户访问外部网的日志记录,有些产品还可以直接将日志记录到数据库中。根据日志记录文件或数据库,可以统计内部网每个用户的网络流量以及上网时间,甚至可以按服务网络类型(如:HTTP、SMTP、FTP等)分别进行统计。

2.4 利用脚本语言自行开发

通过web服务器的日志可以获得用户访问图书馆网站信息的情况,但是,这种方式需要对日志的格式进行了解,然后用相应的工具软件或者进行一定的开发来完成。还有一种获取网站访问情况的方法是利用asp或者isp等网络脚本语言,利用它们内置的server、session、request对象等获取相关的信息,获取数据进行统计。比如:利用Jsp我们可以用Jsp的内置request对象的获取参数方法request.get Parameter("userid"),获取用户名;用(request.get Remote Addr)获取访问者的IP地址;通过request.get Header("User-Agent")获取包含浏览器和操作系统的信息,然后用字符串分割substring()方法来分别得到浏览器和操作系统;通过Jsp的内置对象session的方法session,get Creation-Time()返回Session被创建的时间,而session.get Last Accessed Time()则返回当前Session对象最后被客户发送的时间,两者之差为停留时间。

主要分以下几个开发步骤:

(1)确定将要统计的信息;

(2)建立数据库;

(3)实时的访问信息纪录,记录每次点击的信息,包括页面信息、用户信息、访问IP、访问时间;

(4)实时信息的分类存储;

(5)显示方式的选择。可以用Windows的表格系统,也可以自行编制表格显示。

利用这种方法相对比较简单,但是可获得的统计指标也有限。

除了上述几种统计方式外,还有基于路由器的流量统计、基于防火墙的流量统计、基于以太网广播特性的流量统计。但是这些方法所提供的简单流量的统计功能,不能完全满足图书馆数字资源访问统计的目标。

3 图书馆数字资源访问统计的指标

3.1 国际图书馆联盟的统计指标指南

国际图书馆联盟认为,信息资源提供商对他们提供的特定的电子信息资源所提供的统计数据应该满足以下的最低需求。

必须提供的数据元素是:

a)会话(session)数量(或者登陆数量)number of sessions。为了满足政府机构和专业组织的报告的需要,应该提供会话数量或者登陆数量。在没有国界的网络环境中,会话数量的统计是一个粗糙的指标。

b)提问数(number of queries),即经过分类的提问数量。一次检索是一次独立的知识查询。典型地,一次检索被记录为向服务器提交的一个检索表单,之后的浏览行为或者选定一个单独条目的行为没有表现为额外的检索,除非通过提交二次检索。立即进行重复的检索、双击或者其他用户的无意识行为都不应计入其内。

c)菜单的选择数(number of menu selections),如果数据的显示需要通过使用菜单来进行浏览,则应该提供这个指标(如一个电子期刊网站提供的基于音序和主体的菜单选择)。

d)全文的数量(打开的、下载的或者提供给用户的全文,这些全文都是由服务器控制的而不是由浏览器控制的):

期刊文章-按照期刊名称列出刊名和issn;

电子书——按照书名列出书名和isbn;

参考资料——按照改资源的内容单元(如字典的定义、百科全书的文章、传记等);

非文本型资源——按照自愿的文献类型(如图像、音频、视频等)。

上述的每个数据元素应该按照每个特定的数据库提供商、按照每一组机构的IP地址或其他特别的元素(如账号),以及机构名称、协会名称和时间跨度(每月或者每年)分组描述,供应商还应该提供每天、每小时的统计数据,并且还应该可以动态地集成几个月或者某一段时间的数据,而不用限制是当年数据还是由供应商限定的时间段。

3.2 E-Metrics推荐的统计指标

为了了解图书馆数字资源的使用情况,确定数字资源的花费是否合理,MRL的E-Metrics项目推荐的指标如下:

(1)用户可检索的电子资源。包括:R1电子全文期刊种数、R2电子参考资源种数、R3电子书的种数。

(2)对网络资源和服务的使用情况。包括:U1电子参考事务的数量、U2登录电子数据库的数量(会话session数)、U3电子数据库的提问和检索数量、U4电子数据库的请求条数、U5对图书馆网站和书目的远程访问次数。

(3)网络资源和相关设备的花费。包括:C1全文电子期刊的成本、C2电子参考资源的成本、C3电子书的成本、C4图书馆对书目设备、网络环境等相关设备的花费、C5对书目设备、网络环境等相关设备的外部花费。

(4)图书馆数字化活动。包括:D1数字馆藏的大小、D2数字馆藏的使用、D3数字馆藏建设和管理的成本。

E-Metrics的统计指标,既考虑了数字资源和数字化服务的访问量,还考虑了数字资源及其支持成本,便于从成本/效益的角度进行分析。

3.3 我国图书馆常用的数字资源访问统计指标

对于图书馆数字资源访问统计的指标,在我们常见的统计分忻工作中,统计指标围绕什么被使用?谁在使用?如何使用?什么时候使用?为什么使用?哪些资料经常被下载?哪些资料被检索最频繁?资料检索来自哪些单位?哪个单位使用量最多等问题,通常采用数字资源提供商提供的访问统计数据与对图书馆网站及自建数字资源的访问统计相结合的方式,除了资源提供商提供的数据外,往往采用网站访问流量、访问者的IP、网站点击次数、数字资源的点击次数、下载的篇数等指标。

与国外相比,我国图书馆的数字资源访问统计指标设定相对比较粗略,没有统一的、针对各种类型数字资源的一致的标准,而且统计指标往往仅仅反映了访问情况,未能与数字资源的购买和管理成本挂钩进行成本/效益分析。

4 图书馆数字资源访问统计存在的问题

4.1 资料库不在馆内,正确及时的统计数据不易取得

随着各个图书馆在数字资源建设方面的积累和发展,图书馆数字资源的来源多样,既有通过远程镜像或者资源提供商服务器访问的数据,也有在本地镜像的数据,还有图书馆自建的数字资源。尤其对于资料库不在馆内的情况,需要厂商配合协助,但是最大的问题在于没有办法从厂商那里得到充分的数据,或是厂商提供的数据不标准,或是提供的资料不是图书馆想要的,而且由于统计数据是由资源提供商提供,其客观性和真实性的保障机制弱。这样,正确及时的统计数据不易取得。

4.2 缺乏标准的统计指标

由于资源来源多样,统计指标不规范,不同的系统提供的统计报告五花八门,没有统一指标。统计指标定义混乱、不明确,例如“search”在大多数系统内被定义为用户发送检索式的次数,但有些数据库却用“query”来表示同样含义的指标,而CSA数据库则同时使用了“search”和“query”,二者的含义和区别并不明确。没有一致、标准、科学的统计指标体系,对用户访问统计的分析及其对图书馆决策的支持可信度就会降低。同时对于数字资源的访问统计指标还应该结合每种数字资源的类型、考虑数字资源服务的研究人员规模等参数。

4.3 图书馆数字资源的后评估,应该结合多种评估途径展开

图书馆数字资源的访问统计,是图书馆数字资源后评估的方法之一,目前的图书馆数字资源的访问统计存在统计指标不一致、不标准的问题,而且网站访问统计不能确定是否与使用者的目的相符,无法完全反映使用者真正的使用状况,因而,图书馆数字资源的后评估可以结合数字资源的访问统计、用户使用调查、用户访谈等方式完成。

4.4 用户隐私的问题

图书馆数字资源访问统计的数据主要来自web server的log files,目前法律上并无相关条文规定log file资料的处理,但由于其中包含使用者的IP地址,应该与图书馆的流通记录一样,加以保密。不论图书馆决定如何分析log file的数据,对于收集何种数据、谁能判读数据以及如何使用数据等,都应有详细的规定和说明,以免一时大意触犯子个人隐私权。未经个人用户同意,不能收集用户的个人信息,也不能将所收集的统计信息用于分析和识别用户个人信息。如果为提供特定服务必须采集用户的个人信息,必须向用户告知他的权利、个人信息用途及其保护方式,只有在用户知情同意的情况下才能基于该服务明确相关的个人信息。并且必须对合法采集的用户个人信息必须进行安全保管,未经用户同意不得公开,不得将个人信息转给第三方,而且服务中止后,必须立即删除。

【参考文献】

1 arl.org/stats/newmeas/emetrics/index.html

2 projectcounter.org/index.html

3 equinox.dcu.ie/

4 niso.org/emetrics/index.cfm

5,9 ICOLC.GUIDELINES FOR STATISTICAL MEASURES OF USAGE OF WEB-BASED INFORMATION RESOURCES <library.yale.edu/consortia/2001 webstats.htm

6 libraryjoumal.com/article/CA411564?display=Features News & industry

7 张川,肖金升,周振,胡运发.具有访问时间完整性的web日志方法.计算机应用与软件.2004(2):105-107

8 梁玉环,李村合,索红光.基于JSP的网站访问统计系统的设计与实现.计算机应用研究.2004(4):166-167

10 詹丽萍.E-Metrics在数位图书馆使用评估的应用.p105.lib.nctu.edu.tw/2001conference/pdf/1-1.pdf

11 张晓林、宛玲、徐引篪、宋小冬、王欣.国家科学效字图书馆数字资源采购的技术要求.中国图书馆学报.2004(7),14-19

篇5

数字资源,又称电子资源,是计算机技术、通信技术及多媒体技术等运用于信息资源的、存取、利用的产物。馆藏数字资源是指图书馆引进(包括购买、租用和受赠)或自建(包括扫描、转换和录入)的,拥有磁、光介质或网络使用权的数字形态的文献资源。数字资源出现至今已发展为多种类型,可以从不同角度进行分类,既可分为电子期刊、电子图书、学位论文、电子报纸、专利/标准、数据/事实等;也可分为全文数据库和题录、文摘、索引数据库等。在国内外不同的数字资源评价体系中对数字资源有不同的归类。如:在“国际图书馆统计标准ISO2789”中,将电子馆藏划分为“数据库、电子连续出版物、数字文献三部分,数据库分全文数据库、文摘、索引数据库及其他类型数据库;数字文献包括电子书、电子专利、网络视听文献和其他电子形态的报告、预印本等文献”[2];在高校图工委和CALIS的《高等学校图书馆数字资源计量指南》中,根据目前高校图书馆的实际情况,“将数字资源划分为四种类型:电子图书(包括与图书类似的出版物);电子期刊(包括与期刊类似的连续出版物);二次文献数据库(包括题录、文摘、索引等);其他数据库”。

2数字资源使用统计的作用和意义

数字资源的使用统计涉及到图书馆、数据库出版商或服务商二个方面。通过数字资源使用统计可以对数字资源进行科学的使用评价分析,了解本馆订购的数字资源的利用效率,跟踪读者的使用行为、分析读者的需求规律,从而有效地调整数字资源建设策略和服务策略,为决策提供依据。同时,数字资源使用统计也能有效的评估数据库质量和服务绩效,对数据库商是一个很好的激励和推动手段。因而无论是对图书馆还是对数据库商,都具有十分重要的意义。

3高校图书馆数字资源使用统计现状和问题

数字资源使用统计数据可以通过数据库出版商或服务商提供和本地自行获取两种方式获得。从图书馆和数据库商两个角度看,高校图书馆数字资源使用统计存在两个主要问题。

3.1我国数字资源使用统计没有实现标准化和规范化针对数字资源的使用统计问题,国外ICOLC、ARL、ISO、NISO、COUNTER等很多组织、机构进行了探讨和研究,并取得了研究成果、提出了相关的指南、手册、标准等。其中COUNTER项目委员会的网络数字资源在线使用统计(COUNTER)得到了广泛的接受,逐渐成为国际化标准。在我国,数字资源使用统计的相关研究起步较晚,目前还没有相关的国家标准或行业标准。中文数据库大多没有遵循COUNTER标准,中文数据库商对于数字资源使用需要统计什么数据、依据什么指标体系进行统计有不同的理解,数据库所设置的统计指标从名称、定义到指标数量均不相同。不同数字资源使用统计指标缺乏兼容性,没有实现标准化和规范化,为图书馆进行数字资源的使用统计分析增加了难度。

3.2高校图书馆对数字资源使用统计的需求度和重视度不够尽管数据库服务商提供的统计指标缺乏兼容性,高校图书馆仍可以利用常用统计指标进行使用分析。然而许多高校图书馆并没有很好地对统计数据进行收集、整理并加以分析,主要原因是高校图书馆对使用统计的需求度和重视度不够。许多高校图书馆投入大量经费购买数字资源,造成数字资源数量的堆砌,对数字资源的使用评价分析的实践还远远不够。同时,图书馆员在汇总和分析使用数据方面也缺少专业的培训,导致数据库商提供的使用报告并没有得到有效利用。此外,图书馆对数字资源使用统计需求程度不高,也是造成数据库商随意设置统计指标的一个因素。

4高校图书馆做好数字资源使用统计的几点策略

4.1提高重视程度、加强与数据库商的合作数字资源使用统计在尚没有相关国家标准和行业标准的前提下,高校图书馆应根据自身的现状和需求,积极与数据库商合作,协商在使用报告中需要提供哪些统计指示,主要依据哪个标准或评价体系,在与数据库商签订合同时,应将提供使用统计报告的具体内容作为合同的一部分。同时,高校图书馆应加大对馆员的培训力度,针对数字资源使用统计问题,邀请专业人员或数据库商的业务人员对相关工作人员进行专门培训,使其正确理解和运行数字资源使用统计报告,掌握数字资源使用统计的分析方法。相关工作人员要持续关注数字资源使用统计、数字资源服务绩效评估等相关研究领域的发展动态,及时丰富业务知识,并设法运用到实践中。

4.2主动进行数字资源使用统计实践面对复杂的数字资源类型以及缺乏统一标准的使用统计报告,高校图书馆应积极主动的进行数字资源使用统计实践。可以依据国外数字资源使用统计的标准化研究成果和国内相关标准、资料,对其指标体系进行对比分析,分别根据不同的数字资源类型找到适合本馆实际需求的、常用的统计指标,在本馆范围内进行一定的规范。偿试通过不同渠道收集、整理、分析各种不同类型数字资源的使用统计数据。

篇6

【中图分类号】G255【文献标识码】A【文章编号】1672-5158(2013)02-0326-02

数字图书馆以网络技术为基础,数字化内容为核心,资源加工、知识发现与信息处理为主要手段,给用户提供一个基于数据库和信息流的便捷检索平台。随着计算机技术的发展,数字图书馆在图书馆业务中所占比例越来越高,其数据来源于网络共享资源、数据商制作数字资源和本馆自有数字化资源。其中,本馆自有数字化资源建设中,耗费了大量时间,投入了大量人力和经费,一旦灾难发生,数据损失将带来严重影响。因此,建立一个安全高效的数字容灾系统,是图书馆保护核心数据安全,保证数字图书馆业务延续,为读者提供不间断服务的关键和前提。

容灾系统是指在相隔较远的异地,建立两套以上功能相同的IT系统,互相之间可以进行功能切换和状态监视,一旦当前应用系统因意外(如自然灾害或人为损坏)停止工作,可以即时切换至异地,使得系统功能继续正常运作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。[1]

1、图书馆数字资源容灾需求

数字图书馆的数字资源中有大量的多媒体资源、数据库系统,这就要求容灾系统的架构不仅要有效的维护数字资源的安全,而且要维持信息访问的顺畅。适用于数字图书馆的容灾系统,不能只从数据完整性的角度出发,还应关注数据管理、数据传输、运算效率等多方面内容。[2]其需求主要为以下几点:

(1)异地容灾。数据中心与容灾系统的备份中心相距足够远的距离,当某一中心遭受自然灾害影响时,另一中心不会受到波及。

(2)双向工作。源数据与备份数据应用相互间可以实现即时稳妥的自动或手工切换,确保灾害发生后数字图书馆信息服务的连续性。

(3)方式选择。备份中心可以为数据中心提供系统备份和数据备份。系统备份完成信息系统的异地存储运行,满足数字图书馆应用需求。数据备份实现备份中心与数据中心间实时同步,保证数字图书馆服务的连续性。

2、容灾系统关键技术

在建立容灾系统的过程中会涉及到众多技术,诸如NAS、远程镜像、基于SAN的互连技术、快照技术等等。下面简要介绍下,容灾系统中需要的核心技术。[3]

(1)快照技术

快照是指向磁盘子系统上原数据的一组指针。通过快照技术,能以时间轴上的还原点位置来进行数据管理,最多可累计达255个时间点的数据版本,可以实现数据在任意时间点上的完整状态回溯。

(2)NAS技术

NAS(Network Attached Storage—网络附加存储)即将存储设备通过标准的网络拓扑结构(例如以太网),连接到一群计算机上。NAS的存储器件即插即用,文件访问基于网络协议,可以应用于Windows/Unix混合局域网。NAS用户可以在网络上进行数据存取和备份操作,无需服务器本地干预,降低了CPU负载,提高了网络利用率。

(3)远程镜像技术

镜像是指在两个以上磁盘或其子系统上生成同一数据的镜像视图的信息存储过程,分为主镜像系统和从镜像系统。远程镜像技术是容灾系统的核心,是实现远程数据同步和灾难后系统恢复的基础。

(4)互连技术

互连技术即通过光纤通道或广域网连接两个存储区域网络,进行远程镜像。基于光纤通道的互连技术稳定性好,但是实现成本过高、地理距离较近。基于IP的SAN互连技术,依托现有TCP/IP网络,通过FCIP、iFCP、Infiniband、iSCSI等互连协议,适用于多种拓扑结构,成本低、扩展性好,发展前景广阔。

3、容灾系统方案设计

一套成熟的容灾方案要求在不可预计的灾难发生时,可以将系统和数据快速恢复,把损失控制在最小。全面的容灾系统方案除了要实现本地数据保护,更要实现系统平台的异地功能切换和数据同步。具体方案如下:

对数据中心中每台存储采用RAID技术,通过一定的读写和校验机制,将多个硬盘虚拟化成单个大容量存储介质,提高存储中硬盘的读写效率和容错能力。当阵列中某一硬盘出现硬件故障时,可以有效防止数据丢失。结合应用日志、磁带备份等,应对一般性软件事故、轻微硬件损坏等小规模灾难。

在此基础上通过远程镜像技术,将应用集群中本地磁盘系统中的数据发送到异地保存。远程镜像按从镜像系统与主镜像系统间数据复制的时机,又可分为同步远程镜像和异步远程镜像。同步远程镜像中本地每一事务均需得到远程复制完成的确认信息才能释放,本地数据将以完全同步的方式复制到异地,主从系统间可以实时切换而保持数据一致,但这一方式对网络延时要求较高。异步远程镜像是在本地系统操作完成后将远程存储视图更新,这一方式对带宽要求较低、对本地系统影响较小,但是容易出现数据不一致的问题。

除此之外,还应当使用数据恢复软件和基于SQL的容灾技术,作为其他容灾技术的补充,保持业务系统中逻辑卷与备份系统的一致性及数据库中逻辑结构的完整性。

4、容灾系统应用与管理

为确保图书馆数字资源的安全,有针对性的应用容灾系统。首先,应该设立标准化数字图书馆中心机房,应具备防火、防水、放静电、放雷电等功能,配备火警系统、空调系统、监控系统、不间断电源系统等基础设施。良好的基础设施对营造稳定的服务器运行环境有着至关重要的作用。在构建中心机房计算机硬件设施时,应当考虑到网络技术的应用、防火墙的配备、杀毒软件的选择、系统和应用完全性的完善。

制定系统的数据库管理方案和日常作业手册,建立健全用户管理制度,明确各数据库管理员职责。每日对各服务器各系统运行状态、备份情况、数据库使用日志、系统资源分配进行常态化检查分析,及时发现并解决各种问题。

在日常使用中,通过实际演练,了解容灾系统各节点运行是否正常,各环节是否畅通。模拟灾害发生后的各种情况,可以有效的检验容灾系统运行状态,以及数字资源管理中的欠缺。[4]

5、结束语

数字图书馆以其使用上的便利性和内容的宽广度受到越来越多的关注。容灾系统的完备性关乎图书馆信息系统能否正常工作和提供读者服务。因此,针对数字图书馆特性,构建与自身数字图书馆业务能力相适应的容灾系统软硬件体系,对图书馆数字化发展和应用有着极为深远的意义。

参考文献

[1] 卡尔.容灾系统[G/OL].智库百科. 2013.01.05http://wiki.mbalib.

com/w/indexphptitle=%E5%AE%B9%E7%81%BE%E7%B3%BB%E7%BB%9F&oldid=978243

篇7

一、大数据的概念

远在1980年的时候,美国人就首先揭示了“大数据”的内涵,近几十年来,随着各个领域中大量数据的急剧膨胀,“大数据”这一提法也越来越得到大家的认可,有些国家甚至把“大数据”作为国家的一项发展战略。有专家指出,所谓大数据,是指其规模,范围远远超过一般意义上的尺度。随着信息数量的急剧膨胀,大数据本身也在发展之中。有关学者指出,大数据具有以下几个方面的特征,即规模大,速度快,复杂性和多样性[2]。

在当代社会,作为现代社会公共服务和信息体系重要构成部分的图书馆,也在很大程度上深受“大数据”时代的影响,因此,在图书馆数字资源的建设,管理过程中要注意其带来各方面的影响,以此为契机,提升图书馆的服务质量。

二、当前我国图书馆数字资源建设、发展中存在的问题

目前我国图书馆资源的类型可以分为如下几类:通过购买获得的资源,自己建设的资源,与他人合作开发获得的资源以及通过网络免费方式获得的资源等。购买获得资源主要从数字资源商家处采购的数字资源,是图书馆获得数据资源的最主要的方式。自建资源是指图书馆通过自身建设获得的资源,这些自建资源在图书馆数据资源中占有很大比重,地位不可小觑,如国家图书馆的敦煌遗珍、上海图书馆的家谱数据库,上海年华、全国报刊索引数据库以及各个图书馆的书目数据库。合作开发数据资源主要是指几个图书馆通过相互之间合作的模式共同建设和分享开发研究成果,比如国家图书馆和上海图书馆等单位共同建设的中国近代文献联合目录[1]。免费数字资源主要是互联网上共享的数字资源以及其他通过非付费方式获得的数字资源。在大数据环境下,对传统图书馆的业务提出了挑战,如对图书资源的整合,读者的咨询,文献的检索等[3]。在此背景下,图书馆数字资源如何进一步整合升级,如何对如此庞大的数字资源进行整理是一项复杂而庞大的工程。

1.硬件设备落后及存在安全风险

要建设一个现代化的数字化、网络化图书馆需要依靠先进的设备,虽然目前大多数图书馆都有网络服务终端系统和相关计算机设备,但在一定程度上仍不能满足现实的图书馆数字资源建设和管理的需求,在“大数据”时代,图书馆要面对如此浩大的网络信息资源,各种数据的组成结构,类型个事,信息存储等都愈加复杂,落后,陈旧的设备很难应对如此复杂的工程,如计算机设备陈旧,由于经费紧张不能对相关网络系统进行升级,还有抵御网络风险的能力较低,有些图书馆根本就不具备抵御网络安全风险的能力,如遭受攻击随时有可能陷入瘫痪。

2.图书馆管理人员欠缺相关的专业技能

在我国现实中,图书管理人员基本上不是图书馆管理专业出身,组成人员比较复杂,有些甚至是通过各种社会关系进入到图书馆工作。因此,由于相关专业技能的缺乏,在进行图书馆的管理,读者服务方面不能很好地满足使用者的需求,更不会主动积极的对图书馆的数字资源建设献言献策。从另一方面也说明,我国目前还没有认识到图书馆数字资源建设的重要性,图书管理人员的待遇不高,图书馆经费困难,这些原因都造成了图书馆很难吸引专业性人才的加入,即使是图书馆管理专业出身的人员,也可能因为待遇,发展等问题改行。

3.对图书馆数字资源的宣传不够

虽然有些大型图书馆的数字资源的建设比较庞大,资源丰富,但由于各方面的原因,宣传不够,导致很多用户对图书馆数字资源缺乏了解,甚至不知道数字资源为何为,结果是数字资源建设投入很大但用户不多,造成了大量资源的浪费,严重影响了图书馆数字资源的使用效率。

4.数字资源服务缺乏针对性

由于我国图书馆管理人员不具备相关专业素养,不知道如何提供针对性的服务,因此在对用户提供服务时,往往不够积极主动,同时也由于管理人员自身就对数字资源不甚了解,就不能很好地向用户提供针对性的服务,不能满足用户多样性的需求[4]。

5.图书馆数字资源具有封闭性

在我国的图书馆数字资源中,高校的图书馆资源占有很大比重,而高校的图书馆一般非本校人员很难进入,这在一定程度上限制了用户获取资源的权利,在以后的工作中,要尽量放开高校图书馆资源对外校人员的限制,让图书馆资源能够得到充分的利用。

三、图书馆数字资源创新服务的举措

1.加强图书馆硬件设施建设

针对目前我国图书馆设备陈旧,硬件设施落后的现象,要加大对图书馆硬件设施建设,进行更多的资金投入,提升数字资源存储系统,数字资源的存储问题将会对数字资源的服务质量产生深远的影响。各种各样的数字资源的涌现,在此种情形下,如果不对图书馆的的网络进行改造升级,将会难以承载如此庞大的信息资源,将会致使数字资源的建设出现大量的问题,最终让用户难以使用数字资源。所以,以后要加大对图书馆的资金投入力度,加强图书馆的硬件设备建设,如电脑设备,服务器终端,局域网等相关设备的更换升级。

2.对图书馆管理人员进行技能培训

图书馆数字资源的各项需要馆员的广泛参与,在以后的数字资源管理和服务中,馆员也起到至关重要的作用,如果要使图书馆数字资源的建设,发展的更好,需要馆员热情,主动,积极的参与,为数字资源的建设献言献策,馆员毕竟是图书馆的一线工作,在日常的管理,服务中发现的问题与不足可以提出改进的方法,同时也可以将用户在使用数字资源的过程中遇到的问题反馈给图书馆领导,以便在以后的数字资源建设中参考。并且,现在的知识更新速度很快,知识更新周期越来越短,据相关研究称,人们的知识每5-7年就会增长一倍,所以,图书馆每隔一段时间要针对性地对图书馆工作人员进行培训,考核,制定科学,合理的培训计划,使馆员的知识不至于落后时代步伐,使其掌握的知识不至于落后数字资源建设的需要,培养一批专业基础扎实,理论水平高,能力强的数字资源管理队伍,更好地为用户提供服务,使数字资源管理和服务实现质的飞跃。

3.加强数字资源的宣传

目前我国图书馆数字资源的宣传力度不够,很多普通大众根本不值数字资源为何物,更谈不上如何使用数字资源,造成我国图书馆数字资源存在严重的浪费,使用率不足,造成大量闲置。所以要加强对图书馆数字资源的宣传力度,让普通大众逐步了解和接受数字资源。目前我国大部分图书馆都有自己的官方网站,图书馆可以把数字资源使用指南,注意事项放在其网站上,方便用户学习,使用,为用户的使用带来便利。必要时也可以邀请相关专家学者来馆举办培训和讲座,帮助用户掌握和使用数字资源。

4.构建有针对性的数字资源服务

由于目前我国图书馆工作人员业务素质较低,很难做到针对,因此,要提高馆员业务素质,在素质提高的同时开展更多针对性的服务。目前,我国图书馆用户范围较广,专业性差异较大,对数字资源的需要也是各种各样,因此,也就要求图书馆在进行数字资源建设和管理的过程中能够针对典型用户人群提供针对,尽量满足使用者的不同需求,主动推出特色服务。

5.建立开放、统一的数字资源服务

篇8

中图文分类号:G250文献标识码:A论文编号:1003-1588(2015)06-0080-03

[FQ(3*2\.172mm,ZX-W]

[KH*3D]

收稿日期:2015-04-30

作者简介:[HTK]莫耀评(1975―),南宁职业技术学院图书馆馆员。[FQ)][HT]

把查询到的馆藏资源数据信息以视觉的形式展现出来,达到数据信息资源的沟通和传达直观化,即是图书馆馆藏资源的可视化技术。馆藏数据资源的可视化使读者不但可以了解数据的最基本特点,还能看到以多种技术手段展现的目标信息,这样用户可以很明确地了解到其所需求的目标数据信息的状态。

[BT3]1数字图书馆馆藏资源可视化现状分析

1.1大数据时代给资源可视化带来的挑战

世界权威组织机构统计的调查曾指出:网络产生数据信息资源以每年50%的速度在增长。随之出现的云计算技术也点燃了人们对大数据的研究热情,在图书馆馆藏资源可视化技术的研究过程中,大数据所占的比重也越来越大。图书馆馆藏信息数据资源不仅数量在不断增加,其复杂程度也在不断增强,因此如何将大量纷繁复杂的馆藏资源信息数据清晰直观地展现在用户面前是当前图书馆馆藏资源可视化研究的一大挑战。

海量且结构复杂的数据信息的存储、传输、并行化和不确定的量化等是可视化研究的难题所在。首先,馆藏资源数据信息的存储所存在的问题是数据数量大、结构复杂,因此存储时所需要的相应空间就大,对空间结构的要求较严谨。其次,馆藏资源数据信息的传输对所需传输速度和所占宽度要求更高。目前图书馆馆藏资源的传输速度难以满足用户需求是大数据下馆藏资源可视化技术研究的难点。

1.2馆藏资源越来越丰富引发的问题

目前即使互联网发展迅速、应用广泛,可在一些领域特别是在科研院所,首选的信息资源还是图书馆馆藏资源。因为图书馆经过这么多年的积累和沉淀不仅有浓厚的文化氛围,更有系统的专业知识和丰富的馆藏资源,这是互联网资源无法可比的。

随着人们对与数字图书馆相关的多媒体大数据信息研究的深入,图书馆与网络技术的结合也逐渐成为一种趋势。现在,人们对馆藏资源可视化的研究主要包括可视化检索研究与可视化检索结果研究。数字图书馆信息资源可视化的过程中,馆藏资源的数字化也是个大问题,有些资源的保存介质是很久以前的纸,这些信息数据的数据库录入工作并不容易,在很大程度上影响到数字图书馆馆藏资源的可视化过程。

[BT3]2数字图书馆馆藏资源可视化现有技术研究

2.1基于几何的数据可视化技术

数据的表达形式采用几何或几何投影的方法称为基于几何的信息数据可视化,该方法的采用使用户能很容易找到目前信息(见图1)。从图中可以发现,信息量大且复杂的数据比较适合基于几何的数据可视化技术。因为该技术能清晰地表达出大量复杂数据之间的逻辑关系,能为用户勾勒出一幅流程清晰、逻辑明确的几何图像。当然该方法也有不足之处,有时由于信息数据过于复杂,数据量又特别大,这样勾画的几何图像有重叠的可能,这样一来用户会很难读懂图形的含义。

2.2面向像素的数据可视化技术

可视化系统VisDB开发应用充分证明了面向像素数据可视化技术的强大优势。该技术原理简单易懂,如图2所示,右边设为一个数据项,经过某种映射变换对应到特定的屏幕上,与这个屏幕上的像素对应,一个数据项能对应几个屏幕上的窗口表示不同的数据属性值。

[3]有两种方法可以实现面向像素的信息资源可化技术,一种是单独查找,另一种是利用查找。第一种方法主要是对数据项进行排序,排序的依据是数据项的属性值,然后在显示屏上显示排序后的数据值,这种方法使用起来既方便又有很有效果。第二种方法通过数据值与所查目标数据的一致程度对颜色进行匹配。该方法的流程非常切合实际,它采用特定的距离函数来估算数据项的属性值和查询值从而得到匹配值。这种方式能如实地反映两者之间的符合程度,距离函数的值越小说明所查找的数据越接近目标信息数据。

2.3基于图标的数据可视化技术

[3]把数据集中的各个数据项都映射成图标的方式被称为基于图标的数据资源可视化技术,该技术在可视化技术中也是非常重要的。这种技术中的图标部分是由数据项的维数决定的,数据项是几维该图标就有几部分,图标的部分与数据项的维数是一一对应的关系。

近年来,基于图标的可视化技术不断发展,并逐渐形成多个分支,其中最典型的当属Chemoff-faces,它是目前基于图标的可视化技术中应用最广的。通过应用该技术能将数据项的两个维度映射当作显示的两个坐标,其他的维度映射成具体的形状。

2.4基于层次的数据可视化技术

[2]该项技术比较适合应用在层次关系比较明确的数据集合中,这一点从基于层次的数据可视化技术的名称中就能看出。树图是基于层次的数据可视化技术的一种,具有代表性。该技术中树上的每个节点代表着数据项的属性值,各个子节点相加的和等于父节点的值。该技术能够把复杂的数据集进行分层处理,能够理顺数据的结构。

[BT3]3数字图书馆馆藏资源可视化结构模型研究

3.1馆藏时间结构模型

数字图书馆馆藏时间结构模型主要是对馆藏时间顺序的研究,该模型有助于对数字图书馆的各类图书信息进行整理和规范。通过对馆藏资源信息的整理能够发现馆中图书量的增长情况,能够如实反映图书馆的图书使用情况。

3.2馆藏学科分类结构模型

随着现代信息技术的不断发展变化和科学技术学科间的交叉及渗透,在高校及相关教育部门内出现了各种各样的学科分类新标准,更值得一提的是,这些学科还在不断地细化及分解。馆藏数据信息资源学科分类在很大意义上是为了观察并及时反映图书文献资源的内容和信息能否为现代信息化教育事业、科学技术研究及社会职业分工等提供一些数据,为决策者服务。馆藏资源学科分类模型可以利用图书分类信息表去了解城市图书馆及高新图书馆内文献的学科覆盖范围,特别是重点学科文献的种类和数量的变化情况,为图书管理者对图书文献的使用及采购决策提供依据。

3.3馆藏等级结构模型

现代数字图书馆馆藏数据资源由于管理和科研的需要被人为地划分为一些特定的等级,如目前比较流行的划分原则有图书馆藏的作用、图书馆特定的相关功能需求、图书阅读人员的文化水平情况等。图书馆藏数据资源信息等级结构模型不但能表现出现存图书文献资源的利用情况,还能反映出阅读者对知识文化需求的解决情况。世界各地的图书馆管理者对馆藏数据文献资源的等级具有各不一样的划分标准,目前我国较多地方的图书馆部门及相关院校的图书馆机构采用五等级法,即划分为甲、乙、丙、丁、戊级。现阶段教育部对大多数本科院校馆藏数据资源的评估主要是依据其藏书的数量评定的,如大于180册/人为A级,大于150册/人为B级,大于100册/人为C级。我们可以通过这些馆藏数据资源的等级结构模型来分析图书馆内阅读者的平均可借阅文献种类和数量,同时还能看出这些数值随着时间的推进或是随着馆藏资源学科信息分类后的变化情况,能更好地实现馆藏资源的可视化。

[BT3]4数字图书馆馆藏资源可视化服务设计

4.1可视化服务总体架构设计

笔者在考虑图书馆学习者的实际需求的情况下,在原来B/S系统的基础上设计了一种面向用户的可视化服务构架。该系统是在图书馆馆藏资源的基础之上设计的一种面向用户的可视化服务架构,主要有可以用来展示可视化服务所有类型的服务效果情况的前台浏览器UI;可以作为请求馆藏所有数据资源的可视化服务情况的中间数据通信部分;可以用来组织、整理监控馆藏资源数据库和其模型库的后台服务器部分(见图3)。

如上图所示,图书馆馆藏可视化服务系统需要设计的模块有:结构可视化设计、馆藏资源覆盖率可视化设计、馆藏资源利用率可视化设计及数据模型管理及其通信部分设计等。

4.2图书馆藏结构可视化模块设计

针对现代图书馆内馆藏资源的结构及其数据模型的可视化主要是在几何元素的基础上建立的可视化相关理论技术。目前较多利用的方法是平行坐标法,但具体实现这种方法的工具是报表,这是因为馆藏数据资源模型的影响因素较多、纵横坐标的参数值特别复杂且具有不确定性。但这种方法使用的报表的结构形式与以往其他形式的老版本报表有很大不同,主要体现在此报表有动态变化的数据、趋势性的参数值、报告和表格融合成一体的结构。

馆藏资源数据结构模型的可视化报表的图表内容包括图书的种类数量、每类型图书的册数量、各种类型之间的比例关系、平均每人可借的最大数量图书比例等。报表中的图和表分布代表不同的意思,其中条状的图形表现的是图书的类型数量和册数量;线状的图形表示的是比例情况。值得一提的是,图书馆可视化报表方便了人们对每个维度表示内容的数据形式的了解,还具有直接联机打印数据可视图片的功能。

4.3数据通信与接口模块的设计

要想实现图书馆馆藏数据的可视化,前台界面效果和系统后台管理服务器应直接连接起来,其需要系统具有数据资源间的相互通信及其间的数据接口。此模块设计中的数据接口功能主要是:①利用对集成电路芯片的封装来显示图书馆馆藏资源信息数据。②由外观页面显示平台对上面的数据接口进行数据和信息的技术访问。③资源服务系统平台的数据接口接到访问信息后便与后台服务器进行数据和资源信息的交互,实现数据的相互传递。其中,可视化系统平台提供的数据服务形式是已经经过封装后的具有相对统一的标准格式的数据,其通过服务器再传递到前台显示界面内,此时具有可视化特定显示要求的信息数据已被传递结束(见图4)。

[T0523.TIF,B]

[TS(][HT5”SS][Z]图4数据通信接口模块框架图[TS)]

图书馆馆藏资源信息可视化服务系统设计因为有了数据通信接口这个特定的模块,从而使系统内部前后台的设计研发具有相对可以分开的效果,因此使用过程中如果发现系统有任何不足和需要改进的地方,都可以对此可视化服务系统进行性能优化和功能改进以及系统信息扩展。

[BT3]5结论

随着可视化技术的不断发展和逐步完善,数字化图书馆馆藏资源的可视化也会逐渐成熟。并且,可视化技术的应用将会进一步提高数字图书馆信息服务系统的服务能力,从而使其能更好地发挥数字图书馆信息服务的功能。

参考文献:[HTK]

[1][ZK(#]吕红,邱均平,李小涛,等.国内馆藏资源可视化研究进展分析.情报资料工作,2014(1):57-60.

[2]邱均平.专题:馆藏资源可视化研究.情报资料工作,2014(1):24-30.

[3][3]刘晓娟,周建华.数字资源可视化的理论、技术及方法研究.图书杂志,2015(2):102-108.

[4][3]王洪娟.高校数字图书馆馆藏资源建设与维护发展研究.绥化学院学报,2013(2):59-64.

[5][3]贺德方,曾建勋.基于语义的馆藏资源深度聚合研究.中国图书馆学报,2012(7):12-17.

[6]张洋,谢卓力.基于多源网络学术信息聚合的知识图谱构建研究.图书情报工作,2014(12):32-37.

[7]侯婷婷.图书馆藏书质量评价指标体系优化分析.才智,2012(20):336-341.

篇9

1.1数字图书馆的内涵

数字图书馆(DigitaiLibrary,简称DL),起源于20世纪90年代。对于数字图书馆的定义,主要有以下几种[1]:①数字图书馆主要是以数字化为主,对图书资源进行收藏和阅览的图书馆。②数字图书馆将现有图书数字化,并将资源上传和共享。③数字图书馆有其优越性,可以为国家提供信息管理技术,并完善国家信息管理。④数字图书馆是一个环境,它将收藏、服务和人连接到一起,以支持数据、信息乃至知识的全部相关流程,包括从创建、传播到使用以及保存的全过程。⑤数字图书馆即数字化的系统和环境,它将分散的资源连接起来,又将集合的资源分散出去,具有便于使用、信息有序的特点。总的来说,数字图书馆即计算机网络环境下的可扩展、开放的信息网络系统。它以数字化信息资源的挖掘、加工、整理、存储、传输与管理为主要内容,包含众多分布式、超大规模、可互操作的多媒体资源库群,通过互联网络可得到高效跨库、无缝链接、不受时间和地域限制的信息服务。它不是一个单独的个体,而是由包括图书馆、情报机构等在内的众多数字化信息源互联而形成的一个信息空间。

1.2数字图书馆的特征

1.2.1电子资源代替纸质资源。数字图书馆是图书馆的一种形式,其最大的特点就是摒弃了传统图书馆的物理形态,转而表现为数字形态的数字信号,从而使阅读方式发生了改变。1.2.2存储网络化。在电子图书资源的存储和存放方面,数字图书馆主要是利用网络空间对信息进行存储,而基本不占用物流空间,为精简图书馆做出了贡献。1.2.3管理的特殊性。首先,数字图书馆集中数字对象,通过网点分布发散的形式,利用网络的快捷性和共享性,使电子图书资源可以较快地到达对其进行搜索的用户手中。其次,数字图书馆具有一定的标准和规范。最后,数字图书馆一般提供个性化、单独化的完善的服务方式,读者可以按照自己的需求进行个性化阅读爱好定制和发展。1.3数字图书馆的主要功能数字图书馆的功能主要表现为:①数字图书馆具有信息数字化功能。这是数字图书馆建立博硕士论文库、古籍拓片数据库、地方文献资源库的基础。②数字图书馆具有跨地域和跨专业检索阅读的功能。③数字图书馆可以对大量数据进行存储和整理。

2黑龙江地区电子图书资源发展及其电子图书资源建设方式初探

2.1黑龙江地区电子图书资源发展现状

黑龙江省图书馆作为黑龙江省域公共图书馆总馆,下辖11个市级图书分馆,各总分馆之间的信息资源逐步构建为共享体系,以组建黑龙江公共图书馆文化传播集群城市。黑龙江省图书馆官网公布,黑龙江省图书馆馆藏资源总量达280余万册,报刊5,000余种,电子文献33,778件,专题数据库7个,自建数据库17个[2]。

2.2黑龙江地区区域性数字图书馆电子图书资源建设方式研究

黑龙江地区数字图书馆是我国省域数字图书馆的典型代表,其主要经营模式是服务型模式,主要表现为整合自身的特殊馆藏以及网络出版资源和网络未出版资源,以一个特殊的形式为读者服务。这种数字图书馆的电子资源建设主要有以下几个步骤[3]。2.2.1需求分析。需求分析部分可以分为两步,即需求分析的原则树立和需求分析的功能设计。需求分析的原则主要包括:以人为本,开放性,标准化,参数化和实用性,可拓展性和平台无关性。系统功能设计的步骤主要有:①整合电子资源,统一黑龙江地区的数字图书馆电子图书资源模式。②建立统一的网站地址,完成对电子图书资源需求个性化的定制和解释。③确保网上联结方式,对周边网络的电子图书资源形成整合之势。④设定能够及时为读者解决问题的系统途径。2.2.2栏目划分。电子图书馆资源栏目可以分为项目概况、项目公告、图书资源等板块。项目概况主要介绍项目的主要内容、过程、工具和用户需求;项目公告主要介绍项目建设的目标、方式、内容、意义、研究成果、成员单位等;图书资源主要包括网上数据库、全文电子期刊、电子网络图书、硕博学术论文和一些独有的电子图书资源等。2.2.3关键技术选择。网站的建设采用多种技术,如:EnterpriseJavaBeans(EJB)、JavaServerservlets、JavaNamingandDirectoryInterface(JNDI)、JavaTransactionAPI(JTA)、CommonObjectRequestBro-kerArchitecture(CORBA)等组成的J2EE技术。2.2.4网站建设。网站建设是黑龙江地区数字图书馆电子图书资源建设的最后一站,也是非常重要的一环。网站建设需要注意的问题有:①网站风格应设计统一,适合读者和图书资源检索者的需求。②网页内容要及时更新,适时维护,加大内容的更新力度,但不要经常更改读者已经接受的布局和界面。③网站可以根据读者要求改进网页的布局,使网站更有活力。④软件和硬件的升级和改进。⑤加强对网络信息安全的保护。

3黑龙江地区数字图书馆的电子图书资源合作建设发展对策

3.1注重资源的整体规划和发展目标的确立

首先,黑龙江地区的数字图书馆电子资源建设必须要有统一的规划和目标,形成区域的联合性和完整性[4]。在建设过程中,黑龙江整个地区的数字图书馆要联合起来,对电子图书资源进行统一的整合和规划。其次,黑龙江地区的数字图书馆电子资源建设要以技术为核心,建立统一的门户网站,多馆合作开展数字参考咨询服务。黑龙江各地区应设立统一的数字图书馆网站,方便用户登录和使用;整合图书馆电子资源,加大黑龙江各地区电子图书资源的归集整合,完善读者对图书资源检索的需求。数字参考咨询服务是数字图书馆的一项重要功能,在区域性数字图书馆体系中,要采用统一的咨询服务平台来解答读者的咨询问题。参考咨询服务由区域内的特定机构负责,该机构可以由中心馆和成员馆的相关专业人员组成,分工协作,为读者解答咨询问题。

3.2注意电子资源的协调发展

一方面,黑龙江地区的数字图书馆要加强网络建设,整合黑龙江各地区的电子图书资源,结合网络优势,联合地区图书资源,发展数字图书馆。这不仅能提高各个数字图书馆的水平,且有利于地区公平、和谐发展,对黑龙江地区的文化建设有重要作用。另一方面,黑龙江地区的数字图书馆要将科研结果与电子图书资源相结合,保证学术成果的共用共享[5]。黑龙江地区的数字图书馆建设在我国尚属起步阶段,在项目的建设过程中,要设定相应的研究方向,吸取国外早期数字图书馆研究与建设脱节的教训[6],以建设促进研究,通过研究成果的转化推动我国数字化图书馆的发展进程。

3.3根据黑龙江地区特色,建立特色电子图书馆藏

①根据黑龙江地区的特点和实际需要,设立高质量的数字化资源库,如:古籍、拓片、特有家谱、地方志、学位论文、会议论文、视音频资料等[7]。②为黑龙江地区的数字图书馆电子图书资源建设设立统一的制度和标准规范。规范和标准是依据,只有具有统一的制度和规范,黑龙江地区的电子图书资源建设才能更好地发展。③设立针对黑龙江数字图书馆电子图书资源的管理机构,加强对电子图书资源的管理。

3.4在合法合规的前提下拓展电子馆藏资源

根据发达国家和地区数字图书馆的建设经验,笔者发现在数字图书馆的电子图书资源收集过程中,所面临的最大的法律问题就是版权的归属问题。目前,国内许多专家学者都对其做出了相应的理解,但在实际执行过程中还存在一定的问题。黑龙江地区数字图书馆电子资源建设要从这方面入手,减少对法律红线的触碰。

3.5加大对黑龙江地区图书馆人才的培养

在新时期,黑龙江地区的图书馆迫切需要与国际接轨且掌握多种语言的人才;还要求工作人员掌握计算机知识和网络技术,能对网上各类资源进行组织、分类和检索。

参考文献:

[1]郑文晖.高校图书馆电子书服务现状的调查与建议:以“211工程”院校为例[J].图书馆工作与研究,2013(2):40-44.

[2]白冰,高波.国外图书馆资源共享现状、特点及启示[J].中国图书馆学报,2013(3):108-121.

[3]王佳.基于案例分析的高职院校数字图书馆建设研究[J].图书馆学刊,2013(7):37-40.

[4]贺延辉.俄罗斯国家数字图书馆的建设与发展[J].中国图书馆学报,2014(5):35-51.

[5]周晓杰.数字阅读与高校图书馆服务创新[J].图书馆学刊,2011(8):83-86.

篇10

数字图书馆以分布式数字信息为对象,以网络资源和读者服务为主体,通过计算机和互联网络,全方位地收集文本文献、声、图像、影视等电子信息资源。本文对构成数字图书馆的三个部分,信息和技术资源以及系统资源进行逐一介绍。

1 信息资源

信息资源作为图书馆生存和发展的基础之一,是满足用户需求的根本保证。网络技术和通讯技术的发展,使图书馆的馆藏文献结构和信息资源发生了根本性的变化,也促进传统图书馆向数字图书馆的急剧转变。目前数字图书馆信息资源类型主要分为4类:

1.1馆藏书目数据库

依托图书馆馆藏文献,建立馆藏文献数目数据库。用于检索馆藏各种信息资源的数据库,它相当于一个图书馆的目录,便于读者查找馆内文献资源。

1.2光盘文献数据库

光盘文献数据库集数据量大,连续性强的特点,包括音像、图文、软件、全文光盘等。其中一部分为二次文献信息,为教学和科研提供重要的信息途径,这些光盘通过光盘塔镜像到图书馆的服务器,或直接通过光盘塔,以网络形式向读者提供。

1.3自建特色数据库

这是高校自主开发建立的数据库,主要对本馆书目、博硕士论文、专业期刊等进行全文数字化加工,主要为学院重点学科服务,体现专业优势。自建数据库的特点是灵活性强,为学院的教学科研服务,把某一领域或专业的资源经过过滤、整合,分类建库,让读者利用起来更方便,提高读者对图书馆资源的利用率。

1.4全文电子文献数据库

通过数据加工商对纸质资源进行扫描包、校对、生成电子文献数据库。它包括图书、期刊等,它以快捷、便于储存、便于复制的优势为读者提供了一个全新的信息资源,是读者利用最多、最受读者欢迎的数据库。

数字图书馆将不同载体的信息资源经过有序整合后,以数字化方式存储,以网络化方式传递,与传统图书馆相比,数字图书馆信息资源具有类型多样化、分布式组织、变换灵活、计算机处理和格式化存储的总体特点。

2 技术资源

技术资源,是建设数字图书馆的技术手段。对数字图书馆影响较大的信息技术主要是:网络通讯技术;信息存储与检索技术;数字化技术。数字图书馆只有综合多个应用系统,才能实现其功能。数字图书馆的技术资源包括:

2.1数据库技术和网络通讯技术

数字图书馆所运用的数据库技术可分为两个方面:一方面是应用数据库管理系统软件,进行二次开发,建立新数据库;另一方面是管理性软件的商品化数据库,比如光盘、多媒体数据库、全文数据库、超文本数据库等。计算机通讯网络是数字图书馆的技术支撑,也是数字图书馆实现深度开发和资源共享的基本条件。

2.2数据描述和数据创建

数字图书馆的系统构成要求按照一定的语言,对创建的数字化信息进行描述,其中包括结构化与非结构化的声、像、图、全文数据信息描述,目前许多图书馆采用SGML描述语言。数据创建是指将非数字化信息进行数字化转换,如文本录入、图像扫描、声音影像的数字化等。

2.3信息资源的存储技术

在数字图书馆建设中,贮存庞大的信息资源是数字图书馆建设的基础,信息资源的规划、采集、加工、存储、处理等流程是信息资源建设的基本流程。数字图书馆设计的多媒体信息资源,在保存到数据库之前必须进行压缩,以降低数据库成本,使数据库规模保持在可管理的范围内。

2.4全文检索

数字图书馆在技术上必须支持SGML、PDF、XML、HTML等格式的全文检索,中国数字图书馆示范工程――“超星数字图书馆”基于小波变换图像压缩技术的PDG图文资料数字化技术,就符合国际标准的PDF格式,超星与清华大学合作,成功开发的PDG全文检索技术,实现了对PDG数字图书的每一个字进行检索。在目次级检索问题上,通过录入书名、作者、出版社、出版日期、价格、ISBN号等字段,读者就可以检索到字段内的任何内容,而且可以通过TRS等检索系统对全部图书的目次进行检索。

3 数字图书馆系统资源

3.1 图书馆管理系统

图书馆管理系统可以对图书馆的书刊和非印刷资料的采访、编目、典藏、流通、公共查询、馆际互借、参考咨询等业务工作进行自动化管理。目前军队院校使用的是全军统一配发的MILNETS系统。但随着图书馆数字化建设的深入发展,对数字图书馆系统资源的功能也不断提升,MILNETS系统也正在改进升级中以适应数字化图书馆发展的需要。

3.2 集成全文检索系统

全文检索系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等,其中最为关键的部分是全文检索引擎,各种应用程序都需要建立在这个引擎之上,一个全文检索应用的优异程度,是由全文检索引擎来决定的,提升全文检索引擎的效率是提升全文检索应用的根本。一个优异的全文检索引擎,在做到效率优化的同时,还需要具有开放的体系结构,以方便程序员对整个系统进行优化改造,或者是添加原有系统没有的功能。

3.3 集成“一站式”检索系统

一站式检索系统是通过对数字资源作最完整、最大限度的整合,集信息重组、信息集成、信息中介、信息定制服务模式于一体,利用计算机及网络为读者提供文献信息服务的系统,使读者能够在一个入口、一个检索界面、经过一次检索就可以获得全方位的数字资源和全面的相关信息的一体化集成式服务,达到简化检索界面,去除重复操作,节约读者时间,提高检索效率的目的。

4 结语

各院校除了购买数据加工商提供的数据外,还根据各自院校的专业特点加工特色资源,目前很多图书馆都已拥有几个T甚至10几个T数字资源。这些资源通过网络技术被大量用户使用,使图书馆的功能扩大化,并适当缓解了原始图书馆大量资源浪费的和资源重复性建设的问题。