时间:2022-12-11 08:29:01
导言:作为写作爱好者,不可错过为您精心挑选的10篇计算机数据库论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
1.Oracle。Oracle是一个最早商品化的关系型数据库管理系统,也是应用广泛、功能强大的数据库管理系统。Oracle作为一个通用的数据库管理系统,不仅具有完整的数据管理功能,还是一个分布式数据库系统,支持各种分布式功能。Oracle使用PL/SQL语言执行各种操作,具有可开放性、可移植性、可伸缩性等功能。
2.Sybase。最新版本的SybaseAdaptiveServer与以前的版本相比,具有更丰富的功能设置,Sybase比较强大的地方在于它对资源的低占有率上。在这一方面,Sybase15还引入了新的“专利查询过程技术”,显示了增强的性能和降低的硬件资源消耗。
3.MicrosoftSQLServer。MicrosoftSQLServer是一种典型的关系型数据库管理系统,可以在许多操作系统上运行,它使用Transact-SQL语言完成数据操作。由于MicrosoftSQLServer是开放式的系统,其它系统可以与它进行完好的交互操作。
4.MicrosoftOffice。作为MicrosoftOffice组件之一的MicrosoftAccess是在Windows环境下非常流行的桌面型数据库管理系统。Access既拥有用户界面(VB可以用来开发用户界面);也拥有逻辑、流程处理,即VBA语言(VB也可以用来做逻辑处理);又可以存储数据,即在“表”中存储数据。使用MicrosoftAccess无需编写任何代码,只需通过直观的可视化操作就可以完成大部分数据管理任务。在MicrosoftAccess数据库中,包括许多组成数据库的基本要素。这些要素是存储信息的表、显示人机交互界面的窗体、有效检索数据的查询、信息输出载体的报表、提高应用效率的宏、功能强大的模块工具等。
5.VisualFoxPro。VisualFoxPro是Microsoft公司VisualStudio系列开发产品之一,简称VFP是Xbase数据库家族的成员,可以运行于Windows9X/2000和WindowsNT平台的32位的数据库开发系统。VisualFoxPro提供了一个功能强大的集成化开发环境,采用可视化和面向对象的程序设计方法,使数据管理和应用程序的开发更加简便。VisualFoxPro是数据库管理软件,可实现数据与应用程序独立。
二、如何选择适合自己的数据库软件
1.按性能应从以下几个方面予以考虑:
(1)构造数据库的难易程度;(2)程序开发的难易程度;(3)数据库管理系统的性能分析;(4)对分布式应用的支持;(5)并行处理能力;(6)可移植性和可扩展性;(7)数据完整性约束;(8)并发控制功能;(9)容错能力;(10)安全性控制;(11)支持汉字处理能力。
2.按需求来选择
选择一个数据库的主要理由就是它的功能是否可以很好地支持你的应用程序。人们通常使用数据库来完成的任务有:支持Web、事务处理、文本搜索,有的情况下复制也是一个重要的要求。在事务处理方面,Oracle看上去更有领先优势,接下来是微软的SQLServer。没有一个开源数据库具有可以与Oracle相媲美的事务处理功能。
3.按易用性和管理来选择;
4.按支持性来选择;
5.按成本因素来选择。
三、结论
Oracle是商业数据库的代表,具有非常丰富的功能、广泛的平台支持和大量的附加功能。目前Access更常用一些,Access不是一种存储格式,是一种软件。ACCESS这个软件本身就具有开发者使用的界面和适合于“最终用户”的界面。但学习FoxPro可为学型数据库管理软件大典基础。微软的SQLServer只可以运行在其Windows操作系统平台上。不过由于Windows操作系统的广泛普及,缺乏对其他系统的支持并没有阻挡SQLServer的市场份额的增长。SQLServer是真正的中大型数据库,VFP是桌面数据库,使用方便、易学,但实际上牺牲了真正数据库的一些功能,如安全性;此外,VFP既是数据库又是编程语言(开发工具)。SQLServer是中大型数据库,VFP是带有自身数据库的编程语言。
总体来说,选择什么样的数据库要看你的应用程序的需要。如果它是以阅读数据库为主的Web应用,MySQL无疑是最佳选择。而如果需要那些事务处理和复杂的数据库功能,那么可选择Oracle和微软的SQLServer。如果你需要一些商业数据库的高级功,但又不想支付授权费用,那么可以考虑PostgreSQL或Ingres。对于嵌入式数据库应用,MySQL和Sybase所占有的系统资源最少。总之,最适合的才是最好的!
参考文献:
[1]刘守根.数据库管理系统的现状和发展方向初探.内江科技,2006,(2).
[2]陈业斌.分布式数据库管理系统的设计与实现.安徽工业大学学报(自然科学版),2005,(3).
[3]姬志刚.计算机、网络与信息社会.科技咨询导报,2006,(20).
[4]薛向阳.数据库管理系统的开发与程序的设计.渭南师范学院学报,2005,(2)
2浅谈软件工程的发展
根据相关文献以及研究学者的研究报告信息资料等得知,软件工程的发展大致经历过以下三个时代,分别为程序设计时代、软件时代、软件工程时代。另外,软件工程生产如同建筑工程生产活动一样也会经历以下阶段,即定义阶段、开发阶段、维护阶段等。此外,软件工程相较于其他工程学科而言存在着以下不同点,例如:建筑工程活动中,当设计图纸出现后,几乎不存在回溯的问题,而在软件工程活动中,每一阶段将会面临多次修改,并且还会产生多次回溯问题,除此之外,软件生产开发之后,其还会面临着运行维护问题,如果用户要求发生变更,则相应的对软件应用进行开发与修改。
3探讨计算机软件开发的相关方法
由于计算机软件开发活动具有一定的复杂性与繁琐性,其开发质量均与其每一步骤相关,因此,为了保障应用软件系统的开发质量,则需要严格按照相关步骤要求来进行,首先拥有清晰的思路,并且遵照相关原则来进行开发、生产,与此同时,还需要采用相应的软件开发方法、图示等进行,另外,在对软件工程进行开发活动的时候,相关软件开发工程师以及工作人员需要保持高度统一、协调,从而为应用开发软件提供有力保障。通过经验的积累结果得知,当前应用软件的开发方法有以下三种,例如:原型化方法、软件生命周期法、自动形式的系统开发方法等,该文以下将应用软件开发的相关方法逐一介绍与分析:1)关于软件开发的原型化方法分析当软件开发工程师以及工作人员对相关定义以及处理算法没有进行确定,并且不了解该软件操作系统的适用性以及人机界面形态等情况下,则需要通过原型化方法来对软件进行开发与生产。2)关于软件开发的生命周期法分析首先,相关软件开发工程师以及工作人员需要从时间的角度对软件定义、开发以及维护等一系列问题进行分析与研究,并且将其步骤分成若干个部分,然后需要严格的对每一部分进行设立相应标准,当前面部分内容完成后,则可以开始下一个部分内容。3)关于软件开发的自动形式系统开发方法分析这种开发方法相较于其他方法较简单,其主要通过第四代技术来设定要求、自动设计、自动编码而实现开发软件的目的,这是由于第四代技术中含有大量的软件开发工具,只需要相关软件开发工程师给予软件设计内容,则第四代技术即可按照其要求进行规范处理、分析,从而实现软件开发的目。
4探讨数据库的安全设计
4.1计算机用户管理工作流程一般情况下,用户管理者需要通过对每一系统操作工作人员进行建立相关权限设置,并且对每一系统操作人员的可操作范围进行了限定,由此可以看出,对用户登录模块的实现主要包括两个数据库,即工作权限数据库、工作人员数据库等,从而有效维护了计算机用户数据库的安全性,大大降低了安全风险系数。
4.2预留部分冗余字段对计算机用户的IP地址以及访问时间等进行预留部分冗余字段,从而有利于后期应用软件的维护工作,从而大大提高应用软件维护效率以及节省大量时间,无论对于软件后期维护工作而言,还是对计算机用户而言均具有着十分重要的意义。
2关系数据库技术在计算机网络设计中的基本原理
在计算机网络技术发展的过程中,数据库技术存在着众多的种类,其中根据数据库模型的运行模式可以分为:网状模型数据库技术、层次模型数据库技术以及关系数据模型数据库技术。这些数据库技术在不同的计算机网络设计活动中有各自的优势,其中关系数据模型数据库技术,以其完美的数据连结技术和高度的数据模型适应性,成为计算机网络设计活动中通用的一种数据库技术。其在运行过程中展示出的完善的数据连结性,能够在计算机网络设计活动中,对任何相关的计算机网络数据进行关联,并能够在一定数据基础上对多种数据进行综合性的关系链接。这种数据信息服务的全面性和数据链接服务形式的多样性,能够极大的满足计算机网络设计活动中多样化的数据信息需求,所以在具体的计算机网络设计活动中成为使用者首选的数据库类型,被广泛的应用于计算机网络设计中。计算机网络设计活动是一个复杂、系统的工程性活动,在其运行活动中要求下属的各个模块都要最大程度上的兼具数据信息服务的全面性和便捷性。在关系数据库中这一系统要求被很好的体现了出来,关系数据库拥有自己管理信息交互平台,能够基于C语言等网络编程语言与使用者进行数据库信息的交流,提高了数据库使用的便捷性和全面性。在计算机数据库软件系统结构中包含着两个数据库访问系统,一个是开放数据库连接性(ODBC),一个是数据访问对象(DAO),这两个数据库访问系统相互独立,能够单独向用户提供数据信息服务。其中ODBC不仅能够基于SQL语言与使用者进行数据信息交互,而且对C语言和SQL数据库之间的访问机制进行了定义,让使用者可以通过C语言这样一种计算机网络设计活动中常见的语言形式与数据库进行信息交互,保证了关系数据库对计算机网络设计活动数据信息交互,让计算机网络设计人员能够通过其最常用的信息交互方式与关系数据库进行交流,保证了关系数据库与计算机网络设计活动积极、有效的互动。DAO为计算机网络设计提供了数据库机制,这一机制是从关系数据库的整体出发对关系数据库内部组成部分和内容的一种规范。当一个关系数据库体系结构由多个DAO构成时,DAO自身的数据库管理机制就会发挥作用,从DAO自身的数据资源特点出发,对关系数据库整体进行协同管理,保证整个关系数据库的数据信息服务的高效进行。DAO的这种自我管理机制和其自身的数据访问对象本质是相互分离的,在具体的管理活动中自我管理机制和数据访问对象能够进行各自独立的管理,让每一个DAO都可以在保证自身数据访问对象性质的基础上,同时实现自身和DAO群体的管理,这种各自独立的数据访问对象管理和运行管理,在保证DAO数据服务对象专业性的同时,也方便了自身的升级改造。而且在关系数据库运行活动中,DAO可以链接相应的网络数据库,实现数据资源的网络化共享和管理。
3关系数据库在计算机网络设计中的优势
关系数据库在计算机网络设计中具有强大的数据存储功能,以及简便的数据转换功能等强大的优势,以下将对关系数据库在计算机网络设计中的优势进行详细的阐述。
3.1强大的数据存储功能
强大的数据存储功能,是关系数据库在计算机网络设计活动中运用的主要优势。随着计算机网络设计应用范围的不断扩大,计算机网络设计活动的内容含量越来越大,内容的组成形式也变得越来越复杂,面对计算机网络设计活动这样一种发展趋势,相应的关系数据库的数据储存能力和数据管理能力变得极为重要。关系数据库的应用,不仅能够对计算机网络设计活动中需求和产生的大量计算机网络设计数据进行及时的存储,而且能够借助内部管理机制的帮助,对这些数据进行有效、准确的规划和管理。关系数据库的应用让计算机网络设计活动的数据管理环节,成为计算机网络设计环节的一个效率增长点。在具体的操作活动中计算机网络设计人员,可以利用数据库强大的数据存储功能将设备参数输入到网络拓扑结构中,进而借助网络拓扑结构对关系数据库进行高效、快捷的操作。如果不能有效的利用关系数据库的辅助作用,有效管理复杂的数据信息,那么计算机网络设计势必会陷入困境中。
3.2简便的数据转换功能
关系数据库在计算机网络设计活动中的优势,还体现在不同数据之间的转换功能。在计算机网络设计活动中,因为设计活动本身可能会涉及到社会经济的各个领域,自身的设计形式也会因为网络设计目标的不同而大相径庭,在计算机网络设计活动中,计算机网络设计的数据从呈现形式和传递方式上都是有本质上的不同的,所以在对计算机网络设计数据进行管理的时候,不同数据之间的转换是一个关键性的问题,只有解决了计算机网络设计活动中的数据转换和数据转换效率的问题,才能促进计算机网络设计活动高效进行。关系数据库在计算机网络设计活动中的应用在一定程度上解决了这一关键性问题,因为关系数据库本身存在的关联性,就是要从两组不同数据中寻找共同点,并基于这些共同点建立二者之间的普遍联系,关系数据库的这种工作机制,在不同形式的数据之间的转换活动中也有积极的作用。数据的两种不同呈现形式本质上也是两种不同数据之间联系的一种体现,二者之间本质内容和内在逻辑的联系是普遍存在的。关系数据库可以根据这一特点,结合自身的工作机制,对二者进行本质上的联系,这样一种在计算机网络设计活动中复杂无比的问题,在关系数据库的参与下立刻变得可实现、可操作。关系数据库的存在只是解决了计算机网络设计活动数据转化能力的有无问题,只有强化计算机网络设计活动中数据转化能力的效率和便捷性,才能在网络设计的实际工作中起到更加积极的效果。所以在关系数据库的建立健全活动中,对其自身的数据转换能力的强化,是关系数据库发展完善的未来方向。这一改进必须要将关系数据库的数据转化能力与关系数据库的信息交互系统结合起来,保证使用者对关系数据库的数据转换能力有更加直接的参与和应用,同时要结合计算机网络设计活动发展的实际,对网络设计活动中可能会涉及到的数据呈现形式进行系统、详细的统计,并在关系数据库中对这些数据的呈现形式进行广泛的应用。具体而言,就是要在关系数据库中,对计算机网络设计活动中可能会涉及到的数据呈现形式进行定义,并设置相应的数据转化机制,在对数据信息进行存储时,尽量选择应用范围最广的数据呈现形式进行存储,以最大限度的保证计算机网络设计活动的数据需求,同时也要定义好各种数据呈现形式的转化机制,在使用者产生特殊的数据呈现形式需求时,能够运用相应的数据转换机制,进行数据呈现形式的转换,以保证计算机网络设计活动的高效进行。
关键字:嵌入式移动计算嵌入式移动数据库EMDB系统结构
1引言
随着移动计算技术的发展,移动数据库逐步走向应用,在嵌入式操作系统中加入移动数据库,也越来越显示出其重要性。
1.1嵌入式系统
嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。它一般由嵌入式微处理器、硬件设备、嵌入式操作系统以及用户的应用程序等四个部分组成,用于实现对其他设备的控制、监视或管理等功能。
嵌入式系统一般指非PC系统,它包括硬件和软件两部分。硬件包括处理器/微处理器、存储器及外设器件和I/O端口、图形控制器等。软件部分包括操作系统软件(OS)(要求实时和多任务操作)和应用程序编程。有时设计人员把这两种软件组合在一起。应用程序控制着系统的运作和行为;而操作系统控制着应用程序编程与硬件的交互作用。
1.2移动计算
移动计算是一种新型的技术,它使得计算机或其它信息设备,在没有与固定的物理连接设备相连的情况下,能够传输数据。移动计算的作用在于,将有用、准确、及时的信息与中央信息系统相互作用,分担中央信息系统的计算压力,使有用、准确、及时的信息能提供给在任何时间、任何地点需要它的任何用户。移动计算环境比传统的计算环境更为复杂和灵活。典型的移动计算环境有[1]:
(1)智能计算设备+无线网络。通过无线网络,智能计算设备可以随时进入MCE主网络;
(2)智能计算设备+调制解调器+电话网络。在不同地点,将调制解调器和附近的电话相连接,通过电话网进入MCE主网络;
(3)移动用户+传统工作站+传统有线网络。移动用户在不同场地使用静态计算机获得MCE的服务。
1.3嵌入式移动数据库
数据库技术一直在随着计算的发展而不断进步。凡是有数据的地方,就要用到数据库来协助管理数据。移动计算也是对数据的处理,离开对数据的管理、处理,计算机就毫无意义。移动计算同时又强调其移动性,传统的PC机要做到移动,同时在苛刻的环境下作到良好的运作也是不可能的。此时,嵌入式很好的满足了移动计算对移动客户端计算的要求。三者从这一点上结合就产生了当今数据库的一个新的发展空间:嵌入式数据库技术。移动数据库是指支持移动计算环境的分布式数据库。由于移动数据库系统通常应用在诸如掌上电脑、PDA、车载设备、移动电话等嵌入式设备中,因此,它又被称为嵌入式移动数据库系统。
2嵌入式移动数据库的特点及其应用
2.1嵌入式移动数据库特点
嵌入式移动数据库在实际应用中必须解决好数据的一致性(复制性)、高效的事务处理、数据的安全性等问题。
(1)数据的一致性
移动数据库的一个显著特点是,移动终端之间以及与服务器之间的连接是一种弱连接。即低带宽、长延迟、不稳定和经常性的断开。为了支持用户在弱环境下对数据库的操作,现在普遍采用乐观复制方法(Optimisticreplication或Lazyreplication)允许用户对本地缓存上的数据副本进行操作。待网络重新连接后再与数据库服务器或其它终端交换数据修改信息,并通过冲突检测和协调来恢复数据的一致性。
(2)高效的事务处理
移动事务处理要解决在移动环境中频繁的、可预见的、拆连情况下的事务处理。为了保证活动事务的顺利完成,必须设计和实现新的事务管理策略和算法,方法如下:
根据网络连接情况来确定事务处理的优先级,网络连接速度高的事务请求优先处理。
根据操作时间来确定事务是否迁移,即长时间的事务操作将全部迁移到服务器上执行,无需保证网络的一直畅通。
根据数据量的大小来确定事务是上载执行还是下载数据副本执行后上载。
事务处理过程中,网络断接处理时采用服务器发现机制还是采用客户端声明机制。
事务移动(如:位置相关查询)过程中的用户位置属性的实时更新。
完善的日志记录策略。
(3)数据的安全性
许多应用领域的嵌入式设备是系统中数据管理或处理的关键设备,因此嵌入式设备上的数据库系统对存取权限的控制比较严格。同时,许多嵌入式设备具有较高的移动性、便携性和非固定的工作环境,也带来潜在的不安全因素。同时某些数据的个人隐私性又很高,因此在防止碰撞、磁场干扰、遗失、盗窃等对个人数据安全的威胁上需要提供充分的安全性保证。保证数据安全的主要措施如下:
对移动终端进行认证,防止非法终端的欺骗性接入。
对无线通信进行加密,防止数据信息泄漏。
对下载的数据副本加密存储,以防移动终端物理丢失后的数据泄密[2]。
2.2嵌入式移动数据库应用
目前,嵌入式移动数据库有两种应用,可划分为水平应用和垂直应用。所谓水平应用,是指应用方案能够用于多种不同行业,只需要极少的定制工作;而垂直应用则针对特定行业的应用,数据处理具有独特性。与水平应用相比,垂直型应用具有明显的行业特殊性,不同领域的应用之间差别较大,结果表示和服务器数据库的管理也有很大不同。主要涉及保险、银行业、航班信息、政府部门等具体的行业领域。如图所示[3]:
图1嵌入式移动数据库的应用分类
3嵌入式移动数据库管理系统(EMDBMS)的特性
3.1嵌入式移动数据库管理系统的功能需求
移动计算环境中的数据库管理系统,是一种动态分布式数据库管理系统。由于嵌入式移动数据库管理系统运行在移动计算的环境之下,应用于嵌入式操作系统之上,所以它有自己的功能需求:
(1)微小内核结构
考虑到嵌入式设备的资源有限,嵌入式移动DBMS应采用微型化技术实现,可在满足应用的前提下,紧缩其系统结构以满足嵌入式应用的需求。
(2)对标准SQL的支持
嵌入式移动DBMS应能提供对标准SQL的支持。支持SQL92标准的子集,支持数据查询(连接查询、子查询、排序、分组等)、插入、更新、删除多种标准的SQL语句,以充分满足嵌入式应用开发的需求。
(3)事务管理功能
嵌入式移动DBMS应具有事务处理能力,可自动维护事务的完整性、原子性等特性;支持实体完整性和引用完整性。
(4)完善的数据同步机制
数据同步是嵌入式数据库最重要的特点。通过数据复制,可以将嵌入式数据库或主数据库的变化情况应用到对方,以保证数据的一致性。
(5)支持多种连接协议。
嵌入式移动DBMS应支持多种通信连接协议。可以通过串行通信、TCP/IP、红外传输、蓝牙等多种连接方式,实现与嵌入式设备和数据库服务器的连接。
(6)完备的嵌入式数据库的管理功能
嵌入式移动DBMS应具有自动恢复功能,可进行嵌入式数据库管理,并能够提供数据的备份和恢复,保证用户数据安全可靠。支持多种嵌入式操作系统嵌入式移动DBMS应能支持WindowsCE、PalmOS等多种目前流行的嵌入式操作系统,这样才能使嵌入式移动数据库管理系统不受移动终端的限制。
3.2嵌入式移动数据库管理系统的特点
基于以上分析不难得出嵌入式移动数据库的管理系统应具有如下特点:
(1)提供多种数据同步方式。具有上载同步、下载同步和完全同步三种同步方式。
(2)具有完善的冲突检测机制,和灵活的冲突解决方案,具有冲突日志记录功能。企业级应用中冲突是不可避免的,不同的数据库系统认为冲突发生的位置是不一样的。解决冲突的规则可以是系统预定义的也可以是用户自定义的。
(3)支持快速同步。系统同步时,只传递变化的数据,即增量上下载,节省了大量的同步时间。
(4)支持表的水平分割和垂直分割复制,最大限度地降低了嵌入式数据库的大小。
(5)支持异构数据源连接同步。可以用支持ODBC的异构数据源,作为主数据库和嵌入式设备上的数据库,以进行数据同步。
(6)具有主动同步的功能。允许用户对系统提供的同步事件自定义过程实现,并提供最大灵活度的同步过程。
4嵌入式移动数据库的数据管理模式
图2数据管理模式
嵌入式数据库的应用分为个人应用和企业级应用。在个人应用中,与外界较少交换数据,而且不必考虑多个数据库的数据一致性。在企业级应用中,嵌入式数据库要与企业级数据库交换数据,构成分布式数据库系统,支持复杂的业务活动。
在数据库三级应用模式中,EMDB系统一般采用EMDB+同步/复制服务器+企业级DB,如我们见到的IBM提供的嵌入式设备和移动企业级应用解决方案就是由3部分组成:DB2Everyplace嵌入式数据库、DB2EveryplaceSyncServer和UniversalDatabase企业级数据库。在此模式中,EMDBS由移动设备中的EMDBMS和固定节点上的同步/复制服务器这两部分构成。这种方案的指导思想是将DBMS的功能分解,简化移动设备中的功能,进而减少对移动设备资源的需求[4]。
5嵌入式移动数据库的系统结构
(1)数据库服务器DBSVR(DatabaseServer)
可以是大型数据库系统,如:Oracle,Sybase,DB2,SQLServer,一般为固定结点。每个DBSVR上维护本地数据库的一个完整的副本,服务器之间由可靠的高速互联网连接在一起,构成一个传统意义上的分布数据库系统。
图3典型嵌入式移动数据库的系统结构
(2)移动支持结点MSS(MobileSupportStation)
进行分布式事务处理,控制EMDB和DBSVR之间的数据交换并支持一个无线单元(cell),具有无线联网能力和同步功能,MSS也位于高速网络中。服务器可以与MSS为同一台机器。
(3)位置服务器LS(LocationServer)
(4)可信部分
由固定网络以及网络上的固定主机组成,固定主机分为两类:一类是不带无线通讯的主机,如DSSVR和LS;另一类是带有无线通讯接口MSS。
(5)移动客户机MC(MobileClient)
MC的处理能力与存储能力相对于服务器来说非常有限,且具有移动性(即可以出现在任意一个无线单元中),在它上面保存一部分数据库副本,并通过EMDB对本地数据进行管理,可以通过无线链路与一个MSS通信,通过MSS上的ODBC接口,EMDB可以与DBSVR进行数据交换。从而与整个固定网络连通,也可以接受由MSS发送的广播信息。它会经常与服务器断接(指MC无法与任意一个联机通信)即使在与服务器保持连接时,由于MC所处的网络环境多变,MC与服务器之间的网络带宽相差很大,且可靠性较低,网络延迟较大。
(6)本地数据库Rep(Replication)数据库副本
(7)EMDB
嵌入式移动数据库,工作方式为:每当MC发出一个查询请求Q1时,它首先查询本地数据库(移动子集上),若满足查询条件要求则直接返回给MC,否则就向VS提交查询请求,由VS代替MC完成查询并将结果返回给MC(前提是两者处于连接状态)。若MC处于断接状态,则也只能在MC上执行本地查询。若在断接期间更新了MC上的数据,则该数据将在VS再次连接时,进行数据重集成,通过一致性维护算法来保证一致性。主要EMDB的应用模式都是立足于嵌入式设备作客户端,在嵌入式设备上运行一个精巧的EMDB,在通过同步或复制技术与企业级数据库连接。这种应用模式在支持嵌入式设备的同时,还支持移动设备,甚至无线移动设备,构成基于移动环境的应用[5]。
6结束语
现在,世界已经进入了后PC机时代。信息电器如个人数字助理、web可视电话、移动电话的GPS或W-CDMA产品、TV机顶盒、电视会议机、数码相机等嵌入式设备已经在人们生活中广泛应用。相信随着科技的发展,嵌入式移动数据库技术也必将给人们的生活带来更大的方便和改变。
参考文献
[1]冯玉才李东等.一种移动数据库管理系统的体系结构,计算机研究与发展[J],2001年
[2]黄军政.蔡瀛捷.移动计算推动数据库移动,中国计算机用户[J],2004年9月第36期
1.引言
在Internet应用中,将服务器端脚本技术和客户端脚本技术结合起来可以制作出丰富多彩的页面。CGI和ASP是比较流行的服务器端脚本技术。通常CGI在跨平台的开发中扮演着主要角色,可以使用VB、C或Perl等来实现,用它们写的CGI脚本是一个单独的程序,而不是嵌在HTML文档中再通过另一个程序解释替换的,所以它是一种“非嵌入式”的服务器端脚本。另外,每一次修改CGI程序都必须重新将其编译成执行文件,因此,这样的编写方式事实上是比较困难且没有效率。ASP则是嵌入式的服务器端脚本,每一次修改脚本并不需要重新编译成执行文件就可以直接执行,但ASP有一个致命的缺点:不具有跨平台开发能力。目前ASP只能在Windows环境下运行,而无法在Internet上的Unix平台下使用。在这种情况下PHP的问世,在WelCGI的领域里掀起了一场革命。
2.PHP介绍
PHP(PersonalHomePage)是一种跨平台的服务器端嵌入式脚本语言。它最初是RasmusLerdorf于1994年开发的。早期的版本,提供了访客留言本、访客计数器等简单功能。随后,在第二版中增加了对mSQL的支持。自此奠定了PHP在动态网页开发上的影响力,并迅速在Internet上流传开来。截止1999年,已有超过十五万个站点使用PHP。同时,PHP的源代码完全公开,在OpenSource意识抬头的今天,它更是这方面的中流砥柱,随着新函数库的不断加入,使PHP无论在Unix或是Win32的平台上都可以有更多新的功能。如今,PHP已发展至4.0版。在语法方面,PHP混合了C、Java、Perl以及PHP以前版本的优点。它相当于Script与CGI的结合语言,但是其执行将效率却比CGI更好,程序编写也比HTML更便利且更富有弹性,程序的安全性及保密性也比Script好。在函数支持方面,PHP几乎覆盖了Web应用的各个方面,其中最有特色的是数据库函数,使用PHP完成一个含有数据库功能的网页非常简单,而PHP支持的数据库也非常丰富,目前包括:Oracle、Sybase、mSQL、MySQL、Informix等。
3.访问MySQL数据库
MySQL是一个快速、健壮和易用,且支持多线程、多用户的SQL数据库服务器。虽然PHP通过ODBC支持几乎所有的数据库。但对于开发数据驱动的网站而言,选择MySQL应该说是最佳组合,这不仅因为MySQL是免费的,更在于它具有许多同大型数据库相媲美甚至超过它们的优良性能。PHP实现对MySQL数据库的访问有两种方法:
1)利用PHP的数据库函数连接
这里主要用到四个数据库函数:
mysql_connect()建立与MySQL服务器的连接。
mysql_select_db():选择MySQL服务器中的数据库供以后的数据查询操作query处理。mysql_query():送出query字符串以帮助MySQL做相关的处理或执行。
mysql_fetch_row():用来将查询结果result单行移到数组变量中。数组的索引是数字
索引,第一个索引值是0。
2)通过ODBC连接
PHP通过ODBC连接MySQL数据库主要用到四个函数:
Odbc_connect():用来同ODBC数据源建立连接。
Odbc_do():用来在建立连接之后执行数据库查询。
Odbc_result():用于取得当前记录行中某个字段的值。
Odbc_fetch_row():用来把查询结果保存到数组,每个数组元素对应一条记录。
上述两种方法在与数据库建立连接的语法上,并没有太大差别。不过在相比较之下,通过ODBC方式存取数据库比PHP直接存取MySQL耗时间,但通过ODBC接口存取数据库不必担心使用何种数据库,如Oracle,Informix,Sybase等。它们都支持ODBC接口,这样可减少更换数据库时需要更改程序的问题。图1显了PHP连接数据库的两种方法。
PHP
MySQL
MySQL
图1PHP连接数据库说明图
4.一个应用实例
现在很多校园网站都提供成绩查询功能。PHP和MySQL数据库相结合使用可以方便的实现此功能。首先建立数据库Score及数据表Score。建表SQL语句如下:
CreattableScore(
Stu_novarchar(10)notnull,
namevarchar(10)notnull,
scoreltinyint(4),
score2tinyint(4),
PrimaryKey(stu_no)
);
1)通过PHP的数据库函数访问MySQL的代码如下:
〈?php
print(“〈html〉〈head〉\n”);
print(“〈title〉成绩查询〈/title〉〈/head〉\n”);
print(“〈body〉〈cennter〉”);
print(“〈fontsize=6color=”ff0000〉您的成绩如下〈/font〉”);
$comm=mysql_connect(“localhost”,“root”,"");
mysql_select_db(“Score”,$comm);
$str=“Select*FromScoreWherestu_no=’$pstu_no''''andname=’$pname''''”;
$reault=mysql_query($str,$comm);
print(“〈tablealign=center〉”);
$sqlrow=mysql_fetch_row($result));
print(“学号:$sqlrow[0]”);
print(“姓名:$sqlrow[1]”);
print(“成绩1:$sqlrow[2]”);
print(“成绩2:$sqlrow[3]”);
print(“〈/table〉〈body.〈/html〉”);
?〉
2)通过ODBC访问MySQL数据库的代码如下(省略的代码同上):
〈?php
…
$comm=odbc_connect(“Score”,"system","");
$str="Select*FromScoreWherename=’$pname’andstu_no=’$pstu_no’”;
$result=odbc_do($comm,$str);
…
while(odbc_fetch_row($result))
{
$pstu_no=odbc_result($result,"stu_no");
$pname=odbc_result($result,"name");
$score1=odbc_result($result,"score1");
$score2=odbc_result($result,"score2");
print(“学号:$pstu-no”);
print(“姓名:$pname”);
print(“成绩1:$score1”);
print(“成绩2:$score2”);
}
…?〉
5.结束语
对于Wed服务器端的开发,PHP是一种易开发、高效能的动态脚本编程语言。在未来的几年内,PHP必将成为主流的脚本语言,并被Wed研究和开发人员熟悉和掌握。
计算机技术的飞速发展,为古典文献研究的现代化提供了坚实的基础,其贡献是有目共睹的。然而,计算机技术在古典文献研究中的运用仍然存在着极为严重的缺陷也是不容回避的。笔者近几年来主持并直接参加设计“e书库”数据库的过程中,感到有必要将自己的一些想法提供给正在设计有关软件的计算机专业人员、愿意使用该类软件的专家学者们参考。
一、我国古典文献数据库建设的历程
自古以来,历代学者对古典文献整理与研究一直沿袭手工操作的方式,然而自上世纪80年代后,计算机技术开始涉入到古典文献研究中,对传统的古典文献整理与研究方法(自然也对一切需要使用古典文献资料的专业研究)起到了极大冲击。
首先简单回顾一下计算机技术在古典文献研究领域内发展的历程。上世纪80年代初,我国一些图书馆、大专院校及科研机构陆续开始大规模地利用计算机设计并建立数据库。大致说来有两类数据库,一类是书目数据库,一类是文献数据库。南京图书馆于90年代初率先建立书目数据库,对读者检索有关书目起到了极大的帮助。之后,各地图书馆纷纷效尤,类似的书目数据库很快就普及了。虽说至今各地图书馆的书目数据库的检索方式,仍存在机读编码格式不统一的问题,然而书目数据库提供的方便快捷的查询功能,对读者来说无疑是一件大好事,具体到学术研究来说,至少为研究者提供了一个比较方便的查找有关古典文献的实用工具。
在建立书目数据库的同时,一些大专院校与科研机构开始研发各自的文献数据库。从数据制作格式来说,大致可以区分为两类,一类是图像格式,即将按原著内容扫描成PDF图像文本,另一类是元数据格式,即录入文献文本内容(或扫描并转化为电子文本)导入数据库,并转换成可阅读与检索的数据库机读格式。一般说来,无论是PDF格式还是元数据格式,它们数据库容量都较大,也提供了较为原始的检索方式,为学术研究提供了不小的帮助。从上述两类制作格式的数据库来说,PDF图像文本可以直接阅读图像文字,但总体说来不太适应古典文献整理与研究的需要。而元数据格式较为精致,初步具备了较为方便的常用的功能,可以检索、作卡片等等。
古典文献数据库从收录的文献内容来说,大致可以分为两类:一类是类目数据库,即按“类”收录有关图籍,如经学类、史学类、文学类以及甲骨文、金文或出土文献资料、石刻资料等等,另一类是综合数据库,如《四库全书》、《四部丛刊》、《国学宝典》之类数据库。
大陆最早的古典文献数据库是河南大学的《宋人笔记检索系统南宋主要历史文献》,建立于1987年。之后,各种数据库纷纷涌现,比较重要的有南京大学、河南大学、苏州大学联合研制的《计算机甲骨文信息处理系统》、中国社会科学院《全唐诗》、《先秦魏晋南北朝诗》、《全上古三代秦汉三国六朝文》、《十三经》、《全唐文》、《诸子集成》等数据库、北京大学《全宋诗》数据库、南京师范大学《全唐五代宋词》数据库、四川大学《宋会要辑稿》数据库(与海外合作)等等。港台古籍数字化起步较早,均采用繁体字形式。1984年台湾中央研究院历史语言研究所开始研发《汉籍全文资料库》,香港中文大学则有《汉及以前全部传世文献》、《魏晋南北朝全部传世文献》、《竹简帛书出土文献》数据库等等。其中《竹简帛书出土文献》收录《马王堆汉墓帛书》、《武威汉简》、《睡虎地秦墓汉简》、《银雀山汉简》、《居延汉简释文合校》及其它散见简牍共140多万字的竹简帛书出土文献,价值颇高。
值得注意的是,这些数据库主要是提供给本单位研究人员使用的,当然也有部分数据库对外开放,为其他研究者提供一定帮助。虽然这些数据库有种种限制,但它们无疑为古典文献的研究(当然包括其它专业的学术研究)提供了方便。之后,随着网络技术的发展,各科研机构、大专院校、各地方的图书馆、以及其它数以百计的网站向用户提供收费或不收费的古籍文献检索服务,甚至还提供古籍文献的下载服务。显然,这些工作的开展,为学术研究的现代化提供了极为有力的支持。至今为止,据笔者所查索到的除科研机构、大专院校、各地图书馆数据库之外,提供各种文献下载的中文网站至少在200个以上,其中就有不少古籍文献下载的网站。这些古典文献数据库或有关网站的建立,确实为古典文献整理与研究乃至其它学术研究提供了极有价值的帮助。
二、目前存在的问题
当然,我们也应该清醒地看到,在古典文献数据库大量涌现的同时,一些潜在的问题与数据库本身的缺陷严重地制约着古典文献数据库的正常发展。
从古典文献数据库技术发展角度来说,笔者认为大致经过三个发展阶段。第一阶段是PDF图像文本数据库,其数据来源主要是以扫描方式获得,形成PDF图像文本。这种图像文本优点是直观,与原书分毫不差,但它的缺点是功能极其单一,仅可供浏览图像和简单地检索书目。虽然第一阶段的数据库功能极少,但毕竟能方便而直观地阅读文献了,因此引起了学者们广泛的兴趣。必须指出的是,由于功能太少,这类数据库难以进一步发展。
第二阶段是元数据数据库,以香港迪志公司投资、书同文数字化技术有限公司设计、上海人民出版社出版的《四库全书》、书同文数字化技术有限公司设计、万方数据电子出版社的《四部丛刊》、尹小林《国学宝典》、南开大学永川公司的《二十四史》,以及大陆、港台等大专院校或科研机构制作的较大型的数据库为代表。它们的优点是具有较多的基本功能,如检索、卡片、打印等功能,有些还附加了日历查询、字典、音乐背景等附加功能。然而,它们都不允许对数据库内的文本错误进行修订、没有图表处理能力、不提供功能升级服务(某些软件提供所谓新版本,实际上只是增加一些文献文本,并未真正提升软件服务功能)。而且由于各自为政,开发者大都采取自定义方法来自造非常用的生僻词,因此各种数据库之间字库不能相互兼容。这一阶段的古典文献数据库也有吸收第一阶段数据库有图像的优点,如上述提及的《四库全书》就附有图像,以利研究者核对文字。该阶段绝大多数数据库注意到版权问题,但仍有一些数据库在版权上出现较大问题,乃至引起法律纠纷。
计算机技术广泛地涉入文科研究领域,各种古典文献数据库纷纷建立,当然给古典文献整理与研究的现代化提供了极其有利的帮助,然而,在笔者看来,目前计算机技术在这一领域中的运用形成纷乱无序的“战国时代”,有许多亟待解决的问题,否则将会影响或说削弱计算机技术在古典文献研究(乃至其它学术研究)中巨大作用。对此弊病,笔者拟作一概述,企望引起有关部门、数据库开发者及使用者的重视,以期真正使计算机技术对古典文献整理与研究起到更大的促进作用。大致说来,主要问题有以下几个方面:
其一,缺乏整体领导与规划,国家投资与收益不对称。当然,首先应该看到,国家有关部门已经着手做了一些规划,也实施建立一些比较大的古典文献数据库,如2002年10月,国家科技图书文献中心受科技部的委托,牵头联合中国科技信息研究所、国家图书馆、上海图书馆、中科院图书馆、北京大学图书馆等单位,启动了我国数字图书馆标准规范建设项目。这一项目的目的就是力图建立我国比较统一和规范的数字图书馆标准,自然也会对建立古典文献数据库有较大的借鉴与参考的价值。又如北京大学《中国基本古籍库》、上海图书馆《古籍影像光盘制作及检索系统》等等,也由国家有关部门投入大量资金,而且已经启动并完成了部分内容。不过也应该强调,由于国家没有制定出一个比较符合国内数据库发展状况的真正有价值的规范体系,因此这些项目的承担者仍是各自为政,数据库之间并不能兼容,不可能形成技术“合力”。再从所取得的社会效益或说实际使用价值来看,也不尽人意。因为至今为止建立的各种数据库仍人为地设置许多障碍,无法使它们实现较大的使用价值。数据库由国家投资,收益自然应该归国家,或者成为不收费的公益数据库,但目前收益既不归国家,又未能成为公益数据库,这不能不说是个极大的遗憾。实际上,数据库制作者无偿利用国家投资进行了开发,制作完成后却获得相当丰厚的收益,使人感到有“国家投资,个别单位图利”的印象。笔者不反对交纳一定使用费用,但收费单位一定应该说明收费后去向,绝不允许产生国家投资而由个别单位乃至某些个人得利的情况。
其二,开发商嗜利忘义,数据库错误严重。除上述由国家投资开发的古典文献数据库外,还有一些有一定技术实力的软件开发商加入到古典文献数据库的开发中来了。比较而言,各科研机构、大专院校及各地图书馆建立的古典文献数据库质量较高,而开发商则很少关注数据库中的文献质量。我们承认确有少量开发商制作的数据库质量较高,如迪志公司开发的《四库全书》之类,然而象《四库全书》这样的数据库确实凤毛麟角,难以寻觅。我们发现,甚至有些开发商仅仅是把文本进行文字扫描导入,疏于校对,因此文本错误百出,难以卒读。由于利益驱使,绝大多数开发商都以“独自开发”为己任,数据库设计相互保密,互不兼容,使用户深感不便。这些问题已严重地影响到古典文献数据库的正常发展了。
其三,热门文献数据重复,冷门文献数据罕见。虽说目前数据库品种繁多,但由于考虑到使用者对文献内容的需求,因此许多开发者热衷于开发那些热门数据,而一些比较冷门的文献则鲜有人问津。实际上,冷门的文献并非是没有学术价值的文献,只是使用人较少而已。因而,目前不但数据库中文献内容重复现象极为普遍,甚至同名同姓的数据库也有不少,如《四库全书》就出现了武汉大学版、上海人民出版社版等数种不同版本。且不说那些数量繁多、质量也不甚高的数据库浪费了多少人力物力,其实也使用户陷入无可适从、欲舍不能的境地。用户往往为了某些少量文献内容不得不购买和安装整个数据库操作系统,而且这些庞大的数据库大量占据硬盘空间,导致计算机运行速度大为减慢。而那些允许网上检索的文献数据库又往往容量极大,上网检索者多,导致“交通阻塞”!
其四,技术关卡重重,难以互相兼容。各开发者既鉴于不同开发目的与技术条件,又为防止他人解密,因此在开发过程中在数据库某些程序中人为设置技术障碍,以保障自己利益不受损害。自然,开发者需要投入大量人力物力,保障本身利益不受损害是无可非议的。然而也由于人为地设置了障碍,却使各种文献数据库之间不能兼容,无法形成合力,先进的技术反而成为技术壁垒。实际上,这一情况大大浪费了宝贵的人力资源与财力,对古典文献的开发与利用有百害而无一利。另外,由于技术壁垒,在古典文献数据库的文字方面更导致许多问题。我国古籍常用汉字大约为4万余个,这还不包括超过2万个异体字及数千甲骨文、金文等古文字。然而我国目前在计算机上采纳的国标字库(GB)和扩展字库(GBK),两者相加也只有27000余字,这与我国古籍常用汉字数量相比,实在差距太大。因此,如此小的字库与需求相比确实是捉襟见肘。为了弥补这一缺陷,一些软件设计者就采取在自定义区自造字(乃至占据字库中扩展B的位置)、有些也用图片方式来填字。而这些自造字、图片字,拷贝到WORD文本之后,由于内码位置的差异就变成其它字了,从而导致文本错误。
其五,功能单调,难以真正为科研服务。建立较早的古典文献数据库功能比较单调,只能做些简单检索、拷贝,没有更为先进的功能,不能适应学术研究的需要。后来的一些古典文献数据库也存在类似问题,例如《四库全书》的检索功能,虽说可以采用添加“作者”、“书名”等限定条件,但检索结果只是罗列一排出处,无法直观地了解检索到的具体内容。而且《四库全书》也没有提供更多的功能给用户,因此这一巨大的工程仍远远不能满足用户的需求。况且这一数据库目前已经“定型”,不再继续开发,使用户对此深感遗憾。而其它古典文献数据库设计者的思维大多仍停留在“文本之争”当中,重复着原来设计思想的错误,没有更多地开发为科研服务的有效功能,因此在笔者看来,这一做法显然不可能真正摆脱古典文献数据库目前面临着的困境。
其六,学术圈地,使人心有余而力难用。解放后,一些国家级出版社化费了极大的精力,组织专家点校了不少重要古籍,为学术研究的发展作出了极大贡献。然而时至计算机时代的来临,却出现了“版权”的问题。一些制作者忽视了国家有关版权法规,直接利用了一些出版社的成果来牟取经济利益,理所当然地会产生版权纠纷。笔者以为,保护版权是每个学者乃至每个公民应尽的责任,根本毫无讨价还价的余地。然而问题是,现在一些出版社由于各种原因,没有对自己已出版的点校过的古籍进行开发,而愿意开发这些古籍资源者却无法涉入其中,导致他们处于既想开发这一宝藏又无法回避版权问题的尴尬境地,这就使众多需要使用者望洋兴叹。如果有关出版社不愿授权,那么想要开发这些古籍者只能返回到没有标点的原始文本中去。这种情况确实使每一个希望使用古典文献数据库的用户感到极其失望,而且严重影响了古典整理与研究的现代化进度。
上述种种现实情况,已经是制约计算机技术对古典文献整理与研究支持的瓶颈了,如果不解决这些问题,计算机技术即使再发达,恐怕也难以对古典文献整理与研究予以真正意义上的支持与帮助。
三、如何解决古典文献数据库存在的问题
古典文献数据库存在的问题是十分明显的,那么如何解决这些问题,以利学术研究(当然包括文献研究)的迅速发展?笔者以为现在应该设计和开发出新一代文献数据库的软件。按照笔者设想,这代软件应该以建立能自由升级的公共古典文献数据库为目的,是一种以提供强大功能为主、彻底解决版权问题的数据库,实际上是建立一个规模巨大的功能相对完善的学术研究资源库。所谓公共古典文献数据库是综合性数据库,只能由国家有关部门作为主要规划者,它应该尽可能地包罗我国传世古典文献、碑刻资料和出土文献等。在此基础上允许建立适应每个研究者研究范围的个性化的文献检索服务系统。个性化的文献检索服务系统是指每个具体研究者所拥有的安装在各自计算机上的文献检索服务系统,它拥有一定数量的适合自己研究的范围的古典文献文本。其实,各个研究者并不需要一个“包罗万象”的规模极其巨大的数据库,即使象占据6至7个G硬盘的《四库全书》,具体到一个研究者真正需要的内容并不是全部,而是其中一部分内容。
问题的关键在于公共古典文献数据库与个性化文献检索服务系统两者之间的技术“契合”,即两者互相兼容的程度。公共古典文献数据库应该与个性化文献检索服务系统有所区别,公共古典文献数据库应该侧重于文献数量的完善、完备,而个性化文献检索服务系统则应该考虑其功能强大。因此,从本质上说,公共古典文献数据库应该是一个统一的设计比较周密、与其它个性化数据库在技术上能实现良好兼容的的数据库;而个性化文献检索服务系统应该是“百花齐放”式的但必须能与公共古典文献数据库兼容而非各自为政的小型数据库。两者关系是源与流的关系。鉴于此,笔者以为目前应该从两个层次上来解决问题,一是尽快建立公共古典文献数据库;一是继续开发个性化文献检索服务系统。
根据笔者近几年的实践,感到要解决这些问题并非不可能的。其实只要认真对目前计算机技术在古典文献整理与研究中存在的问题作一分析与梳理,重点突破一些瓶颈问题,应该说是能解决上述这些问题的。那么怎么才能突破上述这些瓶颈呢?笔者以为以下几个方面是值得考虑的。
其一,加强总体规划,建立公共古典文献数据库。作为一个具体单位来说,谁也没有可能建立一个包罗万象的古典文献数据库,因此,这只能由国家有关部门组织人力物力来完成。其实,就目前来说,国家投入资金并不少,但由于制度原因,只是向某些重点院校或科研单位、向重点项目投入巨资,而这些单位建立起各自为政的古典文献数据库、期刊数据库,虽然也为学术研究作了一些贡献,但不可否认的是,由于各自设计思路不同,相互之间不能兼容,已经妨碍到数据库进一步发展了。以笔者愚见,国家有关部门应该主动负起责来,加强领导,重新考虑古典文献数据库的立项问题,组织力量、投入资金,真正建立起一个规模巨大、能为绝大多数研究者利用的公共古典文献数据库。同时也应该考虑所立项的古典文献数据库与其它数据库(如现代文献数据库、当代文献数据库、期刊数据库等)之间的兼容关系,只有这样,或许若干年之后就能建立起一个价值极大的能真正为学术服务的公共古典文献数据库,乃至包罗一切文献的数据库。当然,就公共古典文献数据库来说,可以进行适量收费服务,但主要仍应该定位在“公益”上,不以“利”为主,这样才能真正建立一个有价值的公共古典文献数据库来。
其二,数据库内容与文献检索服务系统分离。这个问题与上述问题是紧密关联在一起的,如果不能真正做到数据库内容与文献检索服务系统分离,那么目前“列国纷争”的面貌是不可能真正解决的。
我们知道,一个古典文献数据库实际上是两大部分组成的,一是古典文献数据库内容,即数据库所包括的文献文本,二是对这些数据进行管理的文献检索服务系统。其实目前所见有关古典文献数据库都是“两者合一”,即既包含一些文献数据内容,又有具体的操作服务系统。事实上,这些古典文献数据库在功能上明显存在缺陷的。就目前古典文献数据库管理形式来说,一是网络管理,一是个人管理。前者是网络数据库,一般是单位所拥有的数据库,即我们所说的网络版,后者是安装在个人电脑中的个人版。就功能来说,网络版没有必要具有卡片、文本修订、书签等个性化的功能,个人版应该具有做卡片、文本修订、书签、文献管理等个性化的功能。就文献数量来说,网络版自然力求文献内容丰富,尽可能包罗文献文本,而个人版实际所需要的文献数量是根据各自研究需要而定的,因而强行“规定”使用所有文献内容并不值得肯定。就文献内容来说,网络版与个人版都应该允许不断地增加其数据库文献内容,但不同的是,网络版应该是只增不减,而个人版应该允许用户根据研究需要自由增减文献内容。
在笔者看来,应该从单纯的文本内容竞争的思维中解脱出来,进入以文献检索服务系统竞争为主,文本竟争为辅的体系,或许是解决古籍文献数据库的出路。也就是说,擅长计算机技术的开发者(开发商)应该注重文献检索服务功能的开发与完善,而具体文本的整理可由研究学术的专业人士来完成。这样,开发者就可能开发出比较成功的文献检索服务系统,而数据库中的文本也由于专业人士的加入而能大大提高文本的准确率,然后合成为一个规模较大的公共古典文献数据库。当然,输入和整理古典文献文本可以采用投标(或以申报项目形式)来确定,规定统一格式,要求保证文本的正确率达到一定比例,完成后再分别导入这一公共古典文献数据库中;经过若干年努力,最终能形成一个规模巨大、适应于学术研究的公共古典文献数据库。我想,采取这种措施不但节省了大量重复投资,真正做到人尽其才,物尽其用,而且一旦建立起这个规模巨大的公共古典文献数据库,可以解决了目前数据库泛滥、文本错误太多、重复劳动等弊病,而且真正能做到广大学者对古典资源“共享共有”。
在此基础上,各个开发商可以力求开发学者们个性化的文献检索服务系统,它无须考虑文献文本内容,但必须功能强大、操作方便,并与公共古典文献数据库完全兼容,学者们通过“购买”文本或其它方式来方便地组建自己的数据库,这样或许会给学术研究带来真正的方便。
还须补充的是,我国的古典文献中有大量表格与图片,而由于技术原因,目前所有古典文献数据库都没有导入原著的表格与图片,极个别数据库有少量图片也是不能检索,这是目前众多古典文献数据库的重大失误之一。其实只要真正化力气去探索,这个问题是不难解决的。因为笔者曾作过设计并反复试验,只要设计合理,图片与表格不但可以导入数据库,而且都是可以在数据库中进行检索。
其三,加速确定字库方案,以利数据库健康发展。当然,要真正解决公共古典文献数据库问题,还必须解决字库问题。目前,国家虽然组织专家在论证有关字库问题,然而由于进程不快,远远落后于当今计算机技术发展的需要。按照笔者的看法,应该建立一个以Unicode字库为基础的、适应汉语古籍需要的、并与国际接轨的真正有中国特色的字库。这就需要抓紧工作,迅速落实扩展字库B的内码。同时根据我国汉字的具体特点,对自定义区域的6400字的内码配置也应该有所规范,这样才能使汉语字库统一问题落实到实处。如果真能做到如此,那么就能真正解决目前古典文献数据库之间字库互不兼容问题。
与字库相关联的是字体问题。古典文献数据库应该考虑到古代文献对文字的特殊需要,笔者以为凡是古代文献数据库中的文本应该保留繁体字,以防繁简不分而导致文义偏差。就目前计算机技术来说,解决这一问题是毫无困难的。其实用繁体字输入文本早已不是问题,而扫描古籍文本再转换成文字的技术也十分成熟,如北京书同文公司的“数码翰林”OCR识别系统,应该说是极有价值的识别软件,对绝大多数繁体文字能够正确识别。如果能再进一步加以改进,使扩充字库数量并与Unicode字库兼容,那么古代文献的文字识别问题是可以得到解决的。应该强调的是,古代文献以繁体字导入数据库,但应该允许在数据库中自由进行繁简转换,换句话说,若需要使用繁体字时,文本可以保留繁体字,而需要简体时,可以十分方便地转换成简体,这样就适应用户对繁简体的不同需要了。
其四,彻底解决古典文献版权问题。这是困挠计算机古典文献数据库建设的重要难题之一。自然,这一问题要真正得到落实确实存在相当困难的,因为版权保护工作任重道远!不过,即使困难再大,古籍文献数据化的发展的潮流是不可能停止的。笔者以为,有关出版社在维护自身法定的版权权益的前提下,应该从大局出发,在收取一定数量的报酬前提下,允许制作有关古典文献的数据库,以利学术研究的发展。至于报酬多少可以也应该实事求是地酌情商定,国家有关部门应该主动与那些出版社协调,亦可将目前大量分散投入到各课题中的资金中抽出部分来补偿有关出版社,双赢互利,以求突破版权瓶颈,早日解决这一棘手的问题。
与此相关的是古典文献电子文本的版权问题,这也是个极难处理的问题。因为用户若贪图小利,版权意识不强,不愿化费代价使用电子文本,就容易产生“盗版”问题,如此就使得制作古典文献电子文本者的正当利益大受损失。按笔者设想,如果真正能够由国家有关部门主管古典文献数据库建设工作,那么就可以设想建立公共古典文献数据库规定导入数据库的文献文本都给予一个“统一编号”,没有统一编号的文献就不能直接导入公共古典文献数据库和个人使用的文献检索服务系统中,也就是说,个人使用古典文献电子文献必须化费一定的代价才能取得使用权,这样就可以保证制作古典文献电子文本者的一定收益,防止版权意识不强者侵权使用。同时由于古典文献电子文本都有了统一编号,那么也就可以防止某一具体文献文本重复录入的问题。即使有部分重复,古典文献电子文本也可以在用户选择过程中优胜劣汰。
【关键词】计算机 数据库 构建 维护
在现今的信息时代里,计算机数据库已成为人们工作、学习不可或缺的工具。数据库的构建是一个庞大而复杂的工程,不仅要结合用户及自身的实际特征,有针对性地选择数据库的构成结构,还要对系统间的各环节的衔接工作做细致入微的细节处理,这样才能保证数据库的稳定运行。计算机数据库的广泛应用,给国民经济带来了巨大的变化,以最小的资源,取得了最佳的效果。数据库结构及其控制系统对于不同的设计者来说,有许多可供选择的空间,最终取决于工作人员的理性思考和专业技术水平的高低。因此,计算机数据库的构建和维护能力是整体经济发展水平的衡量指标。
1 计算机数据库网络构建
数据库的种类相对较多,并且是一项投入相对较大、技术含量较强的的工程,在建设过程中应对节省内存空间的问题进行充分考虑,同时也要提高运行的速度,使用规范化的方法,使数据库的构建相对简便化,对数据的来源以及数据之间的关系进行分析,最终对该系统所涉及到的各个实体进行确定。
1.1 服务端
1.1.1 操作人员管理功能
操作人员属于数据库的监督人员,对数据库的管理至关重要。操作人员所具有的功能包括:对用户的管理、对操作人员的登陆管理、对密码的修改与重置、对系统的简单更改等。其中,很大部分都是对数据库维护的功能,例如简单的修改、新增、删除及查询等。总之,进一步加强操作人员对数据库网络的监督与管理尤为必要。
1.1.2 用户信息管理功能
对用户信息的管理相对简单,一般只是增加新客户资料、删除无效客户资料以及对客户信息进行及时更改与管理等,主要是对客户信息的维护,并及时更新,保证客户信息的准确有效。
1.1.3 计算机管理功能
计算机的管理模式与上述所述大同小异,即对计算机信息的维护,并加强对计算机的管理。不过,客户是个体,而对计算机的管理是整体,因此,需要对计算机的实时信息以及软件及时更新,以保障计算机的正常运行。此外,数据库所具有的优点有效促进了数据库资源的有效利用,降低了人力资源的消耗,促进了资源的合理配置。
1.2 客户端
在计算机的使用中,提供服务的一方叫做伺服端,而接受服务的一方叫做客户端。客户端的构建模式并不复杂,将客户端的主要系统功能锁定,只在桌面上留下客户登陆程序的界面,按要求进行登陆,而客户端的程序正常情况下是停靠在系统的托盘之中,在用户下机的时候使用此图标进行下机,用户下机以后,由客户端将下机的信息发至服务端。
1.2.1 图书馆数据库的构建
图书馆数据库可以搜集各个专业比较有影响力的专家或者学者的学术论文以及文章著作,包括书名、文章名、作者名、专业机构、学科分类、参考文献以及刊物名称、年、卷、页码,为读者提供各层次、全方位的信息资料服务,提高了检索效率和图书资源利用率,有助于学生快速地进行查阅和借鉴,及时解决学习与写作时遇到的难题,节约大量时间,提高学习质量。图书馆数据库主要是为了编制多种索引,建立庞大科学的检索系统。索引就是指读者通过数据库寻求所需要信息的入口。在构建学校数据库的时候,学校首先应该编制索引,索引的编制一定要以科学为依据,使索引与数据库中的相关链接科学合理,对于搜集的资料进行整理,按照学科分类、内容、发表时间等进行分类,然后录入数据库,便于使用者根据关键词、参考文献以及学科分类进行查找和引用,使数据库信息资源的使用更加方便和快捷。
1.2.2 企业的数据库的构建
主要针对各部门间提供准确的数据信息,以使部门间能相互协调配合,从而整体提高工作效率。根据不同部门的各自职责有选择性地做出适当的调整。例如,对于人力资源部门来说,时常会有人动,有人加入,有人退出,这就要求数据库保持较快速地信息调整,同时也应该考虑到,过于频繁的流动对数据库造成的破坏,因此,可以根据企业自身的实际情况,建立独立的流动子数据库。
2 计算机数据库的维护
2.1 加强对于计算机数据日常管理工作
一个数据库通常都是集中在在某台主机上。只要维护好这个数据库,那么用户在使用过程中就可以很好地被监视。一旦有危险出现就会提示在服务器上。这样就是完全的监视了。当然,如果有更好的办法,也是可以试试的。例如,在日常的管理工作中对于工作经验的总结也是非常重要的。在通常的工作中如果发现更好地工作方法可以先试行,如果用着非常方便那么就可以开展起来。这样才能使得数据库的管理工作更加的顺利。
2.2 强化数据库使用者的使用知识
现阶段一部分计算机数据库存在的问题是由于使用者使用不当而造成的,所以有必要对于使用者进行培训,培训相关的数据库使用知识。工作人员可以制定相关的数据库使用方法,让使用者观看、理解;也可以在数据库登录界面制定使用方法指导,快速的培训使用者如何使用计算机数据库。
2.3 加强数据库管理人员的技能
维护计算机数据库,应该加强数据库管理人员的专业技能和综合素质,使它们能够熟练掌握计算机专业知识,熟练运用计算机相关软件。建立专门的数据库校验部门,分派专业管理人员对数据库进行分析和校验,检查数据库构建过程以及检索过程中出现的错误,并且及时进行核实,并且进行更正,保证数据库信息资源的准确性和完整性。
3 结语
随着时代的进步以及科学技术的发展,计算机数据库成为学校以及企业必需的工具。数据库的构建和管理也是一项长期而复杂的工程,因此,在数据库的操作过程中,必须细致入微,衔接得当,创造出一个稳定、准确的操作环境,提高学习和工作的效率。
参考文献
[1]林燕晓.计算机数据库的构建与管理维护[J].科技创新与应用,2013(02):51.
[2]朱巨雷.探析计算机数据库的构建与维护[J].信息与电脑(理论版),2013(05):122-123.
[3]潘江瀚.计算机数据库的构建与维护管理[J].无线互联科技,2012(05):85.
中图分类号:TP393.08
计算机数据库是计算机信息技术的重要组成部分,是计算机应用的一种重要的管理技术。一般意义上说,数据库是数据存储的重要基地,发挥着非常巨大的作用,并且能够进行复杂的数据管理和保护,并在实际应用过程中有很大的灵活性,提供给人们更多的便利。计算机数据库技术在实践中已经在许多领域得到了广泛的应用,它给我们的生活、工作都带来了便捷的服务,但是如何维护其安全成为了当下人们关注的主要问题。数据安全管理的措施和办法已经被广泛的讨论,一些专家和学者也对数据库的安全发表过众多的可行性方案和学术论文,作者在参考相关资料和信息后又结合自身所学和个人实际操作经验提出建立数据库安全模型、加密数据、隐道通道分析技术三种可行性方法,进而有效的进行数据库安全管理。
1 计算机数据库存在的安全问题
计算机数据库存在安全问题主要涉及到计算机操作系统方面的安全问题、用户对网络信息安全方面的意识薄弱问题、数据库系统自身存在的安全问题三个方面。
1.1 计算机操作系统方面的安全问题
操作系统的问题主要在于病毒,后门,数据库系统和操作系统的相关性上。首先,病毒方面,木马程序在操作系统中是可能存在的,这就直接威胁数据库系统的安全。一个木马程序入侵程序给程序修改密码,当密码被更新后,程序中携带的个人资料信息被入侵者获得,其次操作系统后门方面,许多数据库系统的特征参数给数据库管理员带来了方便,但也为数据库服务器主机操作系统留下了后门,入侵者可以通过进门后访问数据库;再次,数据库系统,操作系统与强的相关性。文件管理是操作系统有一个功能,它可以对所有类型的文件,包括数据库文件的授权,通过使用访问控制进行读写和执行,同时也为用户的登录名和密码的控制识别操作系统监控过程序列可以进行,所以由操作系统提供的环境和硬件设备,以确保数据库系统的安全性。
1.2 用户对网络信息安全方面的意识薄弱问题
数据库用户对网络信息安全方面的意识薄弱,其自身没有真正意识到数据库安全的重要性,没有开展安全管理措施,从而导致数据库安全事件频频发生,照成数据库资料被窃取、数据库数据丢失、数据库损坏等问题,这是由于管理疏忽诱发的安全问题。另外数据库的使用者通常计算机操作水平和应用能力较弱,在操作方面容易忽略数据安全问题,在数据库密码设置、软件登陆密码设置、数据加密设置等方面采用较为简单的密码,很容易被不法分子所窃取。
1.3 数据库系统自身存在的安全问题
数据库系统自身存在的问题。目前很多软件的数据库系统采用的是关系数据库,关系数据库系统已使用多年,并具有强大的功能,产品已经非常成熟,深受广大用户的喜爱,由于其开发技术成熟,兼容性强,很多数据开发人员在数据的选用上都会优先考虑使用关系数据库。但是关系数据库在实际的应用中已经固有了一定的特性,其并未在其所兼容的操作系统中,完善数据库安全功能,数据升级改造在安全方面也较为薄弱,其系统漏洞已经被不法分子深入的掌握,关系数据库屡屡遭受到网络攻击。因此,大多数相关的关系数据库系统在安全性能上还不够成熟。
2 数据库安全管理措施
本文所研究的数据库安全管理措施主要包含三个方面:建立数据库安全模型、加密数据、隐道通道分析技术。这三个方面是计算机数据库的安全管理措施中最为立竿见影、最为实用的。
2.1 建立数据库安全模型
数据库安全模型可以分为多级安全模型和多边安全模型,计算机数据库安全模型的建立在维护数据库安全上发挥着重要作用。
(1)多级安全模型:多级数据库安全模型首先应用在军事系统数据库中,其具有较高的安全性和保密性,多级数据库安全模型可以使不同数据库进行安全分类,其安全级别高,防窃取能力强,数据库安全码包含各种各样不同的信息。在通常情况下,多级数据库安全模型从低到高密级分为“秘密”、“机密”、“绝密”,每个安全分类信息只能被密级或高于该密级权限的人使用。多级安全模型具有层级管理模式,高出下一级别的权限使用者可以对下级进行管理,其保密等级逐级提高,用不同的管理关系构建多层安全防护网络,是计算机数据安全管理的有效措施,目前已经被广泛的应用在计算机数据库安全管理中。
(2)多边安全模型:多边数据库安全模型是数据库安全性的重要措施之一,其能够降低数据库的信息发生横向泄漏危险,多边数据安全模型将数据封装在框架中,对包含在框架内的数据库信息进行有效的保护,防止数据泄露。多边数据库安全模型在计算机数据库安全管理方面最大程度的防止数据的丢失,其具有较高的安全性。
2.2 加密数据
数据加密是防止数据库中的数据存储和传输被拦截或被盗的有效方法。其基本思想是根据一定的算法将数据加密的原始数据还没有转换成格式,可以使得不知道解密算法人无法直接识别并且获得数据的真实内容。密码作为保密的关键技术,在解决信息安全问题上发挥着不可替代的作用。随着计算机网络不断渗透到现实生活中的各个领域,加密技术得到了广泛的应用。数据加密是密码技术应用的。数据库系统,承担着存储和管理的关键业务数据和信息的任务,每个信息系统都必须保证其安全性和保密性。通常情况下,数据库系统提供的安全控制措施,能满足一般的数据库的应用,但对于一些重要的部门或敏感领域,只是应用数据库的控制功能是难为充分保证数据安全性的。因此,有必要对存储在数据库中的重要数据加密处理,从而加强存储的数据的安全性。
2.3 隐道通道分析技术
虽然自主和强制访问控制限制了系统中的信息,只有通过安全级别低的主体的高级别安全性的主体流程,但低级别的安全性主体仍然可以通过其他的方式发送消息给高安全级别主体,隐通道便是其中一种。隐蔽通道是一个用户以违反系统安全策略的方式传送信息给另一个用户的机制。它往往是最初由系统用于数据传送访问控制系统资源来传输信息,而这样的沟通往往是不系统内置机制来检测和控制。隐通道包括了存储隐蔽通道和定时隐蔽通道。
3 结语
综上所述,随着数据库越来越被广泛的应用,其涉及的领域越来越广,数据库的安全问题必然成为了当前计算机应用中最为关注的重点。在数据库给我们带来生活和工作的便利同时,其安全问题也成为我们所需要认真研究的对象。总的来说计算机数据库的安全管理措施主要体现在三个方面,即操作系统方面、用户管理方面以及数据库系统自身漏洞方面。在面对数据库的所带来的安全问题时,我们需要一方面提高数据库用户使用数据库的安全意识和重视程度,另方面还需要通过建立数据库安全模型、数据加密等技术手段来强化数据库的安全性能,从系统性能上和应用人员意识上双管齐下,从而提高数据库运行的稳定性和安全性。
参考文献:
[1]薛玉芳,李洁琼,李亚军.数据库安全与防护性的技术研究[J].中国新技术新产品,2011,3.
[2]许方恒.数据库加密模型研究[J].电脑知识与技术,2009,23.
[3]汪新建,罗绯,李明.网络数据库的应用与安全认识[J].西南军医,2009,1.
中图分类号:G623.58文献标识码: A 文章编号:
一、计算机数据库安全管理方面存在的问题
1、计算机操作系统方面的问题
一般来说,操作系统方面的问题主要就是病毒、后门以及数据库系统和操作系统的关联性引起的。
病毒方面:在操作系统中很可能有特洛伊木马程序的存在,这对操作系统来说是一个极大的威胁,这种木马程序可以将入驻的程序的密码加以修改,一旦密码更新,入侵者就会获得信息的密码,使信息内容被窃取、破坏等。
后门方面:虽然数据库系统的特征参数让数据库的管理员操作起来更加方便,可是与此同时,这些参数也为数据库服务器的主机操作系统留下了后门,所以后门也成了访问数据库的通道。
数据库系统和操作系统的关联性方面:数据库和操作系统之间的关联性非常强,操作系统中文件管理这个功能可以通过存取控制对各种文件进行续写和执行等操作,所以数据库文件也存在这方面的威胁;同时,操作系统中的监控程序也能够对数据库中的用户登录和口令鉴别进行控制。所以,数据库的安全与操作系统和硬件设备所组成的环境有很大的关系。
2、管理方面的问题
很多用户都没有真正意义上认识到网络信息安全的重要性,重视程度不够就使得实施的管理措施强度不够,就使得数据库的安全事件经常发生。因为限制数据库服务器的访问权可以减少数据库遭到攻击,所以很多用户都懒得进行补丁的修复,这就在数据库的管理上造成了严重的失误。想要数据库绝对的安全,就必须进行补丁的修复,因为经常修复补丁可以不因为很久以前没有经过修复的漏洞而遭到攻击。这类问题的主要原因就是存在没有进行修补的系统安全漏洞和所设的登录密码太过简单或者没有进行修改,所以,用户应该建立一个测试环境,进行补丁修复,然后确认补丁修复,再修复生产环境的补丁,提高网络信息安全的防范意识,加强管理措施。
3、数据库系统本身存在的问题
关系数据库这个系统已经使用了很多年了,拥有自身强大的特性,产品也非常成熟,但是在实际的应用中,其应该具有的某些特征,在操作系统和数据库系统中并没有被提供,特别是一些比较关键的安全特征。所以,很多关系数据库系统都不是很成熟,还有待改进。
二、强化计算机数据库安全管理技术的有效措施
计算机数据库的安全性是数据库发展的根本,所以,做好数据库的安全管理工作是数据库发展的需要。强化计算机数据库安全管理不仅要提高用户的网络信息安全意识,也要从管理技术方面出发,以下介绍几种常见的数据库安全管理技术:
1、安全模型
给数据库建立安全模型的主要作用就是提高对成功实现关键安全需求的理解层次,安全模型有两种:多级安全模型和多边安全模型。
⑴多级安全模型:此模型最早是用以支持军用系统以及数据库的安全保密的。一般来说密级从高到低可以分为绝密级、机密级和秘密级,这样分级的意义在于使各级的秘密只能让各级的有权限的人知道,这样可以防止高级的信息流入低级,信息所传递的范围始终在控制之内。
⑵多边安全模型:这也是保护数据库安全的重要措施之一,其主要作用是防止信息的横向泄露,尽可能的确保数据库信息的安全。
2、访问控制
访问控制主要是在计算机系统的处理功能的方面对数据库加以保护,其访问控制的对象主要是数据库内部已经进入系统的用户,对数据的安全保护形成一个自订屏障。计算机系统进行活动的对象主要就是主体进程、用户以及客体(资源和数据),而确保主体对客体的访问的合法性就是计算机安全的关键问题,通过管理数据的读出、写入以及修改、删除和执行来保证主体访问客体是被允许的,没有被允许的访问将被拒绝,这样可以确保信息的机密性以及完整和可用性。
访问控制又主要分为两种:自由访问控制和强制访问控制。
⑴自由访问控制:这种控制方法又叫做任选访问控制,被广泛得到应用。运用这种控制方式,资源的拥有者就是创建者,有权利选择可以访问其资源的用户,所以这样就使得用户和用户进程之间可以有选择的与其他的用户进行资源共享。这是对单个的用户所执行的访问控制的过程及措施,而每个用户的权限则是根据系统来确定的。
⑵强制访问控制:在这种控制方式中,系统分配给了主体和客体不一样的安全属性,而用户是不能对自身或其他的客体的安全属性进行更改的,就是不允许单个客户来确定访问权限,用户与用户组的访问权限只能是通过系统管理员来确定,系统是通过对主客体的安全属性进行比较来确定主体能否对客体进行访问。数据管理员应该提前将数据进行备份处理,在发生故障数据遭到破坏或丢失时就可以使用备份的数据使其恢复到以前的状态,这样就保证了数据的完整性与一致性。
3、安全审计
安全设计功能就是监控和记录指定用户在数据库中的操作行为,其实就是对安全方案中的功能提供持续的评估。在安全审计过程中,管理员应该掌握一组可以进行分析的数据,用来发现合适何处出现的违反安全方案的一些操作行为。通过分析安全审计的结果,及时对安全政策进行调整,修补出现的漏洞。所以,安全审计可以记录关键事件、提供容易操作的软件工具和可进行集中处理审计日志的数据形式、发现威胁时进行安全报警等多方面的功能。
三、结束语
当今社会,数据库已经是社会中各企业所发展的重要的组成部分,很大程度上促进了企业的发展,给社会带了了非常可观的价值利益,所以其安全问题应该引起高度的重视,在强化数据库安全管理技术措施的同时,企业的各方面都应该积极配合,这样才能真正意义上提高数据库的安全性。
参考文献:
[1] 马涛,秦轶翠,吴宝珠等.试论计算机数据库安全管理[J].计算机光盘软件与应用,2011,(14):153-153.
引言:计算机数据挖掘技术是基于计算机原有的功能基础之上,融入了一些统计学理论,使人们可以利用数据挖掘技术在众多的计算机系统内部的信息中抓取自己需要的信息和数据。计算机数据挖掘技术的出现极大的促进了社会整体的进步,引领了社会各个领域内的数据量潮流,人们要想在无限的数据中采集有用信息,就必须深入计算机数据挖掘技术的开发研究。
一、计算机数据挖掘技术开发流程
1.1明确数据挖掘目的
由于数据挖掘技术的功能是多种多样的,所以在开发具体的计算机数据挖掘技术过程中需要根据自身需要明确数据挖掘目的,进而选择对应数据库。因为在开发过程中,不同的数据挖掘目标需要依靠不同的挖掘技术数据算法,如果目的不明很容易造成最终开发结果的偏差[1]。
1.2数据选择和预处理
明确数据挖掘目标、数据库后还要对所持有的数据进行选择和预处理,数据选择是要将数据中的部分信息纳入数据挖掘研究范围内,预处理是将这些数据中的错误信息进行删除和修正,确保列下有用信息。
1.3数据挖掘
数据挖掘过程中要有两个步骤,其一是根据挖掘目标确定接下来要利用的开发技术和采用的算法,其二是在确定了挖掘技术和数据算法后构建出数学模型,以此来推动挖掘技术的开发。
1.4评估结果
评估结果的最大作用就是对开发出的数据挖掘结果进行科学评估,对数据挖掘技术的开发成果进行检测和验证。如果数据挖掘结果不能够达到数据挖掘开发目的要求,就要及时进行修正,如果数据开发结果符合数据开发目的要求,那么就可以将其投入到实践应用之中[2]。
二、计算机数据挖掘技术开发
1、可视化技术开发。要想得到有效的信息,就需要从计算机系统中获得的信息入手,但是当前的网络信息中存在不少的隐性信息,这些信息的获得就要依靠计算机数据挖掘技术。采用计算机挖掘技术可以有效的抓取隐性信息的某些特征,当利用散点图的方式将这些隐性信息表现出来。所以可视化技术是计算机数据挖掘技术开发项目中的一个重点。
2、联机分析处理。网络是复杂的,其中的网络信息和数据更是十分的庞杂,要想快速、准确的抓取到自己想要的信息,需要依靠联机分析出不同地域和时段的多维数据,联机分析处理方式需要依靠用户的配合。在处理多维数据时,需要所有计算机用户自行的使用或者筛选出分析算法,利用这些分析算法对数据做处理,这样对探索数据也有巨大的推动作用。
3、决策树。计算机数据挖掘技术的开发中需要对决策树进行规则化建立,决策树是一项重要的开发项目,因为决策树的作用是发挥预测和分类的功能,对所处理的数据信息进行具体的预测和分类。目前开发的决策树算法已经有很多种,主要有SLIQ、SPRINT、ID3、C4.5等,SLIQ算法具备连续性属性,还可以对数据做出具体的分类,SPRINT算法与SLIQ算法有同样的功能属性,并且这两种算法可以通过大型训练集对决策时做出归纳[3]。
4、计算机神经网络。计算机数据挖掘技术在开发之中借助了医学神经系统的研究结果,将人体神经元研究脉络通过技术处理形成了计算机网络神经的研究,并且经过一系列的深入探索,目前已经取得了重大的成果。计算机中研发出的神经网络是安全输入、输出和处理单元三种类型进行规划的,这三个层面代表了计算机神经网络系统,当前的开发结果中显示,可以利用计算机神经网络技术实现数据的调整、计算和整理。
5、遗传算法。计算机数据挖掘技术的开发中借鉴了许多其他学科领域中的研究方向和理论,在自然学科中,生物基因可以通过遗传中的不同变化促进后代的自我优化,利用这种思想理论,在计算机数据挖掘技术的开发中也可以通过对不同模型进行组合、演变来创新开发出新的数据算法。
结束语:计算机数据挖掘技术属于当前社会中最重要的分析工具之一,数据挖掘技术已经被各个领域广泛的应用,并且其功能得到验证,极大的促进了社会行业的快速发展。随着科技水平的日益提升,相信计算机数据挖掘技术将会得到更多方面的创新研究和开发,给社会带来更大的促进作用。
参 考 文 献