期刊在线咨询服务, 立即咨询
数据分析与知识发现杂志

杂志介绍

数据分析与知识发现杂志是由中国科学院主管,中国科学院文献情报中心主办的一本CSSCI南大期刊。

数据分析与知识发现杂志创刊于1980,发行周期为月刊,杂志类别为计算机类。

  • 基于多兴趣特征分析的图书馆个性化图书推荐方法

    关键词: 个性化推荐  渐进遗忘策略  兴趣特征  混合推荐  

    应用渐进遗忘策略和滑动窗口相结合的更新算法等,建立读者的兴趣词库和索引库,进而建立读者的多兴趣特征库。分别计算读者兴趣特征的特征词库以及索引库与书籍的相似度,将这两种方法计算出的相似度进行线性叠加,建立具有可操作性和扩展性的混合推荐算法,从而实现图书馆书籍的个性化推荐方法。该方法综合利用《中图法》中书籍所属的索引类别...

  • 一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究

    关键词: 相关性判断策略  主题爬行器  主题搜索  数字图书馆  

    为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。

  • 中文生物医学文献主题标引中副主题词自动组配机制探讨

    关键词: 副主题词  副主题词组配  主题标引  自动组配  

    简要介绍当前国内外副主题词自动组配的研究现状,提出适用于中文生物医学文献处理的基于拼图一统计学习相结合的副主题词自动组配实现方法,详细阐述分析该混合策略方法的实现机制及实现效果,并指出后续的改进建议。

  • 基于概念格的Folksonomy知识组织研究——关联标签的结构特征分析

    关键词: folksonomy  概念格  关联标签  语义关联词  语义下位词  

    以BibSonomy.org真实数据为研究对象,通过网站“Related Tag”栏分别获取两个梯次的关联标签集合。采用形式概念分析的方法构建关联标签概念格,并基于概念格对关联标签进行聚类分析和关联规则挖掘,以此揭示出关联标签间隐含的概念问关系和潜在的语义关联。对关联标签这一新兴的导航方式中隐含的结构特征进行分析和研究,提出关联标签问存在...

  • 基于菱形思维的概念检索关键词扩展方法研究

    关键词: 概念检索  检索模型  菱形思维  本体  

    采用菱形思维方法解决问题的方式,构建基于本体的概念检索模型,给出关键词的物元发散式扩展和扩展词的量化收敛的算法,并设计相关的检验实验,证明该模型能够提高概念检索的查全率和查准率,解决术语中存在的“一义多词”和“一词多义”的问题,同时实现基于本体的检索推荐功能。

  • OverDrive在伦敦书展上报告其图书馆电子书数据

    关键词: 图书馆网站  电子书  书展  伦敦  人口统计特征  图书馆网络  需求情况  用户身份  

    OverDrive在2012年4月16—18日的伦敦书展上进行了其“大数据”系列报告中的首次报告,该报告分析了几十亿电子书和其他从1万8千家公共和学术图书馆网站收集的数据。OverDrive全球图书馆网络的数据将会提供给成员图书馆以及出版商,这些数据包括有关电子书和数字有声书的标题、流通情况、需求情况、馆藏情况,以及网站流量和一般人口统计特征等...

  • 一种提高中英文混编文本标引准确性的方法

    关键词: 中英文混编文本  字符串匹配  自动标引准确性  控制论  乙肝专题文献知识数据库  

    分析生命科学领域中英文混编文本的内在特点,基于控制论原理,提出一种旨在提高中英文混编文本的信息自动标引准确性的整合新方法。该方法包含三个相对独立而又相互联系的部分,即前馈控制、中期控制和反馈控制。实验表明,该新方法可以被成功应用在乙肝专题文献知识数据库的标引中,并能大幅度提高信息标引的准确性。

  • P2P环境下信任社区的形成模型研究

    关键词: p2p  信任  社区  连接  

    P2P社区是具有相似兴趣节点的集合,相似兴趣节点聚簇有助于提高资源共享和发现的效率。针对P2P网络中节点特性的差异,社区不一定都能够提供高资源共享率的问题,提出一种基于信任的自组织社区形成模型,从节点间信任的建立、信任值的存储、信任值的计算三个方面具体研究。随着节点问信息共享的频繁程度变化和节点间信任值的动态更新,P2P网络...

  • 无词典中文高频词快速抽取算法

    关键词: 中文信息处理  高频词抽取  pat数组  中文分词  关键词分析  

    在PAT数组的基础上,引入LCP数组记录文本后缀串的相同前缀长度,通过扫描LCP数组快速抽取文本高频词。该算法不依赖于分词词典,通过探测重复出现串来提取高频词,并能够抽取任意重复字符串,对新词、组合词抽取特别有效。实验结果表明,该算法抽取的高频词可以达到较高的可接受率,在与ICTCLAS系统关键词抽取的比较中也有较高的相同率,且在发...

  • 融合社会网络的协同过滤推荐算法研究

    关键词: 协同过滤  社会网络  重启动随机游走  

    针对传统协同过滤推荐算法的数据稀疏性及恶意行为等问题,提出一种新的基于社会网络的协同过滤推荐算法。该算法借助社会网络信息,结合用户信任和用户兴趣,寻找目标用户最近邻居,并以此作为权重,形成项目推荐,以提高推荐的准确度。实验表明,相对于传统的协同过滤算法,该算法可有效缓解稀疏性及恶意行为带来的问题,显著提高推荐系统的推...

  • 微博用户的影响力指数模型

    关键词: 新浪微博  用户影响力  用户被关注度  活跃指数  微博影响力  

    以新浪微博为研究对象,提出微博用户的用户影响力指数模型。首先将得到的用户被关注度取代当前存在虚假的用户粉丝数,通过较为合理的用户被关注度计算得到微博用户的用户活跃度与微博影响力,最后将用户活跃度与微博影响力作为用户影响力的影响因子合成微博用户的用户影响力。模型考察用户与用户微博两个角度的多个活动因子。实验结果表明,用...

  • 社会性书签网站的使用者与标签特征初探

    关键词: 社会性书签  社会性标记  网络使用者研究  

    以Web2.0时代的社会性书签网站的使用者为对象,采用内容分析、Q方法及访谈法,分析其书签及标签使用特征,并依据其标签选择行为,进一步归纳使用者类型及其标签选择特征。根据影响因素的多元性与使用者选择标签取向,初步分析出4种社会性使用者类型,并探讨其社会性特征及在相关系统的应用。

  • 面向云计算平台的在线存储系统研究与实现

    关键词: 云存储  在线存储系统  基础设施云  

    研究基础设施云中的重要组成部分——云存储系统中在线存储系统的设计与实现。本系统的设计遵循REST架构模式,使用cURL、HSQLDB等开源组件实现目录与文件的创建、上传、下载、删除等功能。

  • NISO发表有关未来电子资源管理系统标准的白皮书

    关键词: 电子资源管理  系统标准  白皮书  数字图书馆联盟  标准组织  国家信息  研究成果  差异分析  

    美国国家信息标准组织(National Information Standards Organization,NISO)宣布发表《兑现电子资源管理的承诺:标准和最佳实践讨论文件》,此出版物是NISO电子资源管理数据标准和最佳实践项目的研究成果之一,该项目是数字图书馆联盟电子资源管理倡议(Electronic Resources Management Initiative,ERMI)的后续。项目的主要目标是对标准...

  • 应用Google云消息框架C2DM实现商务信息推送服务

    关键词: 移动电子商务  信息推送  android  c2dm  

    针对移动电子商务中商务信息推送存在的信息读取不便和推送成本高等问题,基于Google的云消息框架C2DM,设计并实现一种新的商务信息推送服务。从需求分析与技术思路、手机客户端实现、服务器端实现和服务运行效果等方面进行详细阐述。新的服务可以帮助电子商务企业准确且低成本地向客户推送商务信息,也可以帮助客户利用智能手机方便地接收和查...

  • 图书馆云翻译书签的设计与实现

    关键词: 数字图书馆  小书签  云翻译  云释义  jquery  

    针对用户在访问图书馆数字资源时存在的语言和语义障碍,通过合理选择并集成现有的云翻译、云词典服务,设计一种用开源脚本库jQuery实现的浏览器翻译小书签,并就方案的可行性和关键性技术问题展开深入探讨。实践证明该翻译书签具有较强的实用性和良好的用户体验。

  • 个性化新书通报推荐系统的设计与实现

    关键词: 借阅日志  新书通报  个性化服务  数据挖掘  

    基于图书馆业务系统中的借阅日志,构建数据仓储,采用SPSS数据挖掘中的聚类分析方法,挖掘读者与新书之间的分类相关度模式,通过个性化新书通报分类结果集,推荐读者感兴趣的新书。以笔者所在高校图书馆MELINETSII系统中的读者借阅日志为例,设计并实现个性化新书通报推荐系统。

  • Serials Solutions的Summon服务持续改进其学术服务,增强图书馆对科研人员的吸引力

    关键词: 图书馆联盟  学术服务  持续改进  科研人员  吸引力  proquest  用户数量  2009年  

    Serials Solutions是ProQuest有限责任公司的一个业务部门,自2009年推出其Summon服务以来,在短短的三年时间里,其联合索引就从2亿条记录涨到8亿,其用户数量从最开始的2个测试合作伙伴涨到如今的400个机构。研究图书馆联盟(ARL)的成员中有30%多的图书馆都是Summon服务的客户,这也使得Summon服务成为全球学术服务提供商中最受欢迎的。Summ...

  • 链接不是答案:Kngine革命性的搜索应用

    关键词: 智能搜索  应用  链接  革命性  

    链接不是答案,智能搜索公司Kngine于近日了其iPhone和Android应用的beta版。

  • EBSCO出版社推出EBSCOhost馆藏管理软件

    关键词: ebsco  管理软件  特色馆藏  出版社  图书馆员工  馆藏建设  主题范围  电子书  

    EBSCO出版社推出了EBSCOhost馆藏管理软件(EBSCOhost Collection Manager,ECM),该软件能帮助图书馆员工更容易地添加和检索电子书和有声书。ECM能够通过标题、作者、出版商等来检索或浏览电子书和有声书,还可以选择主题范围或是EBSCO馆藏建设专家所创建的特色馆藏。

  • 哈佛大学图书馆公开其百万目录记录

    关键词: 哈佛大学图书馆  公开  目录  access  图书馆分馆  有声读物  学术文章  

    哈佛大学图书馆宣布公开其73个图书馆分馆的1200万目录记录。 这些记录包括有关图书、视频、有声读物、图片、手稿、地图等更多条目的目录信息。哈佛大学图书馆遵循其开放元数据政策并基于CC0(Creacive Commons 0)公共领域许可来公开这些记录。此外,哈佛大学图书馆还在哈佛大学机构库( Digital Access to Schol- arship at Harvard, DASH )...

  • 欧洲图书馆馆藏和Europeana内容将加入Summon服务

    关键词: 图书馆馆藏  欧洲国家  馆藏内容  服务  图书馆馆长  联席会  索引  

    Serials Solutions的Summon网络级发现服务与欧洲国家图书馆馆长联席会议(Conference of European National Librarians,CENL)合作,将欧洲图书馆和Europeana的大量馆藏内容加入Summon的统一索引之中,并提供发现服务。

  • 新的DuraCloud数字资源长期保存和归档服务

    关键词: 数字资源长期保存  服务提供商  归档  成本效益  竞争力  订阅  

    DuraSpace组织近日宣布新的Dura Cloud(DuraCloud.org)服务订阅计划,提供三个层次的有成本效益的云数字资源长期保存和归档服务。该服务的价格与其他商业云服务提供商相比很有竞争力,而且不需要进行额外的数据转移或是可变花费。

  • 第二十六届全国计算机信息管理学术交流会征文通知

    关键词: 计算机信息管理  学术交流会  征文  情报学会  科学技术  知识服务  

    中国科学技术情报学会将于2012年第四季度举办“第二十六届全国计算机信息管理学术交流会”,会议主题为:“关联数据与知识服务研究”。

免责声明

若用户需要出版服务,请联系出版商,地址:北京中关村北四环西路33号,邮编:100190。