期刊在线咨询服务, 立即咨询
数据分析与知识发现杂志

杂志介绍

数据分析与知识发现杂志是由中国科学院主管,中国科学院文献情报中心主办的一本CSSCI南大期刊。

数据分析与知识发现杂志创刊于1980,发行周期为月刊,杂志类别为计算机类。

  • 中国科研人员对arXiv认知和使用的现状调查与分析

    关键词: arxiv  科研人员  用户调查  认知度  使用意愿  

    【目的】了解中国用户对arXiv预印本平台的认知、使用情况以及对arXiv发展的意见建议。【方法】基于国内9家高校及科研机构的教师、研究人员和研究生群体的问卷调查,获得510份调查数据,并运用SPSS等分析工具对调查数据进行分析。【结果】结果表明,中国科研人员对arXiv的认知程度还不是很高,但熟悉arXiv的中国科研人员已认识到在arXiv上论文...

  • 科技知识组织体系共享服务平台服务接口建设研究

    关键词: 服务接口  知识组织  开放查询  语义推理  web服务  

    【目的】通过科技知识组织体系共享服务平台的服务接口建设,有效帮助我国科技信息服务行业实现标引的语义化规范化流程、语义检索与浏览、知识关联与推理发现等服务。【应用背景】采用标准的接口规范构建开放接口是实现科技知识组织体系STKOS对外服务的重要途径之一。【方法】基于科技知识组织体系STKOS引擎API,提出开放查询和推理接口模块化...

  • 中图法与DDC类目自动映射研究

    关键词: 中图法  ddc  类目匹配  自动映射  

    【目的】研究中图法与DDC类目自动映射的问题,通过实现两者的互操作以达到集成检索、浏览和下载跨语言、跨地区的信息资源的目的。【方法】基于人工匹配映射的数据,研究基于特征集、类目匹配规则、类目关系、书目记录的语义匹配算法。【结果】实验证明,将近80%的类目与人工映射结果的数据相同,一定程度上提高了自动映射的准确性。【局限】...

  • 针对训练集分布偏斜问题的数字资源文本分类方法

    关键词: 分布偏斜  粒划分  概率主题模型  文本分类  数字资源  

    【目的】调整训练集分布的不均衡性,以提高科学分类体系下数字资源文本的分类性能。【方法】提出基于粒划分和LDA相结合的新方法B-LDA,首先根据划分准则对训练集进行分割,实现粒度空间的转换,然后采用概率主题模型(LDA)对文本建模,利用类全局语义信息生成新文本,从而使训练集达到分布均衡。【结果】仿真实验结果表明:随着特征项数的变...

  • 利用小样本量机器学习实现学术文摘结构的自动识别

    关键词: 学术文摘  结构识别  机器学习  

    【目的】通过在小样本量下基于机器学习算法实现文摘语句的自动分类,以此实现学术文摘结构的自动识别。【方法】设计多种学术文摘的文本表示特征,利用自然语言处理技术实现特征的自动提取,以此指导朴素贝叶斯、支持向量机模型进行训练,并利用训练模型自动识别文摘结构。【结果】实验证明该方法较之于同类方法能够在较少训练语料下实现较好的...

  • 融合LDA与TextRank的关键词抽取研究

    关键词: 关键词抽取  lda  textrank  图模型  

    【目的】通过将单一文档内部的结构信息和文档整体的主题信息融合到一起进行关键词抽取。【方法】利用LDA对文档集进行主题建模和候选关键词的主题影响力计算,进而对TextRank算法进行改进,将候选关键词的重要性按照主题影响力和邻接关系进行非均匀传递,并构建新的概率转移矩阵用于词图迭代计算和关键词抽取。【结果】实现LDA与TextRank的有效...

  • EBSCO为其开放元数据共享和技术协作政策增加50个数据库

    关键词: ebsco  全文数据库  技术协作  数据共享  合作政策  开放  服务提供商  信息服务  

    EBSCO信息服务(EBSCO)为其元数据共享和与发现服务提供商技术合作政策增加了数据库的数量。目前,EBSCO的所有元数据(如果协议允许,还包括全文)可用于179个EBSCO全文数据库,也可用于所有74个EBSCO数字历史档案(含全文)和全部55万多本电子书。

  • 利用主题标引进行查询重排序

    关键词: 语言模型  信息检索  主题词  主题标引  查询重排序  

    【目的】在伪相关反馈过程中,利用主题标引对查询结果进行重排序。【方法】借助语言模型方法,挖掘主题词与用户查询关系,将用户查询表达为主题词的概率分布,并建立主题词语言模型,进而判断主题词在文档中的权重。在此基础上,重新计算初次查询结果文档分值,进行查询重排序。【结果】本文方法能够较好地为主题词建立语言模型表示,挖掘得到...

  • PlumX增加EBSCO数据库中用户使用情况数据

    关键词: ebsco数据库  用户  统计数据  信息服务  计量指标  文章  供应商  出版商  

    PlumAnalytics的计量指标将包含EBSCO信息服务(EBSCO)数据库以及EBSCO发现服务(EDS)中文章和图书的使用统计数据。这些数据库中的篇章级数据将允许PlumAnalytics的产品PlumX提供来自成千上万供应商的文章和图书的使用统计数据。此次合作标志着出版商将首次对每篇文章的实际使用情况(如摘要浏览次数,下载量等)进行度量。

  • 一种基于自组织映射与径向基函数预测补值的协同过滤推荐方法

    关键词: 推荐系统  协同过滤  自组织映射  径向基函数  

    【目的】基于自组织映射与径向基函数神经网络对协同过滤推荐方法进行改进,提高推荐质量。【应用背景】针对协同过滤推荐方法存在的稀疏性问题,利用神经网络对缺失评价数据进行预测补值,在此基础上提出一种新的提高推荐精度的解决思路。【方法】基于稀疏用户评分矩阵,应用自组织映射神经网络对相似用户进行预聚类,利用同一聚类簇内用户的相...

  • Folksonomy中Tag语义距离测度与可视化研究

    关键词: folksonomy  语义测度  关联标签  社会网络分析  语义可视化  

    【目的】探索Folksonomy中标签语义距离的可视化及测度,为进一步研究优化关联标签导航算法奠定基础。【应用背景】针对语义距离可视化方法弱化关联标签导航行为中主题漂移,提高BibSonomy等Folksonomy网站知识服务表现。【方法】以BibSonomy网站真实数据为研究对象,设计测试标签集筛选及语义距离测量算法,借助有值图谱将最终结果可视化。【结...

  • 基于大众标注的层次信息可视化算法研究

    关键词: 大众标注  层次信息  信息可视化  

    【目的】为了更好地分析大众标注的语义关系,以层次可视化的方式增强用户感知。【应用背景】大众标注可以从普通用户的角度很好地反映网络资源的意义。层次信息可视化技术作为一种有效的表现抽象信息的工具,被广泛应用于辅助用户认知和分析层次数据集。【方法】提出五元组描述大众标注的语义的方法,借用归类方法使大众标注具有层次关系,基于...

  • ProQuest扩大对Spectrum奖学金项目的资助范围

    关键词: proquest  奖学金计划  资助范围  美国图书馆协会  基础设施服务  图书馆员  终身学习  图书馆界  

    一直以来,图书馆作为终身学习的一个基础设施服务于社会。但是,随着图书馆的转型,对具有多元背景的新一代图书馆员的需求更加迫切。美国图书馆协会(ALA)于近日宣布ProQuest将扩大对图书馆界Spectrum奖学金计划的资助范围。

  • 用户在线评论数据挖掘的网商信用度分析

    关键词: 在线评论  网商信用度  评价指标体系  灰色关联分析  

    【目的】对搭载第三方电子商务平台的网商信用度进行分析。【方法】通过德尔菲法确立网商信用度评价指标体系权值;运用中文分词技术及情感词极性识别方法对用户评价进行量化;运用灰色关联分析方法对获取的数据进行信用度得分计算。【结果】通过用户对网商信用度的评价,得出网商信用度在非常好、较好、一般及较差4个等级的用户评价隶属度,进...

  • 科研领域关键词网络的结构特征与启示——基于图情学科的实证研究

    关键词: 关键词网络  共词网络  网络结构  数字图书馆  信息服务  知识管理  

    【目的】系统揭示科研领域关键词网络在整体层面、节点层面的共性结构特征,为后续研究提供依据。【方法】以多个领域为对象,对比分析其关键词网络与随机网络、小世界网络、无标度网络参数,拟合其指标分布、指标间相关性特征。【结果】关键词网络度序列呈负幂律分布、具有极高平均聚类系数和较短平均路径长度;其词频、节点的度数、中介中心性...

  • 网络“水军”探测方法研究

    关键词: 网络信息真实性  正态拟合  时间片段分析  

    【目的】针对网络“水军”所引发的网络信息失真问题,提出“水军”探测方法,从宏观上探测出“水军”。【应用背景】对网络上电影、音乐、书籍等的在线评分进行统计分析,识别出存在“水军”刷分现象的对象。【方法】从宏观上提出基于正态分布拟合的静态探测方法及基于时间序列法的动态探测方法进行“水军”探测,并设计反映某一天评论数量相对...

  • NISO需求驱动的专著采购推荐实践

    关键词: 需求驱动  采购  实践  专著  图书馆馆藏  用户驱动  标准协会  国家信息  

    美国国家信息标准协会(NISO)于近日宣布出版一个新的推荐实践:专著的需求驱动采购(NISORP202014)。需求驱动采购(Demand Driven Acquisition,DDA),也称用户驱动采购,是一种根据用户在候选池中的选择进行专著采购的图书馆馆藏建设方法。NISO的推荐实践就以下问题进行了讨论并向出版商、书商、内容聚合商和图书馆给出推荐实践,

  • 中文短信文本信息流中多话题的分类抽取

    关键词: 短信文本  信息流  话题提取  狄利克雷  吉布斯抽样  

    【目的】为更有效地在中文短信文本信息流(SMS Text Message Flow,SM_F)中进行多话题的分类提取,提出一种基于SM_F特点的话题分类抽取方法SM_F_HT。【方法】将SMF分割成多个短信文本子集SM_Fi,通过层次的狄利克雷过程信息抽取与TF-IDF相结合,建立短信文本向量集上多个概率分布,采用吉布斯抽样并结合特征词属于临时话题的概率进行SM_F话题...

  • 用户主导下的专家检索可信度评测机制研究

    关键词: 用户反馈  专家检索  特征向量  可信度评测  

    【目的】为降低专家检索过程中的噪声并提升用户满意度,提出构建用户主导下的专家检索可信度评测机制。【方法】在BIR模型基础上,阐述评测机制运行需要遵循的原则和假设,围绕专家特征设置参数,依次设计前后端可信度评测机制。【结果】以学术专家检索为例,说明后端可信度评测通过求解最佳专家特征向量目长来降低检索噪声,前端可信度评测将...

  • 利用双语词典检索英汉跨语言剽窃文档对应内容

    关键词: 跨语言剽窃  相似度  歧义  双语词典  未登录词  

    【目的】在英汉跨语言剽窃文档中检索翻译对应内容。【方法】基于双语词典进行相似分析,合并整理词典以提高词语级匹配的准确率和效率,利用整体词频分布、匹配位置特征等解决歧义和多重匹配问题,根据词的对应情况、词的位置信息等综合加权计算句子及段落的相似度。【结果】在真实翻译语料上的实验结果表明,检索的准确率为0.841,召回率为0...

  • 清华智能聊天机器人“小图”的移动应用

    关键词: 移动app  微信公众平台  智能聊天机器人  

    【目的】通过设计和开发清华大学图书馆智能聊天机器人“小图”APP和微信服务,扩展清华“小图”的服务领域。【应用背景】随着智能手机和移动互联网的发展和流行,移动APP和微信成为移动终端上的主要应用人口。【方法】分别基于手机客户端和微信公众平台的开发模式,利用接口与“小图”服务器通信,传送指令和消息,将“小图”的基本功能嵌入到...

  • 图书馆文献数据库运行状态自动监测系统的设计与实现

    关键词: 数字图书馆  文献数据库  运行状态  自动监测  

    【目的】通过程序实现对图书馆文献数据库运行状态的自动监测。【应用背景】针对图书馆大量的文献数据库,采用人工检测其运行状态,效率低且故障发现不及时,机器自动监测与分析更具优势。【方法】采用VB.NET语言在Win7环境下开发,程序采取模拟读者访问数据库的方法,获取文献数据库在访问、检索和阅读三方面的状态信息。【结果】实现文献数...

  • 教育、学习和图书馆到达转折点

    关键词: 图书馆事业  教育费用  终身学习  oclc  移动终端  http  新技术  

    OCLC于近日了一份题为《转折点:教育、学习和图书馆》的研究报告,该报告显示,用户习惯的不断变化催生了一些新技术的出现,如大规模网络公开课程、移动终端等。昂贵的高等教育费用正在逐渐改变人们对教育的期望,并且给教育和终身学习带来了永久的改变。该报告是OCLC成员报告系列中最新的一份,这一系列报告旨在探索影响图书馆和图书馆事业的...

  • 微信作为APP客户端的图书馆公共服务平台

    关键词: 开源软件  图书馆服务  微信公众平台  开发模式  读者互动  

    【目的】利用微信公众平台,扩展图书馆的信息服务渠道,提升读者体验。【应用背景】作为时下最热门的社交工具,微信成为一个很好的移动信息传播平台,深受读者的关注。【方法】在开发模式下,选择.NET作为开发环境,基于开源SDK控件,从微信公众平台发送的XML消息解析、与图书馆业务系统建立信息查询和将获取的查询信息进行XML封装等方面,实...

  • 2014中国机构知识库学术研讨会征文通知

    关键词: 中国图书馆学会  机构知识库  学术研讨会  专业图书馆分会  征文  开放共享  高校图书馆  科技信息  

    机构知识库是促进科技信息开放共享的重要力量,已经被学术界广泛接受并形成普遍共识。在成功举办第一届中国机构知识库学术研讨会的基础上,为持续交流和共享全国机构知识库的创新发展,中国机构知识库推进工作组联合中国图书馆学会专业图书馆分会、中国图书馆学会高校图书馆分会,定于2014年11月3-6日召开2014中国机构知识库学术研讨会。会议...

免责声明

若用户需要出版服务,请联系出版商,地址:北京中关村北四环西路33号,邮编:100190。