数据分析与知识发现杂志

CSSCI南大期刊北大期刊 CSCD期刊统计源期刊

主管单位：中国科学院
主办单位：中国科学院文献情报中心
国际刊号：2096-3467
国内刊号：10-1478/G2
发行周期：月刊
全年订价：￥1180.00

投稿咨询加急见刊杂志订阅

期刊首页

分期目录

免费咨询

基于IIPC开源软件拓展构建国际重要科研机构Web存档系统

关键词: 开源软件网络信息存档系统建设

【目的】构建国际重要科研机构Web存档系统。【方法】基于IIPC开源软件拓展采集存档框架，在采集端采用三层扩展策略，在采集客户端增加自动上传及报告等管理功能，开发WARC文件内容解析模块，利用Solr进行索引。【结果】在采集端实现三层扩展，通过增加采集客户端功能提高存档流程自动化程度，通过增加的WARC文件内容解析功能抽取更多信息，实...
查询主题分类方法研究

关键词: 查询串主题分类伪相关反馈查询扩展向量空间压缩算法

【目的】通过对查询串进行扩展，实现查询串的主题分类。【方法】利用伪相关反馈技术得到查询串扩展文本抽取文本特征，并提出一种向量空间压缩算法对特征进行融合，分别利用向量余弦夹角和SVM模型对其进行分类。【结果】实验结果中正确率、召回率、F值和整体正确率分别达到90．34％、89．34％、89．67％和89．24％。【局限】根据搜索引擎返回结...
SCL为全英国公共图书馆创建一个统一的数字化平台

关键词: 公共图书馆建设数字化平台英国读者访问数字资源实体图书馆图书馆长馆藏目录

英国图书馆长协会（Society of Chief Librarians，SCL）设想为全英国的公共图书馆建设一个统一的数字化平台。该平台将改善读者访问和使用图书馆提供的信息和资源，包括：馆藏目录、数字资源、IT培训、活动日历以及图书馆地址和开馆时间。不论是在网络上还是在实体图书馆中，该平台都将有助于为公共图书馆带来更多的用户，同时还能丰富现有读者...
文本分类中受词性影响的特征权重计算方法

关键词: 文本分类词性权重计算粒子群算法

【目的】为提高分类准确率，引入词性改进特征权重计算方法，进而影响文本特征权重的取值。【方法】采用对比实验的方法，将本文提出的引入词性的特征权重计算方法与传统的TF．IDF方法分组进行实验。在引入词性的特征权重计算方法中，采用粒子群算法迭代计算最优词性权重。两组实验均采用SVM分类器进行分类。【结果】实验结果表明：改进的权重计...
美国Rochester大学提供SusanB．Anthony书信特藏在线访问

关键词: 往来书信在线访问大学美国图书馆读者特藏图书馆馆长区图书馆

2014年夏天，美国Rochester大学River校区图书馆购买了美阳女杈运动先职SusanB．Anthony与其密友兼同事RachelFosterAvery的一大批往来书信，这些珍贵并且有意义的馆藏一上线就得到全世界研究人员的广泛关注。“该珍藏对于图书馆读者乃至整个Rochester社区来说都是非常重要的，”River校区副教务长兼图书馆馆长MaryAnnMavrinac表示，“它属于国...
领域概念的三层递进筛选方法研究

关键词: 三层概念筛选概念相关性概念上下文概念领域性叙词表

【目的】通过运用叙词表和文本两种数据源和三种概念筛选方法提高领域概念筛选的效率。【方法】提出一种领域概念三层递进筛选方法，从叙词表和文本两种数据源提取领域概念，利用概念相关性、上下文和领域性以点到面三层递进的方式计算领域概念的概念属性和领域属性。【结果】实验结果表明，基于概念相关性、上下文和领域性的三层递进筛选方法将...
一种基于词语抽象度的汉语隐喻识别方法

关键词: 词语抽象度神经网络语言模型隐喻识别

【目的】设计一种自动计算汉语词语抽象度的方法，并将其用在自然语言理解中的隐喻识别任务。【方法】以统计学习理论中逻辑回归为计算模型，把神经网络语言模型获取的词语词向量作为特征，通过构建抽象词库得到特征权重向量，计算汉语词语抽象度。提出一种基于词语抽象度的汉语隐喻识别算法，验证该方法的应用效果。【结果】通过与已有的方法进...
条件随机场与领域本体元素集相结合的未登录词识别研究

关键词: 条件随机场领域本体未登录词识别

【目的】建立未登录词识别模型，提升发现自然科学领域文本中未登录词的能力，同时降低人工干预成本。【方法】在假设的基础上，构建条件随机场（CRFs）与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本，通过比较不同模型性能的差异，检验假设，验证模型的合理性。【结果】实验结果表明，CRFs模型选择单纯的字、字词混合序列...
《红楼梦》词和N元文法分析

关键词: 风格分析层次聚类 n元文法

【目的】研究《红楼梦》前八十回与后四十回的关系，从而判定《红楼梦》是否为一人所写。【方法】定量统计和定性分析相结合，比较前、中、后四十回的独有词；利用虚词、词及词类的N元文法模型、实词以及词长进行聚类：计算三个部分的相似度。【结果】证明前八十回与后四十回有差异。前八十回用词连贯性较高，更重视细节描写，长词较少，可读性...
一种基于邻近节点影响强度标签传播社区发现方法

关键词: 社区发现社交网络社区标签传播

【目的】通过对标签传播方式的控制，提高社区发现的质量和效率，提升社区发现在推荐系统中的能力。【方法】提出一种高效的基于临近节点影响力强度的标签传播社区发现算法，利用临近节点间的影响强度优化标签的传播路径。【结果】在真实数据集和人工数据集上的实验结果表明，利用邻近节点间的相互影响强度进行标签的传播和更新，本文的算法社区...
混合拓扑因子的科研网络合作关系预测

关键词: 科研网络合作关系合作预测学者社区社区信息混合拓扑因子模型

【目的】通过图论和复杂网络理论中的链接（关系）预测算法挖掘科研合作网络的结构信息，并预测目前尚未合作的学者有哪些在未来会产生合作关系。【方法】提出一种新颖的集成局部拓扑特征因子和全局社区拓扑特征的混合拓扑因子合作关系预测模型（MixtureTopologicalFactor,MTF），该模型引入朴素贝叶斯模型关系预测算法计算局部因子，采用社区贡...
社交媒体知识协作网络中的明星效应和经纪人效应——来自Wikipedia社交媒体的发现

关键词: 社交媒体知识协作网络明星节点经纪人节点粉丝群体协作规模知识传播效果

【目的】研究社交媒体知识协作网络中的明星节点和经纪人节点对知识传播的影响。【方法】运用Wikipedia中生物科学领域的197个知识点构建知识协作网络，利用社会网络分析工具分析知识节点的相关指标，并使用统计方法进行研究模型估计。【结果】处于网络中心位置的明星节点或拥有较多结构洞的经纪人节点，其传播效果较好，网络节点的粉丝群体协作...
科技知识组织体系版本管理系统设计与实践应用

关键词: 科技知识组织体系版本管理大数据知识服务

【目的】设计针对科技知识组织体系（STKOS）数据进行多版本及版本内修订管理的方案，并研建实际服务系统。【应用背景】STKOS共享服务平台要求实现对不同版本数据的管理、及应用，并及时当前版本的修订信息。【方法】在定义历史版本、当前正式服务版本、临时版本三种STKOS版本类型的基础上，设计STKOS版本变更信息数据结构与STKOS多版本管理、...
图书馆员给予Bibliotheca行业高度评价

关键词: 图书馆员评价行业技术解决方案图书馆采购现代图书馆自助服务 rfid

基于RFID和条形码的自助服务技术解决方案领导者Bibliotheca，一直以来专注于提供最优的用户体验。其在StrategicLibrary电子杂志的“2015年图书馆采购调查”中取得高分，并且还荣获了“2015年现代图书馆金奖”，这两个奖项都是由图书馆员评选的。此次获奖是对Bibliotheca多年努力给予的高度肯定。
本体推理在关联数据链接发现中的应用研究

关键词: 本体推理关联数据链接发现

【目的】利用本体推理实现关联数据的链接发现。【应用背景】以图书馆领域为应用背景，以图书资源为研究对象，探索应用本体推理建立图书资源之间的链接关系。【方法】提出含本体推理的链接发现框架，给出框架各个层次的描述，并使用Fuseki、Jena、Pubby和PHP等技术实现该框架，设计并执行链接发现框架的有效性检验方案。【结果】实验结果表明，...
NISO白皮书探索图书馆资源发现的未来

关键词: 图书馆资源白皮书标准组织国家信息咨询顾问检验结果信息社区委员会

美国国家信息标准组织（NISO）《图书馆资源发现的未来》白皮书，由独立咨询顾问、发言人兼作家MarshallBreeding撰写。该白皮书受托于NISO的发现与传递（D2D）主题委员会，作为其对信息社区标准化检验结果的一部分，包括对目前图书馆资源发现大环境的综述，对技术、方法和产品如何适应未来潜在的挑战的探讨，以及对可能的替代选择的探索，特别...
图书馆自助毕业清证协同处理系统的设计与实现

关键词: 自助毕业清证协同一站式图书馆

【目的】构建毕业清证工作新模式，扩展图书馆的自助服务渠道，提升读者体验。【应用背景】随着数字化校园的深入建设和图书馆毕业清证工作量的激增，传统方式效率低且形成信息孤岛，一站式自助服务更具优势。【方法】基于MVC和改进的三层架构开发模式，运用开源界面库Duilib，结合ODBC、API、WebService等技术，将毕业清证相关系统的信息整合于...
Springer与Copyright Clearance Center合作推进文本和数据挖掘解决方案

关键词: springer 合作协议数据挖掘 center 文本科学研究者企业生命全文获取

Springer与CopyrightClearanceCenter（简称ccc）~启一项新的合作，旨在提供一个新的解决方案，使得企业生命科学研究者能够跨过出版商，更加快速方便地进行文本和数据挖掘（TextandDataMining，TDM）。Springer是最早签署这份合作协议的出版商之一，这意味着Springer将会通过CCC的服务提供其一大部分全文获取。

期刊导航

服务介绍

免责声明

若用户需要出版服务，请联系出版商，地址：北京中关村北四环西路33号，邮编：100190。

数据分析与知识发现杂志

基于IIPC开源软件拓展构建国际重要科研机构Web存档系统

查询主题分类方法研究

SCL为全英国公共图书馆创建一个统一的数字化平台

文本分类中受词性影响的特征权重计算方法

美国Rochester大学提供SusanB．Anthony书信特藏在线访问

领域概念的三层递进筛选方法研究

一种基于词语抽象度的汉语隐喻识别方法

条件随机场与领域本体元素集相结合的未登录词识别研究

《红楼梦》词和N元文法分析

一种基于邻近节点影响强度标签传播社区发现方法

混合拓扑因子的科研网络合作关系预测

社交媒体知识协作网络中的明星效应和经纪人效应——来自Wikipedia社交媒体的发现

科技知识组织体系版本管理系统设计与实践应用

图书馆员给予Bibliotheca行业高度评价

本体推理在关联数据链接发现中的应用研究

NISO白皮书探索图书馆资源发现的未来

图书馆自助毕业清证协同处理系统的设计与实现

Springer与Copyright Clearance Center合作推进文本和数据挖掘解决方案

期刊推荐

文秘服务

论著出书