数据分析与知识发现杂志是由中国科学院主管,中国科学院文献情报中心主办的一本CSSCI南大期刊。
数据分析与知识发现杂志创刊于1980,发行周期为月刊,杂志类别为计算机类。
杂志介绍
数据分析与知识发现杂志是由中国科学院主管,中国科学院文献情报中心主办的一本CSSCI南大期刊。
数据分析与知识发现杂志创刊于1980,发行周期为月刊,杂志类别为计算机类。
主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
发行周期:月刊
全年订价:¥1180.00
关键词: 开源软件 网络信息存档 系统建设
【目的】构建国际重要科研机构Web存档系统。【方法】基于IIPC开源软件拓展采集存档框架,在采集端采用三层扩展策略,在采集客户端增加自动上传及报告等管理功能,开发WARC文件内容解析模块,利用Solr进行索引。【结果】在采集端实现三层扩展,通过增加采集客户端功能提高存档流程自动化程度,通过增加的WARC文件内容解析功能抽取更多信息,实...
关键词: 查询串主题分类 伪相关反馈 查询扩展 向量空间压缩算法
【目的】通过对查询串进行扩展,实现查询串的主题分类。【方法】利用伪相关反馈技术得到查询串扩展文本抽取文本特征,并提出一种向量空间压缩算法对特征进行融合,分别利用向量余弦夹角和SVM模型对其进行分类。【结果】实验结果中正确率、召回率、F值和整体正确率分别达到90.34%、89.34%、89.67%和89.24%。【局限】根据搜索引擎返回结...
关键词: 公共图书馆建设 数字化平台 英国 读者访问 数字资源 实体图书馆 图书馆长 馆藏目录
英国图书馆长协会(Society of Chief Librarians,SCL)设想为全英国的公共图书馆建设一个统一的数字化平台。该平台将改善读者访问和使用图书馆提供的信息和资源,包括:馆藏目录、数字资源、IT培训、活动日历以及图书馆地址和开馆时间。不论是在网络上还是在实体图书馆中,该平台都将有助于为公共图书馆带来更多的用户,同时还能丰富现有读者...
关键词: 文本分类 词性 权重计算 粒子群算法
【目的】为提高分类准确率,引入词性改进特征权重计算方法,进而影响文本特征权重的取值。【方法】采用对比实验的方法,将本文提出的引入词性的特征权重计算方法与传统的TF.IDF方法分组进行实验。在引入词性的特征权重计算方法中,采用粒子群算法迭代计算最优词性权重。两组实验均采用SVM分类器进行分类。【结果】实验结果表明:改进的权重计...
关键词: 往来书信 在线访问 大学 美国 图书馆读者 特藏 图书馆馆长 区图书馆
2014年夏天,美国Rochester大学River校区图书馆购买了美阳女杈运动先职SusanB.Anthony与其密友兼同事RachelFosterAvery的一大批往来书信,这些珍贵并且有意义的馆藏一上线就得到全世界研究人员的广泛关注。“该珍藏对于图书馆读者乃至整个Rochester社区来说都是非常重要的,”River校区副教务长兼图书馆馆长MaryAnnMavrinac表示,“它属于国...
关键词: 三层概念筛选 概念相关性 概念上下文 概念领域性 叙词表
【目的】通过运用叙词表和文本两种数据源和三种概念筛选方法提高领域概念筛选的效率。【方法】提出一种领域概念三层递进筛选方法,从叙词表和文本两种数据源提取领域概念,利用概念相关性、上下文和领域性以点到面三层递进的方式计算领域概念的概念属性和领域属性。【结果】实验结果表明,基于概念相关性、上下文和领域性的三层递进筛选方法将...
关键词: 词语抽象度 神经网络语言模型 隐喻识别
【目的】设计一种自动计算汉语词语抽象度的方法,并将其用在自然语言理解中的隐喻识别任务。【方法】以统计学习理论中逻辑回归为计算模型,把神经网络语言模型获取的词语词向量作为特征,通过构建抽象词库得到特征权重向量,计算汉语词语抽象度。提出一种基于词语抽象度的汉语隐喻识别算法,验证该方法的应用效果。【结果】通过与已有的方法进...
关键词: 条件随机场 领域本体 未登录词识别
【目的】建立未登录词识别模型,提升发现自然科学领域文本中未登录词的能力,同时降低人工干预成本。【方法】在假设的基础上,构建条件随机场(CRFs)与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本,通过比较不同模型性能的差异,检验假设,验证模型的合理性。【结果】实验结果表明,CRFs模型选择单纯的字、字词混合序列...
关键词: 风格分析 层次聚类 n元文法
【目的】研究《红楼梦》前八十回与后四十回的关系,从而判定《红楼梦》是否为一人所写。【方法】定量统计和定性分析相结合,比较前、中、后四十回的独有词;利用虚词、词及词类的N元文法模型、实词以及词长进行聚类:计算三个部分的相似度。【结果】证明前八十回与后四十回有差异。前八十回用词连贯性较高,更重视细节描写,长词较少,可读性...
关键词: 社区发现 社交网络 社区 标签传播
【目的】通过对标签传播方式的控制,提高社区发现的质量和效率,提升社区发现在推荐系统中的能力。【方法】提出一种高效的基于临近节点影响力强度的标签传播社区发现算法,利用临近节点间的影响强度优化标签的传播路径。【结果】在真实数据集和人工数据集上的实验结果表明,利用邻近节点间的相互影响强度进行标签的传播和更新,本文的算法社区...
关键词: 科研网络 合作关系 合作预测 学者社区 社区信息 混合拓扑因子模型
【目的】通过图论和复杂网络理论中的链接(关系)预测算法挖掘科研合作网络的结构信息,并预测目前尚未合作的学者有哪些在未来会产生合作关系。【方法】提出一种新颖的集成局部拓扑特征因子和全局社区拓扑特征的混合拓扑因子合作关系预测模型(MixtureTopologicalFactor,MTF),该模型引入朴素贝叶斯模型关系预测算法计算局部因子,采用社区贡...
关键词: 社交媒体知识协作网络 明星节点 经纪人节点 粉丝群体协作规模 知识传播效果
【目的】研究社交媒体知识协作网络中的明星节点和经纪人节点对知识传播的影响。【方法】运用Wikipedia中生物科学领域的197个知识点构建知识协作网络,利用社会网络分析工具分析知识节点的相关指标,并使用统计方法进行研究模型估计。【结果】处于网络中心位置的明星节点或拥有较多结构洞的经纪人节点,其传播效果较好,网络节点的粉丝群体协作...
关键词: 科技知识组织体系 版本管理 大数据 知识服务
【目的】设计针对科技知识组织体系(STKOS)数据进行多版本及版本内修订管理的方案,并研建实际服务系统。【应用背景】STKOS共享服务平台要求实现对不同版本数据的管理、及应用,并及时当前版本的修订信息。【方法】在定义历史版本、当前正式服务版本、临时版本三种STKOS版本类型的基础上,设计STKOS版本变更信息数据结构与STKOS多版本管理、...
关键词: 图书馆员 评价 行业 技术解决方案 图书馆采购 现代图书馆 自助服务 rfid
基于RFID和条形码的自助服务技术解决方案领导者Bibliotheca,一直以来专注于提供最优的用户体验。其在StrategicLibrary电子杂志的“2015年图书馆采购调查”中取得高分,并且还荣获了“2015年现代图书馆金奖”,这两个奖项都是由图书馆员评选的。此次获奖是对Bibliotheca多年努力给予的高度肯定。
关键词: 本体推理 关联数据 链接发现
【目的】利用本体推理实现关联数据的链接发现。【应用背景】以图书馆领域为应用背景,以图书资源为研究对象,探索应用本体推理建立图书资源之间的链接关系。【方法】提出含本体推理的链接发现框架,给出框架各个层次的描述,并使用Fuseki、Jena、Pubby和PHP等技术实现该框架,设计并执行链接发现框架的有效性检验方案。【结果】实验结果表明,...
关键词: 图书馆资源 白皮书 标准组织 国家信息 咨询顾问 检验结果 信息社区 委员会
美国国家信息标准组织(NISO)《图书馆资源发现的未来》白皮书,由独立咨询顾问、发言人兼作家MarshallBreeding撰写。该白皮书受托于NISO的发现与传递(D2D)主题委员会,作为其对信息社区标准化检验结果的一部分,包括对目前图书馆资源发现大环境的综述,对技术、方法和产品如何适应未来潜在的挑战的探讨,以及对可能的替代选择的探索,特别...
关键词: 自助 毕业清证 协同 一站式 图书馆
【目的】构建毕业清证工作新模式,扩展图书馆的自助服务渠道,提升读者体验。【应用背景】随着数字化校园的深入建设和图书馆毕业清证工作量的激增,传统方式效率低且形成信息孤岛,一站式自助服务更具优势。【方法】基于MVC和改进的三层架构开发模式,运用开源界面库Duilib,结合ODBC、API、WebService等技术,将毕业清证相关系统的信息整合于...
关键词: springer 合作协议 数据挖掘 center 文本 科学研究者 企业生命 全文获取
Springer与CopyrightClearanceCenter(简称ccc)~启一项新的合作,旨在提供一个新的解决方案,使得企业生命科学研究者能够跨过出版商,更加快速方便地进行文本和数据挖掘(TextandDataMining,TDM)。Springer是最早签署这份合作协议的出版商之一,这意味着Springer将会通过CCC的服务提供其一大部分全文获取。
若用户需要出版服务,请联系出版商,地址:北京中关村北四环西路33号,邮编:100190。