数据分析与知识发现杂志是由中国科学院主管,中国科学院文献情报中心主办的一本CSSCI南大期刊。
数据分析与知识发现杂志创刊于1980,发行周期为月刊,杂志类别为计算机类。
杂志介绍
数据分析与知识发现杂志是由中国科学院主管,中国科学院文献情报中心主办的一本CSSCI南大期刊。
数据分析与知识发现杂志创刊于1980,发行周期为月刊,杂志类别为计算机类。
主管单位:中国科学院
主办单位:中国科学院文献情报中心
国际刊号:2096-3467
国内刊号:10-1478/G2
发行周期:月刊
全年订价:¥1180.00
关键词: 社会化问答 问题检索 答案质量 社会化媒体
【目的】了解社会化问答的发展态势和研究内容。【文献范围】在Google Scholar和CNKI中分别以检索词"Social Q&A"和"社会化问答"进行文献检索,再结合主题筛选,精读并使用追溯法获得社会化问答研究的代表性文献共77篇。【方法】对社会化问答的发展历程和早期研究内容进行介绍,对社会化问答近期的主要研究内容进行归类总结。【结果】目前社会...
关键词: 众筹 众投 众筹模式 筹资
【目的】基于Web的众筹模式成为新的融资渠道,倍受政府和投资者的关注,但是众筹研究并不广泛。本文针对众筹模式的现状,探讨众筹模式结构性、趋势性的研究进展。【文献范围】从Web of Science、CNKI等数据库中分别以"众筹(Crowdfunding,Crowdfinancing,Crowdinvesting)"、"P2P借贷(P2P Lending)"等检索词检索获得中英文相关文献101篇。...
关键词: 社交媒体 直接信任 综合信任 传播影响力
【目的】通过研究社交媒体用户信任度评估和传播影响力,发现推动或制约信息传播的关键因素,为促进社交媒体健康有序发展提供服务。【方法】根据网络信任特点,提出一种基于直接信任和间接信任的综合评估指标,该指标综合考虑个体的局部影响力和全局调控能力。【结果】SIR模型评估实验结果表明,综合评估指标值最大的个体发起的传播能在较短的传播时...
关键词: 主题时间模型 农村电商扶贫 地区差异分析 政策演化
【目的】揭示农村电商扶贫政策从2008年到2017年的演化规律以及区域差异。【方法】运用主题时间模型,提取10年间农村电商扶贫政策的时间–主题概率分布以及主题–词汇概率分布,通过计算不同年份下主题的平均强度并提取每个主题下概率高的前n个词汇,分析政策内容的演化情况;将各省数据按照东、中、西部进行划分,得到各个地域的主题–词汇概率分布...
关键词: 众包参与者识别体系 属性约简 随机森林 众包竞赛
【目的】解决众包竞赛中参与者识别体系规模较大、识别方法比较单一的问题。【方法】在广泛收集众包竞赛参与者众包能力指标的基础上,提出递归启发式属性约简方法,构建新的众包参与者识别体系,并在此基础上利用随机森林算法构建众包参与者识别模型。【结果】实验结果表明:所提出的属性约简方法能有效地降低数据维度,由初始的17个属性降低到8个...
关键词: 算法 spring rank 大型网络 社会行为 研究所 数据集
近日,Santa Fe研究所在Science Advances,提出一种名为Spring Rank的新算法,该算法利用输赢快速找到潜伏在大型网络中的排名。当在各种合成和真实世界数据集上进行测试时,从NCAA大学篮球锦标赛的团队到动物的社会行为,Spring Rank在预测结果和效率方面优于其他排名算法。
关键词: 网络舆情安全 主题分类 特征加权 机器学习
【目的】通过一种特征加权方法解决高校新浪微博主题分类研究所面临的高维性和稀疏性问题。【方法】计算特征属于类别的概率,进一步预测文档属于类别的概率,使得特征由基于词的表示转换为基于类别的表示,最终采用支持向量机对转换后的特征矩阵进行分类。【结果】传统tf,tf?idf以及tf?rf三种方法在结合本文提出的方法后,在微平均F1/宏平均F1方...
关键词: 旅游推荐 不确定近邻 相似性阈值 协同推荐
【目的】解决传统协同推荐技术在智慧旅游产业运用中的数据稀疏性、冷启动等问题。【方法】结合基于用户和基于内容的协同推荐技术,对用户进行K-means聚类后动态分类筛选,为推荐类型分配权重,提出基于不确定近邻的旅游产品协同过滤推荐算法IUNCF。【结果】基于不同相似性阈值和推荐数目对真实旅游数据进行算法检验,实验结果表明,IUNCF算法的MAE...
关键词: 目标检测 代码 测算法 传统算法 不稳定 学习 应用
在应用内或者系统中使用最新的目标检测算法很困难,同样基于这些算法构建新的应用也并非易事。早期的目标检测使用的是传统算法,但在不同场景下表现较不稳定。2012年,随着深度学习的突破和快速普及,为我们带来了全新的、高精确的目标检测算法和方法。使用这些基于深度学习的算法和方法,需要一定的数学及深度学习框架的基础。
关键词: 个性化推荐 时间动态性 序列模式 协同过滤 热门系数
【目的】在电子商务个性化推荐中考虑商品销售的时间动态性和序列模式问题,提高推荐效果。【方法】提出一种改进的个性化推荐算法:引入时间系数和热门系数,改进评分相似性函数,提出新的用户兴趣相似度计算方法;加入商品序列模式,给出二项序列模式挖掘算法,用序列模式对推荐结果进行筛选排序。【结果】利用2004年–2005年亚马逊图书评论数据进行...
关键词: 统计学方法 机器学习 个例 统计方法 数据清洗 统计学模型 数据可视化 异常点检测
统计学和机器学习是两个联系紧密的领域。事实上,两者的界限有时非常模糊。有一些明显属于统计学领域的方法也可用于机器学习项目,并且极具价值。(1)问题架构。统计方法在问题的架构阶段有助于探索数据,包括:探索性的数据分析;数据挖掘。(2)数据理解。用于理解数据的统计学模型的两类主流分支:汇总统计;数据可视化。(3)数据清洗。统计方...
关键词: 样本密度 相异度 huffman树 隶属度
【目的】解决传统的FCM算法随机选取初始聚类中心、对噪声敏感、只适合均衡分布的样本聚类问题。【方法】提出一种基于Huffman树的FCM新算法,该算法设计一种高密度样本的相异度矩阵构建Huffman树并获取初始聚类中心,进而给出非归一化约束的样本隶属度函数。【结果】通过人造样本及图像数据集、UCI数据集的实验对比结果表明,算法在聚类精度、运算...
关键词: 历史事件名 条件随机场 汉字标注 命名实体识别 本体学习
【目的】探讨中文历史事件名识别和抽取的最优模型,用于历史文本的知识重组和中国历史事件本体的构建。【方法】以魏晋南北朝史书文本为原始语料,进行自动标引,运用条件随机场(CRFs)模型,以单个汉字为标注对象,探讨不同汉字角色集合、不同特征对历史事件名识别的影响,寻找最佳模型。【结果】经过实验论证,得到字素的词性倾向和姓氏特征相累加...
关键词: 移动场景 情境序列 情境熵 情境适配 接受仿真
【目的】移动图书馆如何快速响应用户所处场景的切换,并基于用户信息接受期望为其适配情境是移动图书馆服务创新和空间再造亟需解决的问题。【方法】借鉴信息熵、情境熵等理论提出信息接受熵的概念,并基于熵的能量分布思想,构建移动图书馆场景化信息接受熵的广义组分分布概率模型。在辽宁、吉林和河南三个地区的高校利用云舟知识服务空间对用户...
若用户需要出版服务,请联系出版商,地址:北京中关村北四环西路33号,邮编:100190。