关键词:计算机应用技术 hadoop平台 社交网络 数据挖掘
摘要:最近几年,以微博为首的社交网络迅猛发展,这些平台上包含了网民对于时事热点的观点,对生活和人际关系的看法等大量有价值的信息和资源。由于微博数据非常庞大又难以获取等困难,如何有效地对社交网络进行数据挖掘,是近两年数据挖掘研究的重点和热点。本工作设计和实现了一个基于Hadoop的并行社交网络挖掘系统,包含了分布式数据库,并行爬虫,并行数据处理和并行数据挖掘算法集,可以有效地获取和分析挖掘海量的社交网络数据,为社团分析,用户行为分析,用户分类,微博分类等工作提供支持。
软件杂志要求:
{1}来稿若有基金项目或其他资金资助项目,请详细列出基金或其他资金项目类型、名称及编号,每篇来稿的基金项目或其他资金资助项目原则上不超过3个。
{2}编辑部收到稿件后立即编号,并给回执,日后联系时请注明编号。在接到本刊回执3个月未接到稿件处理通知书,系该稿仍在审阅中。
{3}参考文献尽可能使用近5年公开发表的文献,数量在10—30条,采用顺序编码制著录,依照其在文中出现的先后顺序用阿拉伯数字标出,并将序号置于方括号中,排列于文后。
{4}每篇文稿均应标引3~8个中文及英文关键词。
{5}来稿需注明作者的真实姓名、单位、地址、邮编、职务、专业等信息,写明电子邮箱及电话以便联系。凡学生来稿请务必注明学校、专业和年级。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社