面向Web文本关键词自动抽取的DON模型研究

彭浩 蔡美玲 王瑞龙 余炳锐 湖南涉外经济学院计算机科学与技术学院 长沙410205 中南大学信息科学与工程学院 长沙410083 河南信阳供电公司 河南信阳464000

关键词:文本对象网络 don 中心度 影响因子 关键词自动抽取 

摘要:Web网页中往往包含许多主题噪声,准确地自动抽取关键词成为技术难点。提出了一个文本对象网络模型DON,给出了对象节点的中心度概念和基于中心度的影响因子传播规则,并据此自动聚集DON中的主题社区(topic society),从而提高了模型的抗噪能力。提出一个基于DON的网页关键词自动抽取算法KEYDON(Keywords Extraction Algorithm Based on DON)。实验结果表明,与基于DocView模型的相应算法相比,KEYDON的准确率提高了近20%,这说明DON模型具有较强的抑制主题噪声能力。

计算机工程与应用杂志要求:

{1}本刊注释一律采用国标形式,脚注尾注分开。引用文献依次注明:作者、文献名、出版社、出版年、出版时间、页码等项,并请核对无误。

{2}编辑部收到稿件后立即编号,并给回执,日后联系时请注明编号。在接到本刊回执3个月未接到稿件处理通知书,系该稿仍在审阅中。

{3}本刊可对来稿做必要的文字修改、删节;投寄本刊的稿件自发表之日起,其网络传播权即授予本刊。

{4}篇名要简明、具体、确切,一般不超过20个字,且应避免使用缩略词、字符、代号和公式等。

{5}关键词尽量使用MeSH词汇,或从文题、摘要、正文中选取与本文研究或讨论中的中心问题有关和必要的词。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与应用

北大期刊
1-3个月下单

关注 12人评论|1人关注
相关期刊
  • 印染
    北大期刊 1-3个月下单
    上海市纺织科学研究院有限公司;全国印染科技信息中心
  • 郑州师范教育
    省级期刊 1个月内下单
    郑州师范学院
  • 湖南农业
    省级期刊 1个月内下单
    湖南省农业技术推广总站
  • 信息化研究
    省级期刊 1个月内下单
    江苏省电子学会
服务与支付