关键词:文本对象网络 don 中心度 影响因子 关键词自动抽取
摘要:Web网页中往往包含许多主题噪声,准确地自动抽取关键词成为技术难点。提出了一个文本对象网络模型DON,给出了对象节点的中心度概念和基于中心度的影响因子传播规则,并据此自动聚集DON中的主题社区(topic society),从而提高了模型的抗噪能力。提出一个基于DON的网页关键词自动抽取算法KEYDON(Keywords Extraction Algorithm Based on DON)。实验结果表明,与基于DocView模型的相应算法相比,KEYDON的准确率提高了近20%,这说明DON模型具有较强的抑制主题噪声能力。
计算机工程与应用杂志要求:
{1}本刊注释一律采用国标形式,脚注尾注分开。引用文献依次注明:作者、文献名、出版社、出版年、出版时间、页码等项,并请核对无误。
{2}编辑部收到稿件后立即编号,并给回执,日后联系时请注明编号。在接到本刊回执3个月未接到稿件处理通知书,系该稿仍在审阅中。
{3}本刊可对来稿做必要的文字修改、删节;投寄本刊的稿件自发表之日起,其网络传播权即授予本刊。
{4}篇名要简明、具体、确切,一般不超过20个字,且应避免使用缩略词、字符、代号和公式等。
{5}关键词尽量使用MeSH词汇,或从文题、摘要、正文中选取与本文研究或讨论中的中心问题有关和必要的词。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社