关键词:论坛主题分析 倾向性识别 网页评价 词语相似度
摘要:褒贬倾向性识别在信息过滤、自动文摘、文本分类等领域有良好的应用前景。针对褒贬倾向性较为集中的论坛网页,提出了基于特定论坛主题的网页文本褒贬倾向性计算方法。结合句法分析和词语相似度计算方法,提取反映主题倾向的特征词,根据每个信息块的倾向性计算页面的褒贬倾向,实现了论坛网页句子级别、信息块级别和网页级别等三个层次的褒贬倾向性计算,在部分语料范围内的实验结果良好,对于此类网页的分析评价有一定的意义。
计算机技术与发展杂志要求:
{1}参考文献著录格式请参照国家标准《文后参考文献著录规则》(GB7714-87)。
{2}鼓励首发,反对抄袭、剽窃等侵犯他人著作权的行为。由此给本刊造成不良后果的,本刊将追究责任。
{3}本刊稿件从发表之日起,如无电子版、网络版、有声版等方面特殊说明,即视作投稿者同意授权本刊电子版、网络版、有声版等的复制权、汇编权、发行权、翻译权、信息网络传播权及其转授权等专著权。
{4}中文题名一般不超过20个汉字,一般不使用副题名,中英文题名含义一致。
{5}投稿请填写真实有效的详细地址、邮政编码、联系电话及E-mail,以便联系。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社