关键词:词袋模型 视觉词典构造 图像分类
摘要:传统词袋(bag of Words,BoW)模型在构造视觉词典时一般采用k-means聚类方法实现,但k-means聚类方法的性能在很大程度上依赖于初始点的选择,从而导致生成的视觉词典鲁棒性较差,此外,每次迭代都要计算数据点与中心点的距离,计算复杂度高。针对上述问题,提出了一种改进的k-means聚类视觉词典构造方法,该方法首先对初始值的选取进行了优化,克服了随机选取初始值对聚类性能的影响,其次基于三角形不等式对计算进行了简化,使生成的视觉词典更加稳定,计算复杂度更低,最后引入权值分布对图像进行基于视觉词典的表示,并将基于改进的视觉词典的词袋模型应用于图像分类,提高了分类性能。通过在Caltech 101和Caltech256两个数据库进行实验,验证了本文方法的有效性,并分析了词典库大小对分类性能的影响。从实验结果可以看出,采用本文方法所得到的分类正确率提高了5%-8%。
仪器仪表学报杂志要求:
{1}注释:将注释按正文中出现的先后顺序排列编号,用数字加圆圈标注,并集中排列在正文后。
{2}来稿以未在国内外正式发表为限。
{3}正文的层次标题应简短明了,以15字为限,不用标点符号,其层次的划分及编号一律使用阿拉伯数字分级编号法。
{4}“题目”应明晰(必要时可加副标题),并附有200字左右以内的“摘要”和3-5个“关键词”。
{5}稿件研究内容如获得课题或基金资助,请注明其名称及项目号。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社