《计算机应用研究》|Application Research of Computers

一种属性不一致性加权的k近邻分类方法

Attribute inconsistency weighted K-nearest neighbor classification method

免费全文下载 (已被下载 次)  
获取PDF全文
作者 徐政,邓安生,曲衍鹏
机构 大连海事大学 信息科学技术学院
统计 摘要被查看 次,已被下载
摘要 作为一种直观有效的基于样例的算法,k近邻被广泛应用在各种分类任务之中。在实际分类问题中,每个属性对样本的分辨能力是不同的。针对传统的k近邻算法在计算样本之间相似度时将每个属性视为同等重要的问题,提出了一个基于推土机距离的方法来计算每个条件属性的权重。首先根据近邻关系划分用以比较一致性的两个分布。之后根据推土机距离设计不一致性评价函数,用以衡量每个属性下各个样本的近邻样本集与这一集合由决策属性细化的等价划分之间的不一致性程度。最后将近邻的不一致性程度转换为相应属性的重要性,用以实现属性加权k近邻分类器。通过在多个数据集上进行实验,该方法对参数的敏感程度低,在多个参数下可以显著提高k近邻的分类精度,并且在多个指标下的表现优于现有的一些分类方法。结果表明,该方法可以通过属性加权选择出更加准确的近邻样本,可广泛应用在基于近邻的机器学习方法中。
关键词 属性权重;近邻分类;不一致性;推土机距离
基金项目 大连市青年科技之星资助项目(2018RQ70)
本文URL http://www.arocmag.com/article/02-2021-05-025.html
收稿日期
修回日期
页码 -
中图分类号 TP181
文献标志码