《计算机应用研究》|Application Research of Computers

改进的不平衡贝叶斯学习分类模型研究

Improved unbalanced classification model based on Bayesian learning

免费全文下载 (已被下载 次)  
获取PDF全文
作者 韩忠明,刘聃,段大高,杨伟杰,张珣
机构 北京工商大学 a.计算机与信息工程学院;b.食品安全大数据技术北京市重点实验室,北京 100048
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2020)12-007-3561-04
DOI 10.19734/j.issn.1001-3695.2019.08.0520
摘要 基于函数逼近的方法存在少数类样本不足时分类效果不佳的问题,针对此问题提出了不平衡贝叶斯学习分类模型。模型引入类间隔似然函数,用于降低后验分布在参数空间上存在的偏态性,以采样到对各类样本分类精确的参数点。在UCI、KEEL上的公开不平衡数据集中的实验结果验证了所提方法的有效性;基于MINIST数据集构建了两个不平衡数据集,在这两个数据集中几何均值分别达到92.4%和81.6%。
关键词 不平衡分类; 数据挖掘; 类间隔似然函数; 贝叶斯学习
基金项目 北京市自然科学基金资助项目(4172016)
北京市教委科技计划一般项目(KM201710011006)
北京市科技计划资助项目(Z161100001616004)
本文URL http://www.arocmag.com/article/01-2020-12-007.html
英文标题 Improved unbalanced classification model based on Bayesian learning
作者英文名 Han Zhongming, Liu Dan, Duan Dagao, Yang Weijie, Zhang Xun
机构英文名 a.School of Computer & Information Engineering,b.Beijing Key Laboratory of Big Data Technology for Food Safety,Beijing Technology & Business University,Beijing 100048,China
英文摘要 Considering the limitations that accuracy of classification is low when samples are insufficient, this paper proposed an unbalanced Bayesian classification model. This model introduced a class margin likelihood function, which was used to reduce the skewness of the posterior distribution in the parameter space, so that Bayesian learning algorithm could obtain high performance parameters in such posterior. The experimental results in the unbalanced datasets of UCI, KEEL indicate effectiveness of the proposed model. The geometric mean in two unbalanced datasets constructed based on the MINIST dataset reached 92.4% and 81.6%, respectively.
英文关键词 unbalanced classification; data mining; class margin likelihood function; Bayesian learning
参考文献 查看稿件参考文献
 
收稿日期 2019/8/20
修回日期 2019/10/1
页码 3561-3564
中图分类号 TP391
文献标志码 A