《计算机应用研究》|Application Research of Computers

后验正则化综述

Survey on posterior regularization

免费全文下载 (已被下载 次)  
获取PDF全文
作者 韩亚楠,刘建伟,罗雄麟
机构 中国石油大学(北京) 自动化系
统计 摘要被查看 次,已被下载
摘要 当下监督机器学习已在自然语言处理、计算机视觉等领域取得巨大成功,然而,在模型训练过程中,训练语料通常还包含许多针对特定问题的边信息,而模型往往无法直接利用这些边信息。后验正则化(Posterior Regularization,PR)提供了一种额外的,可以说是更丰富和灵活的手段来增强含有丰富边信息的后验分布,由于其框架的灵活性和简单性,在分类任务、自然语言处理以及远程监督系统等领域获得广泛应用。后验正则化框架通过在未标记的数据上限制模型的后验空间,引导模型学习,进而达到期望的学习效果。文章首先系统性的对后验正则化问题进行描述,然后详细介绍了三类后验正则化的通用框架,并指出了各个后验正则化框架被提出的原因以及其模型的具体形式、所具有的优缺点、适宜解决的问题等,进而,又指出了近年来几类后验正则化框架的典型应用,并指明了后验正则化框架未来可能的发展方向,最后对全文内容进行概括总结。
关键词 后验正则化;边信息;后验分布;自然语言处理
基金项目 中国石油大学(北京)科研基金资助项目(2462020YXZZ023)
本文URL http://www.arocmag.com/article/02-2021-10-002.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码