作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2019, Vol. 45 ›› Issue (2): 160-166. doi: 10.19678/j.issn.1000-3428.0049671

• 人工智能及识别技术 • 上一篇    下一篇

基于深度高斯过程的多元类别数据分布估计

刘姝君,李艳婷   

  1. 上海交通大学 机械与动力工程学院,上海 200240
  • 收稿日期:2017-12-12 出版日期:2019-02-15 发布日期:2019-02-15
  • 作者简介:刘姝君(1994—),女,硕士,主研方向为智能故障诊断、贝叶斯机器学习;李艳婷,副教授、博士
  • 基金资助:

    国家自然科学基金面上项目“多元复杂时空数据建模与监控方法研究”(71672109)

Multivariate Categorical Data Distribution Estimation Based on Deep Gaussian Process

LIU Shujun,LI Yanting   

  1. School of Mechanical Engineering,Shanghai Jiaotong University,Shanghai 200240,China
  • Received:2017-12-12 Online:2019-02-15 Published:2019-02-15

摘要:

多元类别数据的可能取值会随向量长度的增长呈指数级增长,从而造成数据稀疏性问题。通过将观察数据嵌入到连续空间中训练识别数据之间的相似性,构建多元类别数据的线性高斯隐变量模型和类别隐高斯过程(CLGP)。在CLGP模型基础上,建立小样本多元类别数据分布估计的多元类别深度隐高斯过程模型,并结合蒙特卡洛采样的变分推断方法对模型进行参数优化。实验结果表明,与CLGP模型相比,该模型分布估计精确度有所提升。

关键词: 多元类别数据, 生成式模型, 深度高斯过程, 无监督学习, 变分推断

Abstract:

The possible value of multivariate categorical data increases exponentially with the length of the vector,resulting in data sparsity.The similarity between the identified data is trained by embedding the observation data into the continuous space,and the linear Gaussian hidden variable model and the Categorical Latent Gaussian Process (CLGP) of the multi-category data are constructed.Based on the CLGP model,a multi-class deep hidden Gaussian process model for small sample multi-class data distribution estimation is proposed,and the parameters are optimized by Monte Carlo sampling.Experimental results show that compared with the CLGP model,this model distribution estimation accuracy has improved.

Key words: multivariate categorical data, generative model, Deep Gaussian Process(DGP), unsupervised learning, variational inference

中图分类号: