隐含狄利克雷分布(Latent Dirichlet Allocation)

时间: 2023-07-09 admin 互联网

隐含狄利克雷分布(Latent Dirichlet Allocation)

隐含狄利克雷分布(Latent Dirichlet Allocation)

隐含狄利克雷分布(Latent Dirichlet Allocation,   注意机器学习还有一个LDA,即线性判别分析(线性判别分析)

 

LDA贝叶斯模型

    LDA是基于贝叶斯模型的,涉及到贝叶斯模型离不开“先验分布”,“数据(似然)”和"后验分布"三块。在朴素贝叶斯算法原理小结中我们也已经讲到了这套贝叶斯理论。在贝叶斯学派这里:

先验分布 + 数据(似然)= 后验分布

    这点其实很好理解,因为这符合我们人的思维方式,比如你对好人和坏人的认知,先验分布为:100个好人和100个的坏人,即你认为好人坏人各占一半,现在你被2个好人(数据)帮助了和1个坏人骗了,于是你得到了新的后验分布为:102个好人和101个的坏人。现在你的后验分布里面认为好人比坏人多了。这个后验分布接着又变成你的新的先验分布,当你被1个好人(数据)帮助了和3个坏人(数据)骗了后,你又更新了你的后验分布为:103个好人和104个的坏人。依次继续更新下去。

主题模型 - LDA Model

如果给主题分布加一个Dirichlet分布,再给主题上的词分布再加一个Dirichlet分布,那就是LDA.  因此实际上LDA就是PLSA的贝叶斯版本。我们直接来看模型图【4】:

LDA Model 概率图模型

 

用自己的话翻译一下上述过程就是:

 

 

reference:

.html,大佬写的很详细,我却看不懂