如何解决Gensim HDP - 文档的热门话题分布
我想为我的文档分配主题。但是,Gensim 的 HDP 的 show_topic()
默认返回 20 个主题。我想他们不应该是最好的。深入挖掘后,我发现总共有 150 个主题,因为代码中的截断级别默认设置为 150 code。
我看到了另一篇帖子 post,其中提供了选择最佳主题数量的方法。但是,即使我们确定了热门主题,我们如何根据确定的主题来表示新文档?因为 hdp[doc]
再次给出了 150 个主题之间的分布。
HDP 应该自己选择最佳主题数量,而不像 LDA 那样我们决定主题数量。但是,我无法在 Gensim 的实现中实现它。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com(将#修改为@)