如何解决如何计算来自不同 lda 模型的主题之间的余弦相似度?
我估计了许多具有不同主题编号但基于相同语料库的 LDA 模型。总共有17个模型,主题数从10个开始,一直到90个,每个模型的主题数递增5个。这总共产生了 850 个主题。我如何计算每个主题对(总共 722,500)之间的余弦相似度?
这是第一个有 10 个主题的主题模型的代码:
import numpy as np
a = np.arange(start=10,stop=91,step=5)
for i in a:
lda_model = gensim.models.ldamodel.LdaModel(corpus=corpus,id2word=id2word,num_topics=10,random_state=100,update_every=1,chunksize=100,passes=10,alpha='auto',per_word_topics=True)```
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。