topic-modeling - 编程之家

我在 R 中找不到答案的一个问题是，如何在 NLP 模型中为每个句子找到主导主题？想象一下我有这样的

我是 R 的新手。我试图将文本文件导入 R 以进行 LDA 主题建模分析。该文件是关于电影标签的，里面有

为了进行主题建模，我使用了此代码，但发生了 <code>BrokenPipeError: [Errno 32] Broken pipe</code> 错误。如何解

哪种技术/算法适合使用 NLP 识别各种大型文本文档的上下文/主题？

我想为我的文档分配主题。但是，Gensim 的 HDP 的 <code>show_topic()</code> 默认返回 20 个主题。

当我使用 CoherenceModel 时，出现 BrokenPipeError: [Errno 32] Broken pipe 错误。特别是在 coherence='c_v' 中，会发生

我正在从事一个从客户评论中提取关键字的项目。我以某种方式设法使用主题建模技术提取了关键字。</

我按照 <a href="https://towardsdatascience.com/topic-modeling-with-bert-779f7db187e6" rel="nofollow noreferrer">this</a> 帖子尝试

我需要为我的 uni 项目创建一个主题模型，而我正在做的是尝试重复这个人正在做的事情：<a href="https://w

我正在使用 pyLDAvis 和 gensim 进行主题建模。我为主题建模提供了 27 个主题。但是，pyLDAvis 不显示主题 24

我已经建立了一个主题模型，包括： <ul> <li>输入：标记化列表的列表</li> <li>输出<

如何在带有 python 3.7 windows 机器的 Jupyter 笔记本上应用 lda2vec？我已经从以下链接下载了源代码。任何建

在 Python 3.9.2 中训练 Top2Vec 模型时，出现以下错误： <pre><code>AttributeError Traceback (

例如，我们的模型分配它分配给文档的主题有多困惑。之所以想知道这个，是因为我想剔除错误分配到

我正在尝试对大约 5-6 GB（约 3000 万个文档）的数据集进行主题建模，并且在处理术语文档矩阵时不断出

我是 NLP 的新手，尤其是主题建模，我很好奇找到最适合我的数据集的主题数量的方法。我找到了这个答

我将从列表的项目中删除 '\n'（新行）。以下命令从 DataFrame 格式的 excel 文件中读取数据，然后将其转换

我将为 LDA 的文本数据计算困惑度和连贯性。我运行以下代码 <pre><code># Compute Perplexity print('\nPerplex

我将找到 LDA 的最佳主题数。为此，我使用了 GENSIM 如下： <pre><code>def compute_coherence_values(dictionary, corp

我需要一个人工标注的数据集来评估文本一致性方法。我读了很多论文，但没有一篇提供这样的数据集