nltk专题提供nltk的最新资讯内容,帮你更好的了解nltk。
我正在尝试计算没有停用词的<code>tfidf</code>矩阵。这是我的代码: <pre><code>def removeStopWords(documents):
我有如下所示的python代码: <pre><code>for subtree in result.subtrees(filter=lambda t: t.label() == &#39;AJNN&#39; or t.labe
我正在寻找某种方法来确定文本输入是否采用有效句子的形式;如果没有,我想向用户提供警告。我想
这可能是一个基本问题,但我被困在这里并不确定出了什么问题。 <a href="https://i.stack.imgur.com/UYNMs.p
我想编写代码来查找字符串之间的相似之处。我在StackOverflow上找到了此脚本,它的语言很好,但是问题
我下载了Facebook Messenger数据,并试图对其进行分析。 所以我的目标是知道所有消息中单词出现的次数。
我正在尝试关注线程(<a href="https://stackoverflow.com/questions/39763091/how-to-extract-subjects-in-a-sentence-and-their-respe
我是Python和文本分析的新手,我想标记我的文本语料库: <pre><code>&lt;s&gt; c a b c b c &lt;/s&gt; &lt;s&gt; a c
我将spaCy NER用于提取名称的基本功能,我输入的字符串少于600个字符。我想知道我是否真的需要删除停
我正在尝试定义一种语法,以便使用Regex解析器从文本中检索数量和水果。显然语法上有问题,因为在结
我有一个profile_keywords列表,并且正在寻找使用nltk库过滤掉在此列表中找到的停用词。我扩展了我作为库
我尝试使用搬运工茎秆,但得到相同的结果。 我正在尝试在新列[stemmed]下使用.apply来阻止[属性描
我正在NLP上做一个项目,我想找到一个语料库中最重要的单词,当我计算所有单词的频率时,像<code>&#34;
我正在尝试确定每一行中有多少个句子。 <pre><code>SELECT description, brand, Providers.name, Categories.name, selling
我得到了两个文本文件d.txt,其中包含段落文本,而statement.txt中则包含多词短语,例如最新技术,适得
我的文件夹清理包含7个文件,每个文件不包含。文档,但我的问题是权限被拒绝。 我想计算每个文件的
我想定义一个CFG txt文件以使用<code>nltk.CFG.fromstring()</code>读入NLTK。问题是,当我定义规则时,我想制定
我需要从下面的示例nltk树中获取字典列表: <pre><code> (S I/PRP &#39;ll/MD have/VB (amount
我正在使用getoldtweets3库抓取电晕爆发信息。我收到此错误- <pre><code>error : C:\Users\Vilius\anaconda3\python.exe
<code>sklearn...TfidfVectorizer</code>仅在分析器返回<code>nltk.tree.Tree</code>对象列表时才在训练后应用时起作用