尝试使用 skmultilearn.BinaryRelevance 预测新文本时出现 Matmul 错误

如何解决尝试使用 skmultilearn.BinaryRelevance 预测新文本时出现 Matmul 错误?

我正在尝试创建一个标签文本分类的小例子:

import skmultilearn
from sklearn.feature_extraction.text import TfidfVectorizer
import pandas as pd
from scipy.sparse import csr_matrix
from pandas.core.common import flatten
from sklearn.naive_bayes import MultinomialNB
from skmultilearn.problem_transform import BinaryRelevance

TRAIN_DATA = [

    ['Como efetuar uma conexão com MysqL usando PHP ?',['desenvolvimento','banco']],['Quais são os melhores clientes de VPN hoje em dia?',['redes']],['Qual é o equivalente ao tipo booleano no Oracle?',['banco']],['Como remover entidade indesejada da sessão do Hibernate?',['desenvolvimento']],['Como implementar o pool de conexão TCP em java?','redes']],['Como posso me conectar ao banco de dados Postgresql remotamente de outra rede?',['banco',['Qual a função python para remover acentos em uma string?',['Como remover índices no sql Server?',['Como configurar o firewall com DMZ?',['redes']]
]

data_frame = pd.DataFrame(TRAIN_DATA,columns=['text','labels'])
corpus = data_frame['text']
unique_labels = set(flatten(data_frame['labels']))
for u in unique_labels:
    data_frame[u] = 0
    data_frame[u] = pd.to_numeric(data_frame[u])
for i,row in data_frame.iterrows():
    for u in unique_labels:
        if u in row.labels:
            data_frame.at[i,u] = 1
tfidf = TfidfVectorizer()
Xfeatures = tfidf.fit_transform(corpus).toarray()
y = data_frame[unique_labels]
binary_rel_clf = BinaryRelevance(MultinomialNB())
binary_rel_clf.fit(Xfeatures,y)
predict_text = ['sql Server no PHP?']
X_predict = tfidf.fit_transform(predict_text)
br_prediction = binary_rel_clf.predict(X_predict)
print(br_prediction)

但是,我收到此错误

ValueError: matmul: Input operand 1 has a mismatch in its core dimension 0,with gufunc signature (n?,k),(k,m?)->(n?,m?) (size 56 is different from 4)

我需要更改什么“维度”才能正确运行 predict()?

解决方法

您正在使用 TfidfVectorizer 来转换您的文本特征。您应该在训练数据上只拟合一次转换器,在您的情况下是 corpus。但是,在准备要测试/预测的数据时,您应该使用 transform 方法,而不要 fit_transform 再次使用,因为这会重新安装转换器。

更改以下内容以使其工作:

X_predict = tfidf.transform(predict_text)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

其他编程问答

如何捕获不存在的属性的错误?示例: const arr = [ { neighbours: [➯G', ɼNG'], },]; 现在,当我试图访问一个可能存在也可能不存在的属...
在setState上,我收到以下TS错误: “类型ɺxiosResponse‘缺少类型’countries[]‘的以下属性:长度、pop、push、concat和26 more.ts(2740)”...
我是typescript的新手,正在尝试为Typescript构建一个react样板。但无法导入格式为“.tsx”的组件。 我的tsconfig文件如下所示: { "compilerOption...
当我在VS代码中使用Jupyter Notebook时,我遇到了一个问题。屏幕显示"Python 3.7.8 requires ipykernel to be installed“。我按照弹出窗口的...
我正在尝试输入一个形状为( 1,8,32,32,32 )的5D张量到我写的VAE: self.encoder = nn.Sequential( nn.Conv3d( 8, 16, 4...
在控制器中: RefreshController refreshController = RefreshController(initialRefresh: false); @overrid...
我试图构建我的安卓应用程序有一段时间了,似乎找不到任何解决这个问题的方法:Image Unity版本: Unity 2020.3.21f1 (64位) JDK、SDK、NDK和Gradle是Unit...
我正在尝试测试selenium,以获得自动登录网站的解决方案,但我甚至无法让Selenium保持打开状态。它做它现在应该做的事情,然后在没有driver.quit()的情况下立即退出。我得到了以下错...
我正在尝试开发一个springboot/react应用程序,并且已经安装了react并创建了react项目。但是,当我尝试执行以下命令时: npm run 我得到以下错误: Lifecycle sc...
我有大约5e9 (15e4记录每小时)记录存储在clickhouse中。这些记录是按时间顺序的。当我以10分钟的time_range运行某个查询时: select * from table_name...
Could not load library cudnn_cnn_infer64_8.dll. Error code 126Please make sure cudnn_cnn_infer64_8...
我正在和gatsby一起创建一个新项目 gatsby new YourProjectName2 https://github.com/Vagr9K/gatsby-advanced-starter 并...