变压器的BERT句子嵌入

如何解决变压器的BERT句子嵌入

我正在尝试从BERT模型中的隐藏状态获取句子向量。查看BertModel的拥抱说明here,内容为:

from transformers import BertTokenizer,BertModel
tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-cased')
model = BertModel.from_pretrained("bert-base-multilingual-cased")
text = "Replace me by any text you'd like."
encoded_input = tokenizer(text,return_tensors='pt') 
output = model(**encoded_input)

首先要注意的是,它不会在网站上运行,就像在网站上一样。您会得到:

>>> Traceback (most recent call last):
  File "<stdin>",line 1,in <module>
TypeError: 'BertTokenizer' object is not callable

但是看起来好像一个小的更改可以解决它,因为您不直接调用令牌生成器,而是要求它对输入进行编码:

encoded_input = tokenizer.encode(text,return_tensors="pt")
output = model(encoded_input)

好的,此外,我得到的张量的形状与我预期的不同:

>>> output[0].shape
torch.Size([1,11,768])

这是很多层。句子嵌入的正确层是哪一层? [0][-1]?平均几个?我的目标是能够与这些余弦相似,所以我需要一个合适的1xN向量而不是一个NxK张量。

我发现流行的bert-as-a-service project似乎在使用[0]

这是正确的吗?是否有关于每个层是什么的文档?

解决方法

我认为没有单一权威文档说明使用什么以及何时使用。您需要进行实验并衡量最适合您任务的内容。本文很好地总结了有关BERT的最新观察结果:https://arxiv.org/pdf/2002.12327.pdf

我认为经验法则是:

  • 如果要针对特定​​任务微调模型,请使用最后一层。而且只要有可能就微调,数百个甚至几十个训练示例就足够了。

  • 如果无法微调模型,请使用一些中间层(第7层或第8层)。这背后的直觉是,这些层首先开发了越来越抽象的输入表示形式。在某个时候,表示形式开始更倾向于预训练任务。

Bert-as-services默认使用最后一层(但它是可配置的)。此处为[:,-1]。但是,它总是返回所有输入令牌的向量列表。对应于第一个特殊标记(所谓的[CLS])的向量被视为句子嵌入。 [0]的位置来自您所引用的快照器。

,

虽然Jindrich的现有答案通常是正确的,但并不能完全解决问题。 OP询问他应该使用哪一层来计算句子嵌入之间的余弦相似度,对此问题的简短回答是。像余弦相似度这样的度量标准要求向量的维数相等且有意义地起作用,但是BERT并非如此。雅各布·德夫林 (BERT论文的作者之一)wrote

我不确定这些向量是什么,因为BERT不会生成有意义的句子向量。似乎这是对单词标记进行平均池化以获得句子向量,但我们从未建议过这会产生有意义的句子表示形式。而且即使将它们作为接受了下游任务训练的DNN的代表,也并不意味着它们在余弦距离方面将是有意义的。 (由于余弦距离是一个线性空间,其中所有维度的权重均相等)。

但是,这并不意味着您不能将BERT用于此类任务。这仅意味着您不能开箱即用地使用预先训练的重量。您可以在BERT之上训练一个分类器来学习哪些句子相似(使用[CLS]标记),也可以使用sentence-transformers,该分类器可以在无人监督的情况下使用,因为它们经过训练可以产生有意义的结果句子表示法。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-