如何解决Spacy:令牌只能是一个实体的一部分,因此请确保您要设置的实体不重叠..如何利用filter_spans
假设下面是我的火车数据
TRAIN_DATA = [
("PRICE INCREASED EVERY 6 HOURS",{"entities": [(16,29,"TIME"),(22,"TIME")]}),("DISCOUNT SALES ANNOUNCED FOR 2 TIMES DAILY",{"entities": [(30,43,"ORG"),(38,"ORG")]})]
如何使用spacy.util.filter_spans()
将我的训练数据更正为更长的时间。
解决方法
也许有更好的方法(我也是spacy noob),但是我像这样运行匹配器:
matches = []
for matcher in matchers:
matches += matcher(doc)
spans = [Span(doc,s,e,label=i) for i,e in matches]
spans = filter_spans(spans)
for span in spans:
pass # Do stuff here
这应该可以帮助您,但是我很好奇其他人是否有更好的解决方案。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。