如何解决文档至少包含一个巨大术语-Solr
我正在使用solr库来索引我的文档。它按预期工作,但有时我遇到错误。您能帮忙吗?
文档至少在field =“ FileContent_en ***”(其UTF8编码长于最大长度32766的长度)中包含一个巨大的术语,所有这些术语均被跳过。请更正分析仪以免产生此类条款。第一个庞大术语的前缀是:'[110、97、109、101、61、34、97、99、113、117、105、115、105、116、105、111、110、115、116、111 ,114、101、34、62、101、106、122、107、118、118] ...',原始消息:字节的长度最多为32766;得到了422071。也许文档的索引字符串字段(solr.StrField)太大solr.StrField
提前谢谢
解决方法
将字段的字段类型从字符串更改为文本。
例如,您的字段定义应如下所示。
<field name="text" type="text_general" indexed="true" stored="true"/>
字符串(UTF-8编码的字符串或Unicode)。字符串适用于 小字段,不会以任何方式标记或分析。他们有个 硬限制略小于32K。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。