如何解决模糊搜索名称
我有一个 csv 文件,它有 4 列,分别是“student_name”、“father_name”、“date_of_passing”、“admission_number”。 csv 文件中有 5 亿行。现在我必须对两列(student_ name,father_name') 并检索其他列(date_of_passing,admission_number),因此输入将是 student_name,father_name。
我花了几个小时在 google 上寻找解决这个问题,并在 apache solr(underhood-lucene) 上进行了模糊匹配。我知道 Apache Solr 是一个基于开源 REST-API 的企业实时搜索引擎。它是一个高性能和全功能的文本搜索引擎库。Lucene 提供了强大的功能,如文档的可扩展和高性能索引。 我关注了链接
https://mkyong.com/solr/apache-solr-hello-world-example/
安装后我访问了链接
http://localhost:8983/solr/bigboxstore/select?indent=on&q=name:'alaistiar~'&wt=json
这向我展示了结果,在输入的基础上,我应该考虑完整的结果集还是应该根据分数限制结果,或者还有其他方法可以做到这一点吗?我知道分数是Lucene根据索引统计确定的相对事物。
对于apache solr中的模糊搜索,我有以下查询
1 以下 url 是使用 Apache solr 在应用程序中实现模糊搜索的正确方法吗? http://localhost:8983/solr/bigboxstore/select?indent=on&q=name:'alaistiar~'&wt=json
-
对于模糊搜索,在 apache solr 中,我应该考虑从第 1 点返回的完整结果集结果还是应该根据分数限制结果,或者还有其他方法可以做到这一点吗?
-
如何分别找出学生姓名和父亲姓名的相似度标准(90% 以上)?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。