如何解决Javascript-最快搜索字符串数组中的单词也不能完全匹配
我正在对网页上的搜索进行编码,该网页搜索该网页所组成的所有文件。
我遍历每个文件,并将所有单词保存到字符串数组中。
例如:var array = ["these","are","some","random","words","on","a","webpage"]
搜索引擎的工作方式如下:用户类型"s"
,并且如果数组中的任何单词包含该字母,则显示该单词。在这种情况下,结果将是:"these","words"
问题是我喜欢搜索30个文件,每个文件中平均有500个单词,因此搜索速度很慢。
- 字母搜索(例如“ s”)〜4秒
- 字母搜索(例如“ se”)〜2.1秒
- 字母搜索(例如“海”)〜1.9秒
- 字母搜索(例如“ sear”)〜1.7秒...
我用for循环遍历array
,我认为这是最大的问题。那么,查找所搜索单词是否在字符串数组中并比较不完全匹配的最快方法是什么?
编辑:
在网页上看起来像这样:
搜索到的单词:“ sear”
结果:
简介(页面名称;可点击的网址链接)
...您可以在此页面中搜索...(带有搜索词的单词的句子)
代码说明:
- 浏览文件
- 删除html字符和其他特殊字符,并将单词从文件保存到字符串数组
- 将文件中的单词与用户搜索的单词进行比较
- 将带有搜索词的句子保存到
sentence
变量中 - 将
sentence
保存到一个对象(此对象稍后在.html文件中迭代,并且句子显示在网页上)
个单词在变量words
这是我的代码。
var searchIndexPromise;
var searchAppModule = angular.module("searchApp",[]);
searchAppModule.run(function($rootScope,$http){
var globalSearch = $rootScope.globalSearch = {
query: "",results: [],open: function(){
window.location.href = "#!/51_00_Search";
globalSearch.search(globalSearch.query);
},search: function(find) {
if(!searchIndexPromise) searchIndexPromise = $http.get("searchIndex.json").then(function(response){
return response.data;
});
console.log("searching",find);
searchIndexPromise.then(function(searchIndex){
var temp = [];
globalSearch.results = [];
var words = find.split(' ');
if (words < 1) {
return;
}
for (var key in searchIndex) {
for (var option in searchIndex[key]) {
for(var i=0; i < words.length; i++) {
if (key.includes(words[i].toLowerCase())) {
var name = searchIndex[key][option].name;
var page = searchIndex[key][option].page;
var word = words[i];
var count = 0;
for (var j = 0; j < temp.length; j++) {
if (temp[j].name == name && temp[j].word == word) {
break;
}
count++;
}
if (count == temp.length) {
temp.push({ name : name,page : page,word : word });
}
}
}
}
}
if (words.length < 2) {
globalSearch.results = temp;
}
else {
for (var i = 0; i < temp.length; i++) {
var count = 0;
var compare = temp[i];
for (var j = 0; j < temp.length; j++) {
if (compare.name == temp[j].name) {
if (globalSearch.results.indexOf(temp[j]) == -1) {
count++;
}
}
}
if (count == words.length) {
globalSearch.results.push(temp[i]);
}
}
}
//sentences
const pagesLoad = require("./pages.js");
globalSearch.pages = [];
for (var result in globalSearch.results) {
var page = globalSearch.results[result].page.substring(3);
if ((page + ".html" in pagesLoad)) {
var nameOfPage = page + ".html";
}
if ((page + ".md" in pagesLoad)) {
var nameOfPage = page + ".md";
}
var regex = /(<([^>]+)>)|\n|\#|\(|\)|\*|\-|[^\w\s!?]|\n| +(?= )/ig,data = pagesLoad[nameOfPage].src.replace(regex," ");
var string = data.split(" ");
string = string.filter(Boolean);
let lowerString = string.map((item) => {
return item.toLowerCase();
});
//this part is slowing down the search
for (var i = 0; i < lowerString.length; i++) {
for (var j = 0; j < words.length; j++) {
if (lowerString[i].includes(words[j].toLowerCase())) {
var sentence = "...";
for (var k = i - 6; k < i + 6; k++) {
if (lowerString[k] == null) {
continue;
}
sentence = sentence + string[k] + " ";
}
sentence = sentence.slice(0,-1);
sentence += "...";
globalSearch.pages.push({page: globalSearch.results[result].page,sentence: sentence});
}
}
}
}
})
}
};
});
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。