编程之家(jb51.cc)编程百科栏目主要推荐程序员常用编程技术介绍,以下是程序开发相关编程语言,主要信息提供给程序员快速了解所需要学习的编程技术语言。
JendX提供跨平台全文本索引、搜索和预览功能。支持可以转换成普通文本的任何文档。支持Web-Start,100% Java,使用lucene 搜索引擎。
php_solr 是一个轻量级的 Apache Solr (企业级搜索服务器)的PHP客户端库。
ExpressSearch 是 ExpressMe 建站系统所用的Lucene搜索引擎的封装。 示例代码: Searcher createSearcher() {
Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。Mustru提供的功能包括:
中文社区的全文搜索功能一直是个让人头疼的问题,其实追根究底是由MySQL自身的问题造成的。当数据量大的时候,任何的RDBMS的查询都无法满足现今互联网的要求。
基于Lucene的全文检索框架 一、 介绍 基于Lucene的全文检索框架,提供快速方便的索引创建及查询方式,并提供扩展功能对框架进行扩展。
从名字就可以看出,这是 Solr 的 PHP 客户端开发包。 示例代码: require_once(‘Apache/Solr/Service.php’);
Zend_Search_Lucene 是一个完全由 PHP 5 编写的通用文本搜索引擎。由于其将索引保存在文件系统中而不需要数据库支持,因此它几乎可以为任何由 PHP
imgSeek 的桌面版本是一个免费的开源可视相似性项目集合。我可以将此查询表述为我所绘制的一个草图或我提供的另一个图像。imgSeek
Seeks 是一个Web搜索代理引擎,一个实时的P2P模式匹配网络,用于搜索社会化网络。可进行去中心化搜索数据合并,而这些对用户来说都是透明。
Whoosh 是一个纯python实现的全文搜索组件。Whoosh不但功能完善,还非常的快。 Whoosh的作者是MattChaput,由Side Effects Software公司开发。项目的最初用于Houdini(Side Effects
ASPSeek是一个C++编写的免费开源互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性
LucidGaze for Solr 是由 Lucid 开发的开源solr 监测工具,提供快照、存储、交互视图、比较各种 solr 性能指标。 包括:
Lucene.Net开源项目转向商业化后,DotLucene以Lucene.Net作为基础继续进行开发。 目前该项目已关闭!
bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。
Nut 是一个为lucene提供分布式搜索的框架。理论上可对千G以上索引文件支持数千万级的用户搜索访问。Nut由Client、Server、Cache和DB四
Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎,能够解决越来越多的用例。作为 Elastic Stack
Zoie 是一个基于Apache Lucene构建的实时搜索和索引系统。
caterpillars工具主要用来提供文本预处理功能。输入文本全文及其该文本的字典,字典是手动制作,输出两个二进制格式的全文索引文件。用户可以直接根据这两个索引文件,实现嵌入式设备上的文本查询,缩短嵌入式设备
Yahoo BOSS (Build your Own Search Service) 是 PHP 的 Yahoo 搜索客户端API,可通过它获取来自网页的搜索结果、新闻和图片等,并进行缓存。