Глава 1. Введение
mnoGoSearch является поисковым движком, использующим SQL, и предназначенным для организации поиска на одном или многих веб-серверах. mnoGoSearch состоит из двух частей. Первая часть - индексирующий механизм (indexer). Indexer пробегает по ссылкам и сохраняет в базе данных все найденные слова и новые ссылки. Вторая часть состоит из CGI-программы, предоставляющей возможность поиска в данных, собраенных indexerом. Так же существуют PHP и Perl интерфейсы, доступные с нашего сайта по адресу www.mnogosearch.org.
Первая версия mnoGoSearch была выпушена в ноябре 1998. До октября 2000, когда проект был передан Lavtech.Com Corp. и переименован в mnoGoSearch, поисковый движок носил имя UDMSearch.
Последние изменения можно найти на нашем web-сервере.
Возможности mnoGoSearch
Основные возможности mnoGoSearch:
Поддержка MySQL (требуется библиотека libz), PostgreSQL, mySQL, Solid, iODBC, unixODBC, EasySoft ODBC-ODBC bridge, Virtuoso, InterBase, Oracle (см. Разд. Oracle notes в Гл. 5), SyBase, MS SQL, SAPDB SQL, DB2 (см. Разд. Замечания по IBM DB2 в Гл. 5) SQL-серверов.
Поддержка HTTP.
Поддержка HTTP-прокси.
Поддержка HTTPS.
Поддержка FTP.
Поддежка NNTP (обе схемы URL news:// и nntp://).
Виртуальная схема URL htdb://. Позволяет индексировать и искать по большим текстовым/блобовым полям SQL-баз данных.
Возможности зеркалирования.
Встроенная поддержка text/html, text/xml и text/plain.
Поддержка внешних парсеров для остальных типов документов.
Нечёткий поиск на основе синонимов, подстрок и всех форм слов из поисковых запросов.
Поддержка Basic-авторизации. Позволяет индекировать интранет сервера, защищенные паролем.
Proxy authorization support.
Реентерабельность. Возможно выполнять одновременно несколько процессов индексирования и/или поиска по одной и тоже базе. Поддержка многопоточночти.
Поддержка стоп-листов.
Поддержка <META NAME="robots" content="..."> и robots.txt.
Интерфейсы на C, PHP.
Поддержка логических запросов.
Сортировка документов по релевантности и популярности.
Поддержка почти всех популярных в Интерете кодировок, включая Восточно-Азиатские мультибайтные и UTF8.
Поддержка HTML шаблонов для гибкой настройки вывода результатов поиска.
Расширенные возможности поиска: тэги, категории, лимиты по времени и т.д.
Возможность разбиения на отдельные слова фраз японского и китайского языков.