8. Поисковые машины и системы полнотекстового поиска

Название

Автор(ы), Организация

Комментарий

Серверный Следопыт МедиаЛингва Серверный Следопыт – это высокопроизводительная система полнотекстового поиска информации по содержимому сайта. Позволяет осуществлять нечеткий и смысловой поиск документов на русском и/или английском языках. Для каждого найденного документа генерируется содержательная аннотация.
ARM Engine 4.0 © ABBYY Software House, 2001 ABBYY Retrieval & Morphology (ARM) Engine - это коммерческая инструментальная система, позволяющая встраивать в разрабатываемые приложения функции полнотекстового поиска и морфологического анализа текстов. Поддерживает практически все европейские языки, включая русский. Реализована в виде API с использованием технологии COM-объектов. Демо-версию можно получить бесплатно.
NeurOK Semantic Suite © НейрОК Интелсофт, 2002 Программные продукты для поиска и анализа в текстовых массивах информации, реализованные с использованием технологии нейтронных сетей. Серьезные цены, соответственно серьезности самих продуктов.
Поисковые системы Яndex Яндекс
© 1997-2004
Набор средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского и английского языков от компании Яндекс. Яndex.Server, Яndex.Publisher и Яndex.SDK.
Convera RetriervalWare Convera Technologies
Мощная поисковая система, обеспечивающая поиск и анализ информации в больших массивах текстовых данных с использованием запросов на естественном языке. Поддерживает все основные европейские и русский языки.
В 2007 году Convera была куплена норвежской компанией "Fast Search & Transfer", которая в свою очередь в 2010 была аффилирована Microsoft Corporation. В итоге RetrievalWare преобразовалось в Fast Search Server.
Поисковая система Ищейка iSleuthHound Technologies, © 1999-2003
Система, позволяющая организовать полнотекстовый поиск на Вашем персональном компьютере. Обрабатывает документы в формате обычного текста, MS Word и HTML. Ищейка использует мощный язык запросов и позволяет находить слова во всех формах и падежах. Рабочие языки - русский и английский. Для загрузки доступна freeware версия с некоторыми ограничениями.
Verity Ultraseek Verity Inc. Мощный поисковый движок для полнотекстового поиска. Поддерживает использование морфологии для практически всех европейских языков.
Quintura Search © Quintura Inc., 2005-2006 Персональная система полнотекстового поиска в сети Интернет. Поддерживает русский язык, производит кластернизацию результатов поиска и их визуализацию в виде семантической сети.
Яндекс desktop Яндекс, 2005-2006 Персональная система полнотекстового поиска Яндекс на локальном компьютере.
Nigma.ru МГУ им.М.В.Ломоносова, факультеты ВМиК и психологии, 2006 Интеллектуальная поисковая система Nigma, позволяющая производить поиск по более чем миллиарду русскоязычных документов в глобальном Интернете. Особенностью системы является способность кластеризации полученных результатов по рубрикам. Это значительно облегчает и ускоряет поиск нужной информации.
Компьютерная грамматика русского языка © Козиев Илья 2014 Программы грамматического анализа и поиска для русского языка (лексика, морфология, синтаксис).
Интеллектуальный партнер руководителя Интеллектуальный партнер, Минск Программа "Интеллектуальный партнер руководителя" (прежнее название "Рабочий стол аналитика") предназначена для полнотекстового семантического анализа документов на русском языке и извлечения из них знаний (прецедентов, примеров, фактов, решений и прогнозов), интересующих пользователя. При поиске используется семантическая сеть понятий, которая может редактироваться пользователем. Наиболее точные и неожиданные в своей божественной мудрости результаты получаются при поиске по деловой и экономической информации. На сайте представлены другие интересные программы и теоретические работы авторов в области семанического анализа данных.
SearchInform Компания "СОФТИНФОРМ" SearchInform Server
Поисковый сервер, позволяющий организовать полнотекстовый поиск информации в пределах корпоративной сети.
SearchInform Desktop
Инструмент для поиска информации на Вашем компьютере. Поддержка огромного количества форматов файлов и индексация сообщений почтовых клиентов и клиентов для мгновенного обмена сообщениями.
OEM - SearchInform SDK/API
Полнофункциональный инструмент для решения проблемы поиска для сторонних разработчиков. API легко интегрируется в любые приложения и позволяет организовать поиск по любым источникам данных.
Sphinx Sphinx Technologies Inc. Поисковый сервер с открытым кодом, реализующий чрезвычайно быстрый и качественный полнотекстовый поиск. Работает как надстройка над MySQL сервером и реализует собственный язык запросов SphinxQL, расширяющий стандарт SQL. Доступен для Windows, Linux и Mac ОС. Позволяет осуществлять лексический поиск с учетом морфологии для русского, английского и других языков. Используется многими сайтам по всему миру для индесирования миллиардов документов и терабайтов инофрмации.
Apache Lucene The Apache Software Foundation Java-библиотека, реализующая механизм высокопроизводительного полнотекствого поиска. Открытый код. Кросс-платформенность.
Solr The Apache Software Foundation Надежный сервер полнотекстового поиска масштаба предприятия, построенный на базе Apache Lucene. Взаимодействие с сервером реализовано в стандарте REST API.
Elasticsearch Elasticsearch, © 2015 Elasticsearch - это масштабируемая система полнотекстового поиска и анализа данных с открытым кодом. Она позволяет сохранять, искать и анализировать огромные объемы данных практически в реальном времени. Взаимодействие с системой реализовано в стандарте REST API. Реализована на Java. Поддерживает множество языков, в том числе и русский.
Eurika Engine Eurika Engine Система лингвистического анализа русскоязычных текстов, позволяющая извлекать новые знания и факты из неструктурированных данных огромных объемов (Big Data). Включает ряд независимых модулей:
  1. определение тональности текста,
  2. автоклассификация текста,
  3. выделение имен собственных и названий,
  4. нормализатор,
  5. морфоанализатор.

Система реализована как REST сервис, обмен данными с которым осуществляется в формате JSON-объектов.


© Электронная публикация — РВБ, 2000—2024. Составитель С.В. Логичев. Версия 10.0 от 08.02.2017