3i Search - Полнотекстовый поиск в корпоративных системах

#BXHTMLCOMMENT_0# 3i Search – развитая поисковая система корпоративного класса, поддерживающая весь традиционный функционал поисковых движков имеющихся на рынке, а также обладающий уникальными особенностями, превышающими текущие возможности не только бесплатных (Open Source) движков, но и платных решений корпоративного поиска:
  • Единая система, в которой функциональные модули тесно интегрированы между собой, что обеспечивает простой и удобный механизм инсталляции решения, а также возможность использовать обширный язык запросов, максимально охватывая все функциональные возможности системы.
  • Поддержка различных языков и автоматическое определение языка: русский, английский, арабский, иврит, итальянский, испанский, китайский (трад.), китайский (упр.), корейский, немецкий, польский, португальский, турецкий, французский, японский.
  • Наилучшая в своем классе технология лингвистического разбора текстов на естественном языке и речи для русского языка, языков стран СНГ и других языков.
  • Качественная морфология русского и английского языка (без традиционного стемминга). Улучшенная лингвистическая поддержка языков, в частности, лингвистика русского языка гораздо совершеннее механизмов, которые используются в зарубежных недешевых решениях.
  • Доступность всех функций 3i Search через Web-интерфейс (SOAP-API).
  • Единый механизм индексации для данных любой природы (текст, голос, видео), совместное использование мультимедийных данных любой природы для индексации и обработки с помощью пользовательских запросов. Поддерживаются любые форматы звуковых файлов.
  • Единый механизм индексации для структурированных и неструктурированных данных.
Самый широкий спектр источников структурированных и неструктурированных данных из всех имеющихся на рынке:
  • интернет-ресурсы, соцсети;
  • все типы популярных СУБД;
  • файлы данных всех типов на серверах, настольных компьютерах пользователей, мобильных телефонах (в помещениях компании);
  • переписка по электронной почте;
  • офисное ПО;
  • записи системных журналов.
  • Встроенные механизмы оптимизации индексации, что позволяет получать высокопроизводительное решение поиска «прямо из коробки», без привлечения специалистов для настройки и оптимизации работы поискового движка, как это обычно случается с Open Source ПО.
  • Кросс-языковый поиск (13 языков).
  • Обширные возможности синтаксической обработки данных – шире, чем у, например, поиск похожих документов, категории различных типов, встроенная динамическая кластеризация с удобным интерфейсом и наглядным графическим отображением.
  • Дополнительные лингвистические возможности: кросс-языковый поиск (не тривиальная транслитерация типа «Обама – Obama», а реальная кросс-языковая поддержка типа «Дерево – Tree», поиск синонимов,
  • Категоризация «на проходе»  - параллельно с индексацией, а не по заранее построенному дереву запроса, что при работе в составе больших систем со сложными поисковыми запросами оказывается сверхтрудоемким и медленным процессом, а зачастую и вообще нереализуемым.
  • Учет контекста и модель предсказания.
  • Критерий информационной ценности сообщений.
3i Search – гибкая легко масштабируемая платформа корпоративного поиска уровня. Распределенная архитектура индексации, реализованная в ПО 3i Search,  обеспечивающая высокую производительность работы на объемах Big Data:
  • Высокая скорость индексации объемов данных масштаба Big Data. Реальные тесты показали: для индексации данных объемом свыше 400 Гб требуется менее 0,5 сек.
  • Высокая скорость работы индексированных категорий – большая редкость для рынка.
  • Линейная масштабируемость по количеству обрабатываемых запросов и проиндексированных данных.
  • Реально протестирована высокопроизводительная работа 3i Search Engine на объеме данных около 1 миллиарда документов с помощью структуры из 24 узлов индексации (серверов приложений). Рекомендуемое количество документов на один узел индексации - до 5 млн.
В составе ПО 3i Search – гибкая территориально-распределенная и легко расширяемая подсистема сбора данных. Базовый блок системы сбора корпоративных данных – набор программных коннекторов, обеспечивающих связь 3i Search с различными информационными  источниками, как внешними (ресурсы Интернет), так и внутренними.

Базовая комплектация подсистемы сбора данных 3i Search:
  • Файловая система, Интернет, POP3/IMAP, Fetch API.
  • Более 200 различных форматов файлов, включая  XML, HTML, PDF, файлы Microsoft Office и многие другие. Для XML и HTML имеются гибкие настройки.
  • Услуги по созданию краулеров для интернет-ресурсов, необходимых заказчику.
ПО корпоративного поиска 3i Search поддерживает мощный и гибкий язык запросов, в частности, включающий:
  • Поиск по ключевым словам.
  • Смысловой поиск, включая поиск синонимов.
  • Нечеткий поиск (включая поиск слов с искажениями относительно слов в запросе). Нечеткий поиск реализован на основе синтаксической метрики, оценивающей, насколько «далеко» отстоит от исходного другое слово, полученное с помощью синтаксических преобразований). На практике такой подход позволяет, например, выявлять ситуации преднамеренной замены символов, например, буквы «О» на цифру «0» с целью усложнить работу более простых поисковых систем.
  • Высокий уровень нечеткого поиска позволяет распознавать смысл в текстах с орфографическими ошибками, пропущенными словами, неправильно построенными предложениями, в нечетко произнесенных словах.
  • Параметрический поиск (автоматическое пересечение полей для оптимизации индексации).
  • Поиск похожих документов (выявление ограниченного количества наиболее значимых слов в исходном документе и поиск результирующих документов по этому списку).
  • Поиск по различным типам полей.
  • Поиск с учетом синонимов и пользовательских словарей.
  • 3i Search обеспечивает развитые возможности обработки проиндексированных данных
  • Классификация документов с поддержкой различных типов классификаторов для совместной работы, например, пользовательские, групповые, общие.
  • Кластеризация документов.
  • Динамическая кластеризация результатов поиска.
  • Построение карты связей для кластеров.
  • Смысловое аннотирование.
ПО корпоративного поиска 3i Search ориентировано на использование в составе информационных систем предприятия:
  • Возможность экспорта/импорта данных полнотекстового поиска в ERP-системы и другие информационные системы уровня предприятия.
  • Интеграция данных полнотекстового поиска с семантической базой знаний для целей последующей обработки корпоративных знаний методами логического анализа.
  • Анализ статистики по запросам (анализ интересов пользователей) в интересах различных служб предприятия.
  • Режим информационного мониторинга, реализуемый с помощью пользовательских агентов для настройки мониторинга данных и уведомлений о событиях.
Rambler's Top100