Elasticsearch: гибкая поисковая система

Examine — это абстракция Lucene.Net, которая используется Umbraco  номеров телефонов дElasticsearch: гибкая поисковая системаля индексации и поиска контента Umbraco. В последней версии Examine используется Lucene.Net 3.0.3, выпущенная в 2012 году. Последняя версия Lucene.Net — 4.8.

При работе с Examine для более требовательных веб-сайтов возникает ряд проблем. Например, реализация Lucene на платформе .NET по сравнению с исходной Java-версией Lucene сильно устарела: Lucene.net имеет версию 4.8, а версия Java — 8.2.0.

Последняя версия Lucene.Net имеет множество ул

учшений производительности и улучшенную многоязычную поддержку , в частности для языков CJK (китайский, японский и корейский), а именно морфологический анализ вместо стандартной токенизации.

Examine является проблемным поставщиком, когда веб-сайт использует настройку высокой доступности с балансировкой нагрузки, поскольку Examine основан на файлах, и вы можете столкнуться с проблемами блокировки файлов в настройке с балансировкой нагрузки.

Для Umbraco v8 и v7 существует хранилище BLOB-объектов Azure для Examine, однако оно все еще находится в стадии эксперимента.

ОБНОВЛЕНИЕ: Совместимый с v7 пакет Examine.AzureDirectory был выпущен 11 февраля 2020 г. В любом случае, v8 все еще остается экспериментальным пакетом.

 

номеров телефонов

Одной из сильных сторон Examine является то, что он значительно упрощает работу с индексированием/поиском с помощью Lucene, чем работу с необработанным Lucene, однако эта простота связана с сильной связью между Examine и Lucene. Поэтому, когда Lucene обновляется, это не так просто, как обновить его в Examine, это требует большого количества изменений в Examine.

Нам нужна гибкость Examine, но нам также нужны последние новости из последней версии Lucene.

Что такое Elasticsearch и почему он используется?

Elasticsearch — это высокопроизводительный поставщик поиска, который аэролиды поддерживает репликацию и реконструкцию без простоев. Он идеально подходит для CJK и поддерживает множество других языков. Он был спроектирован как поиск по всем типам данных (текстовым, числовым, географическим, структурированным и неструктурированным). Elastic также поддерживает множество различных типов запросов, от Lucene до запросов SQL.

Кроме того, в отличие от Examine, Elastic предоставляет отличные инструменты разработки, такие как Kibana, которые позволяют моделировать запросы, отлаживать их и анализировать индексы. Elastic также предназначен для обеспечения высокой доступности, что означает балансировку нагрузки, репликацию, переиндексацию с нулевым временем простоя и многое другое.

История проекта

Идея создания провайдера Examine Elastic возникла, когда  которая нужна вашему отделу маркетинга я увидел презентацию о поиске в Umbraco v7 на Польском фестивале 2018, где Исмаил Майат представил POC индексатора для v7, использующего сканирование контента. После презентации я искал лучший способ сделать это, не используя внешние процессы для индексации контента.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top