Автор Гілка: Українській аналізатор в українській вікіпедії  (Прочитано 2945 раз)

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Декілька днів тому переіндексували базу пошуку української вікіпедії за допомогою нового українського аналізатора, що з'явився в пошуковій системі Lucene 6.2/ElasticSearch 5.1.2. До цього моменту для пошуку використовувався дещо адаптований російський аналізатор з відповідними проблемами пошуку. Тим часом український аналізатор в альфа-версія Lucene 7/ElasticSearch 6 отримав вдосконалення пошуку власних назв та покращену логіку для спецсимволів (різних видів апострофа, знаку м'якого перенесення тощо).
Для прикладу: тепер на фразу «кота Шредінгера» будуть шукатися, як «кіт Шредінгера» так і «котом Шредінгера», раніше такі чергування в корені слова не шукалися.
Fedora 35 (x86-64)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Це однозначно перемога!

Воно індексує та віддає на модерування чи дещо автоматично виправляє?

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
це лише індексація для пошуку
Fedora 35 (x86-64)