Автор Гілка: UkrainianMorfologikAnalyzer в Lucene 6.2  (Прочитано 2289 раз)

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1923
  • Карма: +4/-0
UkrainianMorfologikAnalyzer в Lucene 6.2
« : 2016-10-14 22:21:51 »
До недавна майже всі відкриті системи повнотекстового пошуку для української використовували російські аналізатори. Але з версії 6.2 в Lucene є український лематизувальний аналізатор:
https://lucene.apache.org/core/6_2_0/analyzers-morfologik/org/apache/lucene/analysis/uk/UkrainianMorfologikAnalyzer.html

Далі його додадуть в Elastic: https://github.com/elastic/elasticsearch/issues/19433

А потім і вікіпедія почне його використовувати: https://phabricator.wikimedia.org/T148051
Fedora 35 (x86-64)