Автор Гілка: ВЕСУМ 4.0  (Прочитано 2360 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3822
  • Карма: +11/-0
  • Програміст
ВЕСУМ 4.0
« : 2017-12-17 01:06:43 »
Вийшла версія 4.0.0 Великого електронного словника української мови (ВЕСУМ).
 Ця версія містить:
 * понад 327 тис. лем, з яких генеруються понад 5,096 млн словоформ (з них понад 2,909 млн унікальних)
 * синхронізовані з КОАТУУ назви нас. пунктів (зокрема декомунізованих)
 * варіанти заміни для майже 4000 покручів і небажаних слів
 * інформація про керування відмінками
 * інформація про абревіатури, сленгові та рідковживані слова, а також слова, написані не за чинним правописом Починаючи з цієї версії також слова зі словника можна шукати через веб-інтерфейс: http://r2u.org.ua/vesum
 Наразі веб-сторінка показує результати у «сирому» форматі, з тегами, але сподіваємося згодом додати також «ушляхетнений» вигляд з гарною табличкою.
 Високоякісний, спрямований на практичне застосування український словник такого обсягу у вільному доступі є результатом довгої праці багатьох людей. Користуючись нагодою хотілося б подякувати зокрема Vasyl Starko​, Mariana Romanyshyn, Olga Havura, Khrystyna Skopyk​, Nastia Osidach​, Nataliia Cheilytko​, Oksana Kunikevych, Oksana Tkach​, Богдан Москалевський, Natalia Kotsyba, Dmitry Chaplinsky​ та іншим учасникам команди БрУК
 Сторінка проекту: https://github.com/brown-uk/dict_uk
 Додаток перевірки орфографії для Firefox: https://addons.mozilla.org/uk/firefox/addon/ukrainian-dictionary/
 Додаток перевірки орфографії для LibreOffice: https://extensions.libreoffice.org/extensions/ukrainian-spelling-dictionary-and-thesaurus/4-0.0/@@download/file/dict-uk_UA-4.0.0.oxt
 Також на цьому словнику базується українські модулі правописника LanguageTool, і пошукових систем Lucene/ElasticSearch, що у свою чергу використовуються в українській Вікіпедії.
 Словник призначений насамперед для застосування в програмних засобах (зокрема для NLP, перевірки орфографії, граматики, повнотекстового пошуку тощо), але оскільки проект розповсюджується за умов відкритої ліцензії, сфера його вжитку практично необмежена. І оскільки проект є вільним і відкритим будь-хто може долучитися до його розвитку, або звітувати про помічену помилку.
[Fedora Linux]

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Re: ВЕСУМ 4.0
« Відповідей #1 : 2017-12-17 22:43:08 »
Хороша робота. Я так розумію, що це в основному команда Grammarly розвиває?

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: ВЕСУМ 4.0
« Відповідей #2 : 2017-12-18 20:13:55 »
Хороша робота. Я так розумію, що це в основному команда Grammarly розвиває?
Команда Grammarly брала участь і добряче нам допомогла, але десь рік тому вони відійшли від справ. Наразі я не бачу зацікавленості команди Grammarly українськими NLP.
Зараз цим займається команда БрУК
Fedora 35 (x86-64)

Відсутній denkin

  • Кореспондент
  • ***
  • дописів: 136
  • Карма: +3/-0
Re: ВЕСУМ 4.0
« Відповідей #3 : 2018-01-03 01:40:50 »
Дякую! Навіть не знав про цей проект. Обов'язково спробую в роботі.
Xubuntu 20.04.X + Xubuntu Testing

Відсутній burunduk32

  • Новачок
  • *
  • дописів: 49
  • Карма: +0/-0
Re: ВЕСУМ 4.0
« Відповідей #4 : 2018-01-05 09:11:51 »
Чомусь словник для firefox не знаходить в пошуку (якщо сукати через панель додатків в самому firefox).
На сайті доповнення, посилання йдуть на сторінку Googlecode Archiv.

І чи не можна рекомендувати даний словник як вбудований в основну збірку? Аби він йшов предвстановлений в українську збірку.
« Змінено: 2018-01-05 09:15:27 від burunduk32 »

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: ВЕСУМ 4.0
« Відповідей #5 : 2018-01-05 18:21:56 »
дякую, щодо пошуку створив https://github.com/mozilla/addons/issues/608

не знайшов де посилання веде на Googlecode Archiv, але оновив декілька посилань на github

наскільки я знаю, цей словник включають в українську збірку, але оновлюють не так часто
Fedora 35 (x86-64)

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: ВЕСУМ 4.0
« Відповідей #6 : 2018-01-09 04:59:05 »
схоже в about:addons пошук не шукає  словники, але обіцяють виправити цю проблему в Firefox 59
Fedora 35 (x86-64)

Відсутній burunduk32

  • Новачок
  • *
  • дописів: 49
  • Карма: +0/-0
Re: ВЕСУМ 4.0
« Відповідей #7 : 2018-01-09 08:51:37 »
Дивно, що зараз перестало робити, бо раніше тільки так і шукав.

Відсутній burunduk32

  • Новачок
  • *
  • дописів: 49
  • Карма: +0/-0
Re: ВЕСУМ 4.0
« Відповідей #8 : 2018-01-25 22:21:06 »
Таке питання, перекладаю додаток (QT), і там часто трапляється символ &, який розділяє слово і програма перевірки бачить там помилку. Чи можу створити собі словник, аби цей символ ігнорувався?

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: ВЕСУМ 4.0
« Відповідей #9 : 2018-01-26 05:06:01 »
так:
у файлі uk.aff у рядок IGNORE додати & аісля символу наголосс
Fedora 35 (x86-64)