Автор Гілка: SpaCy 3.0  (Прочитано 387 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3465
  • Програміст
SpaCy 3.0
« : 2021-02-01 19:51:20 »
Spacy — це бібліотека для розпізнавання токенізації тексту. Зараз підтримується 69 мов, включно з українською. Доступні попередньо натреновані моделі для 18-ти мов (українська відсутня, присутня російська), та багатомовна модель для всіх 18-ти мов. З основного в новій версії — підтримка трансформерів.

Сайт: https://spacy.io/
Сторінка проєкту: https://github.com/explosion/spaCy
Оголошення: https://github.com/explosion/spaCy/releases/tag/v3.0.0

Приклад:

Apple розглядає можливість купівлі стартапу з Обʼєднаного Королівства за $1 млрд.

Apple PROPN nsubj
розглядає VERB ROOT
можливість NOUN obj
купівлі NOUN nmod
стартапу NOUN nmod
з ADP case
Обʼєднаного ADJ amod
Королівства PROPN nmod
за ADP case
$ SYM nmod
1 NUM appos
млрд NOUN punct

[Fedora Linux]

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1891
Re: SpaCy 3.0
« Відповідей #1 : 2021-02-03 10:13:19 »
Не збагну: це натренована бібліотека чи людьми написаний алгоритм?

Відсутній ysenko

  • Новачок
  • *
  • дописів: 20
  • Python developer
Re: SpaCy 3.0
« Відповідей #2 : 2021-02-03 12:37:41 »
Не збагну: це натренована бібліотека чи людьми написаний алгоритм?

Ця бібліотека яка дозволяє натреневати свою модель, а також містить кілька вже готових (для української мови готового варіанту немає).

Trained models/pipelines: https://spacy.io/models
Custom models/pipelines: https://spacy.io/usage/training#quickstart
import antigravity

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1891
Re: SpaCy 3.0
« Відповідей #3 : 2021-02-03 16:28:50 »
а також містить кілька вже готових (для української мови готового варіанту немає).
Тоді що значить «Зараз підтримується 69 мов, включно з українською»?

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3465
  • Програміст
Re: SpaCy 3.0
« Відповідей #4 : 2021-02-03 16:35:17 »
а також містить кілька вже готових (для української мови готового варіанту немає).
Тоді що значить «Зараз підтримується 69 мов, включно з українською»?

Можна згенерувати конфігурацію і натренувати модель під свої потреби.
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3465
  • Програміст
Re: SpaCy 3.0
« Відповідей #5 : 2021-02-03 16:43:26 »
До речі, Ukr-Roberta дуже хорошої думки про Лінукс. :-)
[Fedora Linux]