Автор Гілка: Генеральний регіонально анотований корпус української мови  (Прочитано 3998 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3837
  • Карма: +12/-0
  • Програміст
ГРАК — це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію.

Корпус охоплює період з 1816 по 2022 р. і містить понад 130 тисяч текстів різних жанрів, близько 30 тисяч авторів.

Домашня: https://uacorpus.org/
[Fedora Linux]

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1931
  • Карма: +5/-0
... і містить майже 2 млрд токенів.
Fedora 35 (x86-64)