Автор Гілка: NLTK/Python та українська? (Прочитано 7330 раз)

Дмитро Редчук · « : 2013-08-02 10:12:15 »

Усім привіт!

>>> from nltk.corpus import stopwords
>>> 
>>> print stopwords.fileids()
['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'portuguese', 'russian', 'spanish', 'swedish', 'turkish']
>>>

Хочу українську

Хто що підкаже?

Дякую!

DalekiyObriy · « **Відповідей #1 :** 2013-08-03 23:12:32 »

якщо треба саме stopwords, то спробуйте погуглити, є здається декілька списків (хоча напевне далеко не повних)
також можна спробувати витягнути їх зі spell-uk

якщо ви хочете цілий корпус, то ніби робота йде, але поки нема

Автор Гілка: NLTK/Python та українська? (Прочитано 7330 раз)

Дмитро Редчук

NLTK/Python та українська?

DalekiyObriy

Re: NLTK/Python та українська?