Автор Гілка: Локалізація tesseract (Прочитано 2129 раз)

Володимир Лісівка · « : 2007-09-16 16:09:32 »

Росіяни почали локалізацію tesseract-а. Tesseract - це програма для оптичного розпізнавання тексту створена компанією Hewlett Packard і відкрита під ліцензією Apache License 2.0. Різниця між російським алфавітом і україніською абеткою не є дуже велика. Список українських слів є в проекті spell-uk ( http://ispell-uk.sf.net ).

Стаття: http://groups.google.com/group/tesseract-ocr-russian/web/opennet
Форум: http://groups.google.com/group/tesseract-ocr-russian/

rangel · « **Відповідей #1 :** 2007-09-16 17:28:33 »

Чудово. По роботі періодично доводиться сканувати / розпізнавати документи. Скоро вінда з її загогульками для цього буде не потрібна

gvy · « **Відповідей #2 :** 2007-09-17 10:40:54 »

Ну, припустимо, FineReader Personal під WINE@Etersoft робить, якщо людям вірити... ех, ще в один проект не полізу.

Веприк · « **Відповідей #3 :** 2007-09-22 17:03:34 »

Цитата: rangel від 2007-09-16 17:28:33

Чудово. По роботі періодично доводиться сканувати / розпізнавати документи. Скоро вінда з її загогульками для цього буде не потрібна

Як би це помякше сказати. Tessaract з тим же FineReader як запорожець поряд з мерседесом. Хоча якщо стоъть лише завдання витягнути текст, то може й придасться.

Linux.org.ua

Автор Гілка: Локалізація tesseract (Прочитано 2129 раз)

Володимир Лісівка

Локалізація tesseract

rangel

Re: Локалізація tesseract

gvy

Re: Локалізація tesseract

Веприк

Re: Локалізація tesseract