Автор Гілка: Локалізація tesseract  (Прочитано 1888 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3825
  • Карма: +11/-0
  • Програміст
Локалізація tesseract
« : 2007-09-16 16:09:32 »
Росіяни почали локалізацію tesseract-а. Tesseract - це програма для оптичного розпізнавання тексту створена компанією Hewlett Packard і відкрита під ліцензією Apache License 2.0. Різниця між російським алфавітом і україніською абеткою не є дуже велика. Список українських слів є в проекті spell-uk ( http://ispell-uk.sf.net ).

Стаття: http://groups.google.com/group/tesseract-ocr-russian/web/opennet
Форум: http://groups.google.com/group/tesseract-ocr-russian/
« Змінено: 2007-09-16 16:09:45 від lvm »
[Fedora Linux]

Відсутній rangel

  • Новачок
  • *
  • дописів: 33
  • Карма: +0/-0
  • I hate YaBB 2!
Re: Локалізація tesseract
« Відповідей #1 : 2007-09-16 17:28:33 »
Чудово. По роботі періодично доводиться сканувати / розпізнавати документи. Скоро вінда з її загогульками для цього буде не потрібна :)
Roman Suprotkin
Читайте мануали - вони рулять!
Google's power :D

Відсутній gvy

  • Письменник
  • *****
  • дописів: 576
  • Карма: +0/-0
Re: Локалізація tesseract
« Відповідей #2 : 2007-09-17 10:40:54 »
Ну, припустимо, FineReader Personal під WINE@Etersoft робить, якщо людям вірити... ех, ще в один проект не полізу.

Відсутній Веприк

  • Дописувач
  • **
  • дописів: 58
  • Карма: +0/-0
  • Pythonic man
Re: Локалізація tesseract
« Відповідей #3 : 2007-09-22 17:03:34 »
Чудово. По роботі періодично доводиться сканувати / розпізнавати документи. Скоро вінда з її загогульками для цього буде не потрібна :)

Як би це помякше сказати. Tessaract з тим же FineReader як запорожець поряд з мерседесом. Хоча якщо стоъть лише завдання витягнути текст, то може й придасться.
Мої рефлексії на довкілля http://blog.sasnyk.name