Автор Гілка: Tesseract Ukrainian (Прочитано 53249 раз)

Praporshic · « **Відповідей #30 :** 2008-02-26 09:34:16 »

Цитата: yurchor від 2008-02-26 06:32:52

Те саме можна сказати і про російських перекладачів: ми за меншого ресурсу виконавців, робимо як маленьких російську команду перекладачів KDE4.

В мене питаннячко: часом не вони перекладали KDE4 українською? Таких знущань з мови я у ВПЗ ще не бачив.

piktor · « **Відповідей #31 :** 2008-02-26 10:40:29 »

Ну, якщо вже yurchor заговорив про GUI то я згадав свою потребу прикрутити його до tesseractу, що вже в мене працює. Бо знаєте - спочатку скануй, збергіай, а лиш потім з консолі розпізнавай.
Іще - багатомовні тексти. Тобто наявність кирилиці та латиниці одночасно в тексті. Зокрема таке буває в нашій улюбленій інформатиці.

yurchor · « **Відповідей #32 :** 2008-02-27 18:29:21 »

Доки я спав та мріяв, підсуєтилися якісь в’єтнамці. Їх поробка на java виглядає страшнувато і працює лише під Windows (принаймні під Linux мені запустити її так і не вдалося). Ідея така: виділяємо руцями текстову частину на зображенні у форматі JPEG, GIF, BMP або PNG і натискаємо кнопку розпізнавання = отримуємо текстовий результат. Зрозуміло, що перед цим треба зробити деякі очевидні махінації щодо впихування 2.02 та української (чи російської) мови до дистрибутиву tesseract, що йде в комплекті.

Кого не влаштовує, чекаємо на Ocropus (Google-ва клієнтська програма (GUI) з підтримкою формату сторінки, має вийти у 3 кварталі цього року, покищо доступна лише альфа-версія). Або голосуємо за баг у Kooka, може колись розробники звернуть на це увагу?

oleksa · « **Відповідей #33 :** 2009-06-29 03:41:17 »

Будь ласка, дайте лінк на сторінку з файлом, який дозволить розпізнати український текст, бо наведене вище посилання не дійсне :-( Дякую.
PS Чи пробував хтось прикрутити це диво до Kooka?

yurchor · « **Відповідей #34 :** 2009-06-29 09:07:24 »

Цитата: oleksa від 2009-06-29 03:41:17

Будь ласка, дайте лінк на сторінку з файлом, який дозволить розпізнати український текст, бо наведене вище посилання не дійсне :-( Дякую.
PS Чи пробував хтось прикрутити це диво до Kooka?

http://omploader.org/vMXdhcw

Якщо підрегулювати DangAmbigs працює ще краще, але я десь загубив файл.

До Kooka прикрутити не вдасться. Kooka здохла (див. вище).

На налаштування Ocropus потрібен час. Часу у мене немає (роботи досить небагато, є ідеї, але немає часу навіть на це). Може хтось візьметься?

Але, навіть якщо прикрутити вдасться, поки що форматування буде видано у форматі певного XML, який не дуже-то читається іншими програмами (єдиною відомою мені програмою є Firefox).

Такі справи.

oleksa · « **Відповідей #35 :** 2009-06-29 22:47:07 »

Урра! Вийшло. Він розпізнав кілька слів і кілька з тих слів були українськими ))))
Думаю, що kooka - штука добра, хто б її лише довів би до ручки.

StarWolf · « **Відповідей #36 :** 2009-07-12 21:36:03 »

Цитата: oleksa від 2009-06-29 22:47:07

Урра! Вийшло. Він розпізнав кілька слів і кілька з тих слів були українськими ))))
Думаю, що kooka - штука добра, хто б її лише довів би до ручки.

Кхм. Судячи з "кілька слів", вона вже доведена.

propan · « **Відповідей #37 :** 2012-01-23 19:37:46 »

Прохання: викладіть, будь ласка, готовий, зібраний ORC. Щоб працювати можна було.

yurchor · « **Відповідей #38 :** 2012-01-23 19:46:23 »

Цитата: propan від 2012-01-23 19:37:46

Прохання: викладіть, будь ласка, готовий, зібраний ORC. Щоб працювати можна було.

А що таке ORC? Вікіпедія пропонує лише такі варіанти:

Odonata Records Committee
Offshore Racing Congress, the organisation that sets handicap standards for maritime yacht racing
Ohio Revised Code
Old Red Cracker, an Internet hacker
Opinion Research Corporation, a polling and market research company
Orc Software
Orc (programming language), a programming language for computation orchestration
Oregon City (Amtrak station), Oregon, United States; Amtrak station code ORC
Organic Rankine cycle
Organized retail crime
Origin recognition complex, protein complex involved in eukaryotic DNA replication initiation
Oriental Railway Company, an Ottoman railway
IATA airport code ORC: Orocue Airport, in Orocue, Colombia
Otago Regional Council, a local government authority in New Zealand

Можете точніше сформулювати, що саме з вказаного вище вам потрібно викласти? Як саме з цим працювати?

propan · « **Відповідей #39 :** 2012-01-24 21:00:54 »

Перепрошую.
Я маю на увазі розпізнавання тексту.
Сфотографував текст телефоном - розпізнав програмою й перевів у формат дос чи тхт.
Можна викласти вже готову й налаштовану програму?
У мене Мінт Катя.

yurchor · « **Відповідей #40 :** 2012-01-24 21:27:18 »

Додаєте PPA: ppa:alex-p/notesalexp (у Fedora можна було б встановити найновіші версії, але і так згодиться: Ubuntu продовжує воювати з GNOME

)

Встановлюєте ocrfeeder, tesseract (разом з модулем для української, англійської та інших мов) і cuneiform.

Або ось так:

Код: [Вибрати]

apt-get install ocrfeeder tesseract cuneiform
Далі або користуєтеся OCRFeeder у графічному режимі, або (якщо дуже поспішаєте):

Код: [Вибрати]

ocrfeeder-cli -l ukr -i page1.jpg page2.jpg -f html -o output.htm && loffice --convert-to odt output.html

propan · « **Відповідей #41 :** 2012-01-24 23:41:32 »

Я не зовсім розуміюсь що і як.
Мені б просто стягнути файл, клікнути по ньому, він встановлюється і все ок.
Можна так?

yurchor · « **Відповідей #42 :** 2012-01-25 17:46:55 »

Цитата: propan від 2012-01-24 23:41:32

Я не зовсім розуміюсь що і як.
Мені б просто стягнути файл, клікнути по ньому, він встановлюється і все ок.
Можна так?

Flame:

Ви — мій улюблений троль! Ну, ближче, ближче, я вас трошки погодую... Але не їжте забагато, бо станете малорухливим!

Не мав часу добре підготуватися, тому дам ось таке посилання.

Загалом кажучи, у нормальних системах всі залежності мають встановитися разом з основним пакунком. Або за допомогою одного клацання (openSUSE). На жаль, в Debian/Ubuntu/Linux Mint це неможливо. Єдиний можливий спосіб описано вище.

propan · « **Відповідей #43 :** 2012-01-25 19:41:23 »

тисну - але нічого не відбувається...((

propan · « **Відповідей #44 :** 2012-01-26 17:39:03 »

хоча пакунки є а в меню графіка нема

Linux.org.ua

Автор Гілка: Tesseract Ukrainian (Прочитано 53249 раз)

Praporshic

Re: Tesseract Ukrainian

piktor

Re: Tesseract Ukrainian

yurchor

Re: Tesseract Ukrainian

oleksa

Re: Tesseract Ukrainian

yurchor

Re: Tesseract Ukrainian

oleksa

Re: Tesseract Ukrainian

StarWolf

Re: Tesseract Ukrainian

propan

Re: Tesseract Ukrainian

yurchor

Re: Tesseract Ukrainian

propan

Re: Tesseract Ukrainian

yurchor

Re: Tesseract Ukrainian

propan

Re: Tesseract Ukrainian

yurchor

Re: Tesseract Ukrainian

propan

Re: Tesseract Ukrainian

propan

Re: Tesseract Ukrainian