Автор Гілка: Tesseract Ukrainian  (Прочитано 46098 раз)

Praporshic

  • Гість
Re: Tesseract Ukrainian
« Відповідей #30 : 2008-02-26 09:34:16 »
Те саме можна сказати і про російських перекладачів: ми за меншого ресурсу виконавців, робимо як маленьких російську команду перекладачів KDE4.
В мене питаннячко: часом не вони перекладали KDE4 українською? Таких знущань з мови я у ВПЗ ще не бачив.

Відсутній piktor

  • Видавець
  • *******
  • дописів: 3396
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #31 : 2008-02-26 10:40:29 »
Ну, якщо вже yurchor заговорив про GUI то я згадав свою потребу прикрутити його до tesseractу, що вже в мене працює. Бо знаєте - спочатку скануй, збергіай, а лиш потім з консолі розпізнавай.
Іще - багатомовні тексти. Тобто наявність кирилиці та латиниці одночасно в тексті. Зокрема таке буває в нашій улюбленій інформатиці.
Всим, хто тоне й не знає,
За що вхопитись,
Хто вже з останніх
Вибився сил:
Попереджаю - я не колода,
Попереджаю - я крокодил.

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3628
  • Карма: +2/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Tesseract Ukrainian
« Відповідей #32 : 2008-02-27 18:29:21 »
Доки я спав та мріяв, підсуєтилися якісь в’єтнамці. Їх поробка на java виглядає страшнувато і працює лише під Windows (принаймні під Linux мені запустити її так і не вдалося). Ідея така: виділяємо руцями текстову частину на зображенні у форматі JPEG, GIF, BMP або PNG і натискаємо кнопку розпізнавання = отримуємо текстовий результат. Зрозуміло, що перед цим треба зробити деякі очевидні махінації щодо впихування 2.02 та української (чи російської) мови до дистрибутиву tesseract, що йде в комплекті.

Кого не влаштовує, чекаємо на Ocropus (Google-ва клієнтська програма (GUI) з підтримкою формату сторінки, має вийти у 3 кварталі цього року, покищо доступна лише альфа-версія). Або голосуємо за баг у Kooka, може колись розробники звернуть на це увагу?
« Змінено: 2008-02-27 18:29:43 від yurchor »
Denounce the demagogues
King diamonds to discard
Deploy the dialogue
Your word against the law

Відсутній oleksa

  • Кореспондент
  • ***
  • дописів: 214
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #33 : 2009-06-29 03:41:17 »
Будь ласка, дайте лінк на сторінку з файлом, який дозволить розпізнати український текст, бо наведене вище посилання не дійсне :-( Дякую.
PS Чи пробував хтось прикрутити це диво до Kooka?

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3628
  • Карма: +2/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Tesseract Ukrainian
« Відповідей #34 : 2009-06-29 09:07:24 »
Будь ласка, дайте лінк на сторінку з файлом, який дозволить розпізнати український текст, бо наведене вище посилання не дійсне :-( Дякую.
PS Чи пробував хтось прикрутити це диво до Kooka?
http://omploader.org/vMXdhcw

Якщо підрегулювати DangAmbigs працює ще краще, але я десь загубив файл. :'(

До Kooka прикрутити не вдасться. Kooka здохла (див. вище).

На налаштування Ocropus потрібен час. Часу у мене немає (роботи досить небагато, є ідеї, але немає часу навіть на це). Може хтось візьметься?

Але, навіть якщо прикрутити вдасться, поки що форматування буде видано у форматі певного XML, який не дуже-то читається іншими програмами (єдиною відомою мені програмою є Firefox).

Такі справи.
Denounce the demagogues
King diamonds to discard
Deploy the dialogue
Your word against the law

Відсутній oleksa

  • Кореспондент
  • ***
  • дописів: 214
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #35 : 2009-06-29 22:47:07 »
Урра! Вийшло. Він розпізнав кілька слів і кілька з тих слів були українськими ))))
Думаю, що kooka - штука добра, хто б її лише довів би до ручки.

Відсутній StarWolf

  • Кореспондент
  • ***
  • дописів: 109
  • Карма: +0/-0
  • Олхімік
Re: Tesseract Ukrainian
« Відповідей #36 : 2009-07-12 21:36:03 »
Урра! Вийшло. Він розпізнав кілька слів і кілька з тих слів були українськими ))))
Думаю, що kooka - штука добра, хто б її лише довів би до ручки.
Кхм. Судячи з "кілька слів", вона вже доведена.
« Змінено: 2009-07-12 21:36:58 від StarWolf »
[Arch Linux] [Awesome WM]

Відсутній propan

  • Графоман
  • ****
  • дописів: 280
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #37 : 2012-01-23 19:37:46 »
Прохання: викладіть, будь ласка, готовий, зібраний ORC. Щоб працювати можна було.
БУДЬ ЗА МЕТР ПОЗАДУ ВЛАСНОЇ ГОЛОВИ

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3628
  • Карма: +2/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Tesseract Ukrainian
« Відповідей #38 : 2012-01-23 19:46:23 »
Прохання: викладіть, будь ласка, готовий, зібраний ORC. Щоб працювати можна було.
А що таке ORC? Вікіпедія пропонує лише такі варіанти:
  • Odonata Records Committee
  • Offshore Racing Congress, the organisation that sets handicap standards for maritime yacht racing
  • Ohio Revised Code
  • Old Red Cracker, an Internet hacker
  • Opinion Research Corporation, a polling and market research company
  • Orc Software
  • Orc (programming language), a programming language for computation orchestration
  • Oregon City (Amtrak station), Oregon, United States; Amtrak station code ORC
  • Organic Rankine cycle
  • Organized retail crime
  • Origin recognition complex, protein complex involved in eukaryotic DNA replication initiation
  • Oriental Railway Company, an Ottoman railway
  • IATA airport code ORC: Orocue Airport, in Orocue, Colombia
  • Otago Regional Council, a local government authority in New Zealand
Можете точніше сформулювати, що саме з вказаного вище вам потрібно викласти? Як саме з цим працювати?
Denounce the demagogues
King diamonds to discard
Deploy the dialogue
Your word against the law

Відсутній propan

  • Графоман
  • ****
  • дописів: 280
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #39 : 2012-01-24 21:00:54 »
Перепрошую.
Я маю на увазі розпізнавання тексту.
Сфотографував текст телефоном - розпізнав програмою й перевів у формат дос чи тхт.
Можна викласти вже готову й налаштовану програму?
 У мене Мінт Катя.
БУДЬ ЗА МЕТР ПОЗАДУ ВЛАСНОЇ ГОЛОВИ

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3628
  • Карма: +2/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Tesseract Ukrainian
« Відповідей #40 : 2012-01-24 21:27:18 »
Додаєте PPA: ppa:alex-p/notesalexp (у Fedora можна було б встановити найновіші версії, але і так згодиться: Ubuntu продовжує воювати з GNOME  ;D )

Встановлюєте ocrfeeder, tesseract (разом з модулем для української, англійської та інших мов) і cuneiform.

Або ось так:
apt-get install ocrfeeder tesseract cuneiform
Далі або користуєтеся OCRFeeder у графічному режимі, або (якщо дуже поспішаєте):

ocrfeeder-cli -l ukr -i page1.jpg page2.jpg -f html -o output.htm && loffice --convert-to odt output.html
« Змінено: 2012-01-24 21:33:24 від yurchor »
Denounce the demagogues
King diamonds to discard
Deploy the dialogue
Your word against the law

Відсутній propan

  • Графоман
  • ****
  • дописів: 280
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #41 : 2012-01-24 23:41:32 »
Я не зовсім розуміюсь що і як.
Мені б просто стягнути файл, клікнути по ньому, він встановлюється і все ок.
Можна так?
БУДЬ ЗА МЕТР ПОЗАДУ ВЛАСНОЇ ГОЛОВИ

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3628
  • Карма: +2/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Tesseract Ukrainian
« Відповідей #42 : 2012-01-25 17:46:55 »
Я не зовсім розуміюсь що і як.
Мені б просто стягнути файл, клікнути по ньому, він встановлюється і все ок.
Можна так?
Flame:
Ви — мій улюблений троль! Ну, ближче, ближче, я вас трошки погодую... Але не їжте забагато, бо станете малорухливим!
Не мав часу добре підготуватися, тому дам ось таке посилання.

Загалом кажучи, у нормальних системах всі залежності мають встановитися разом з основним пакунком. Або за допомогою одного клацання (openSUSE). На жаль, в Debian/Ubuntu/Linux Mint це неможливо. Єдиний можливий спосіб описано вище.
Denounce the demagogues
King diamonds to discard
Deploy the dialogue
Your word against the law

Відсутній propan

  • Графоман
  • ****
  • дописів: 280
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #43 : 2012-01-25 19:41:23 »
тисну - але нічого не відбувається...((
БУДЬ ЗА МЕТР ПОЗАДУ ВЛАСНОЇ ГОЛОВИ

Відсутній propan

  • Графоман
  • ****
  • дописів: 280
  • Карма: +0/-0
Re: Tesseract Ukrainian
« Відповідей #44 : 2012-01-26 17:39:03 »
хоча пакунки є а в меню графіка нема
БУДЬ ЗА МЕТР ПОЗАДУ ВЛАСНОЇ ГОЛОВИ