Автор Гілка: Сканування та OCR  (Прочитано 3059 раз)

Відсутній Sergii Galashyn

  • Новачок
  • *
  • дописів: 40
  • Карма: +0/-0
Сканування та OCR
« : 2008-01-14 12:03:42 »
Доброго дня.
Порадьте, будь ласка, ПЗ для сканування і (головне) розпізнавання текстів. Звісно, потрібна українська мова, бажано з різними словниками (технічний, загальний і т.п.), якщо є такі можливості.
Було б добре дізнатися про переваги та недоліки різних програм.
Дякую!
Ubuntu 10.10 @ Dell Latitude E6500

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3636
  • Карма: +3/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Сканування та OCR
« Відповідей #1 : 2008-01-14 13:21:24 »
Для сканування Kooka (у Вас KDE, тому її можна буде легше встановити) і для розпізнавання CuneiForm 12.0  (33,4 Мб) під wine (якщо Ви гидуєте піратством) або FineReader 7.0 теж під wine (якщо Вам по барабану, посилання покаже Ґуґл).
Якщо згодні почекати, то, можливо, за півроку буде все виянтково під Linux (tesseract або розробка на основі CuneiForm).
Try to reach you before winter comes
Always a place for you in my heart
You're not alone
All used up
I'd give anything to talk to you

Відсутній piktor

  • Видавець
  • *******
  • дописів: 3396
  • Карма: +0/-0
Re: Сканування та OCR
« Відповідей #2 : 2008-01-14 22:11:49 »
Для сканування Kooka (у Вас KDE, тому її можна буде легше встановити) і для розпізнавання CuneiForm 12.0  (33,4 Мб) під wine (якщо Ви гидуєте піратством) або FineReader 7.0 теж під wine (якщо Вам по барабану, посилання покаже Ґуґл).
Якщо згодні почекати, то, можливо, за півроку буде все виянтково під Linux (tesseract або розробка на основі CuneiForm).
І що - все це задоволення розпізнає кирилицю? yurchor, де Ви раніше були, коли я задавав запитання про OCR кирилиці?
Всим, хто тоне й не знає,
За що вхопитись,
Хто вже з останніх
Вибився сил:
Попереджаю - я не колода,
Попереджаю - я крокодил.

Praporshic

  • Гість
Re: Сканування та OCR
« Відповідей #3 : 2008-01-14 22:32:22 »
Воно наразі поганенько розпізнає кирилицю. Майже ніяк...

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3636
  • Карма: +3/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Сканування та OCR
« Відповідей #4 : 2008-01-15 07:03:46 »
Воно наразі поганенько розпізнає кирилицю. Майже ніяк...
Ви пробували? Я пробував — чудово воно розпізнає кирилицю.

І tesseract аби не жорстко вшиті процедури теж з моїми файлами чудово розпізнає українську!
Цитата
де Ви раніше були, коли я задавав запитання про OCR кирилиці?
Я сам три тижні тому спробував CuneiForm. Щодо того, де я був — там і був, мені хтось у налагоджуванні tesseract допоміг?
« Змінено: 2008-01-15 07:20:08 від yurchor »
Try to reach you before winter comes
Always a place for you in my heart
You're not alone
All used up
I'd give anything to talk to you

Відсутній piktor

  • Видавець
  • *******
  • дописів: 3396
  • Карма: +0/-0
Re: Сканування та OCR
« Відповідей #5 : 2008-01-15 09:03:18 »
Ой, упустив момент - воно теж під wine, як і Fine Reader. А, оскільки, я не гордий, то все-таки краще користуватися більш розвиненм продуктом.
Всим, хто тоне й не знає,
За що вхопитись,
Хто вже з останніх
Вибився сил:
Попереджаю - я не колода,
Попереджаю - я крокодил.

Відсутній Sergii Galashyn

  • Новачок
  • *
  • дописів: 40
  • Карма: +0/-0
Re: Сканування та OCR
« Відповідей #6 : 2008-01-15 14:36:21 »
Для сканування Kooka (у Вас KDE, тому її можна буде легше встановити) і для розпізнавання CuneiForm 12.0  (33,4 Мб) під wine (якщо Ви гидуєте піратством) або FineReader 7.0 теж під wine (якщо Вам по барабану, посилання покаже Ґуґл).
Якщо згодні почекати, то, можливо, за півроку буде все виянтково під Linux (tesseract або розробка на основі CuneiForm).
Так, Kooka у мене є вже. Питання було більше до OCR. Чекати навряд вийде стільки... доведеться засобами офтопіку. У будь-якому разі, дякую за допомогу.
Ubuntu 10.10 @ Dell Latitude E6500

Відсутній marti88

  • Дописувач
  • **
  • дописів: 56
  • Карма: +0/-0
Re: Сканування та OCR
« Відповідей #7 : 2008-03-12 07:54:30 »
Якісь зрушення у розпізнаванні корилиці на цей час є? Невже ніколму ніколи не треба розпізнавати і всі сидять у wine? Якось це дивно звучить..
marti-ua.info

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3636
  • Карма: +3/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Сканування та OCR
« Відповідей #8 : 2008-03-12 08:59:54 »
Якісь зрушення у розпізнаванні корилиці на цей час є? Невже ніколму ніколи не треба розпізнавати і всі сидять у wine? Якось це дивно звучить..
Читати тут.

Автори kooka написали мені, що тільки-но вийде Ocropus (3 квартал 2008) підтримку tesseract (а отже і розпізнавання кирилиці з збереженням макету сторінки) буде додано.
Try to reach you before winter comes
Always a place for you in my heart
You're not alone
All used up
I'd give anything to talk to you