Ну так, хоч якось працює, можна результат докласти (сканеру не було, довелося текст у KolourPaint малювати).До речі, при компілюванні под posix-несумiсною ОС, має місце дивне явище: програма працює лише на тій машині, на якій була скомпільована. А взагалі, залишити б нещасну програму у спокої, вона вже давно застаріла. Жирний і курсив не розпізнає, нижній регістр не розпізнає, текст шукати на сторінці не вміє. З зображеннями працює лише з бінарними. I щоб все те реалізувати, то легше вже написати систему з нуля.
У файлах тренування присутній теґ, що відповідає за шрифт, отже прикручування шрифтів буде виконано елементарно...
Іще - порадьте будь-ласка офлайновий англо-український (російський) словник для Лінукса. Бо лінивий я погано вчив англійську в школі.
Цитата: Piktor від 2008-02-25 11:36:42Іще - порадьте будь-ласка офлайновий англо-український (російський) словник для Лінукса. Бо лінивий я погано вчив англійську в школі.StarDict + Muller7 (sdcv rulez )
На сторінці проекту stardict на sf лежать вже перегнані словники з Lingvo, з нормальними транскрипціями.
Цитата: Cthulhu від 2008-02-25 13:20:47На сторінці проекту stardict на sf лежать вже перегнані словники з Lingvo, з нормальними транскрипціями.Що, знову? Їх же прибирали...P.S. Cthulhu: маєш зірочку за рекламу варезу
/me почухав голову, яка так важко переварювала прочитане тут. Наче-ж і не тупий...Yurchor, а де ви знайомитеся з усим цим добром перед тим як викладати сюди? Першоджерела в студію будь-ласка.Зоврема, мене збило з пантелику:ЦитатаУ файлах тренування присутній теґ, що відповідає за шрифт, отже прикручування шрифтів буде виконано елементарно... Скажу відразу - в мене десь на жорсткому диску лежить файл Training Tesseract.html, проте спер я його ще давно, тому до нього руки ще не дійшли.Іще - порадьте будь-ласка офлайновий англо-український (російський) словник для Лінукса. Бо лінивий я погано вчив англійську в школі.
По порядку: 0) під Posix-несумісною ОС є рідний CuneiForm (до речі, як то кажуть: "Hey, what's the bug number?")1) жирний і курсив розпізнає (якщо не розпізнає, надішліть мені, будь ласка, скан),2) нижній регістр розпізнає (те саме),3) шукати текст: це як?4) ви маєте небінарні зображення Поясніть інтелектуально розвиненій секретарці, що документообіг ведеться у чорно-білих тонах.5) можна адресу, де всі могли б ознайомитися з написаною з нуля програмою (www.abbyy.com не пропонувати)?P.S. У файлах тренування присутній теґ, що відповідає за шрифт, отже прикручування шрифтів буде виконано елементарно...
http://groups.google.com/group/tesseract-ocr-russian?hl=ru
Може відкрити у "Балачках" розділ "Сни". Можу поділитися міркуваннями про те, які сни сняться мені, чому недолугі KDE і GNOME і який я на днях написав би менеджер стільниць (ну просто ідеальний).
Цитата: yurchor від 2008-02-25 20:01:01Може відкрити у "Балачках" розділ "Сни". Можу поділитися міркуваннями про те, які сни сняться мені, чому недолугі KDE і GNOME і який я на днях написав би менеджер стільниць (ну просто ідеальний).І давно вам такі жахіття сняться?
А поки що працюватиму над тим, що вже існує і працює.
Цитата: yurchor від 2008-02-25 20:01:01А поки що працюватиму над тим, що вже існує і працює./me плаче, спостерігаючи, як ентузіасти реанімують давно зітлілий труп, а поряд у тіні стоять зомбі та привиди недонароджених GOCR, clara ocr, ocrad, kognition, OCRchie, WeOCR, XOCR та інших...