А є якісь наробки*? Чи все тільки "буде"? -----*Ну там хоча б алгоритми виписані, я не кажу підпрограми...
Цікаво, а чому Ви хочете написати нову програму замість приєднатися до якогось аналогічного проекту (claraOCR, gOCR)?
Я збираюся написати данну програму на JAVA , тому що я вважаю що програми повинні підходити під будь яку без перекомпіляції. А на скільки я розумію аналогічні проекти написані не на JAVA
Цитата: Fenenko від 2005-11-22 14:19:54 Я збираюся написати данну програму на JAVA , тому що я вважаю що програми повинні підходити під будь яку без перекомпіляції. А на скільки я розумію аналогічні проекти написані не на JAVAОт тільки Java є далеко не у всіх, та й у більшості дистрибутивів вона відсутня (через свою ліцензію) Тому й особливих переваг (крім проблем з запуском) такий підхід не дає...
Цитата: politruk від 2005-11-22 12:13:51Цікаво, а чому Ви хочете написати нову програму замість приєднатися до якогось аналогічного проекту (claraOCR, gOCR)? Я збираюся написати данну програму на JAVA , тому що я вважаю що програми повинні підходити під будь яку без перекомпіляції. А на скільки я розумію аналогічні проекти написані не на JAVA
Вам ліньки компілювати чи просто дати можливість іншим компілювати під різні системи, тому Ви хочете додати людям геморою щодо запуску Java на Linux? Цікава позиція.
Цитата: Fenenko від 2005-11-22 14:19:54От тільки Java є далеко не у всіх, та й у більшості дистрибутивів вона відсутня (через свою ліцензію) Тому й особливих переваг (крім проблем з запуском) такий підхід не дає...Зате gcc є всюди, а компілятор яви вже давно включений в gcc (починаючи з gcc-3.x).ЦитатаЯк такого готового алгоритму розпізнання немає. Я на даний момент, якраз працюю над алгоритмом розпізнавання. Алгоритм буде діяти так, растрове зображення букв переводити в вектори , і по співвідношенню векторів визначати символ. Тоді цей алгоритм працюватиме з дуже обмеженою кількістю символів.Простіше використати нейронні мережі для розпізнавання. І нові символи додавати значно легше. Ви ж не збираєтеся руками додавати пропорції для усіх символів з унікоду?Потрібно три системи розпізнавання - розпізнавання блоків (структури сторінки - заголовки, параграфи, списки, таблиці, ілюстрації, підписи, графіки, колонтитули, ремарки, etc.), нормалізація блоку та розпізнавання слів та інших елементів у блоці (слова, числа, пунктуаційні знаки, мітки, підкреслення/надкреслення/перекреслення, стиль тексту, розмір тексту, шрифт, межі малюнку, etc.), нормалізація та розпізнавання знаків.Бажано писати програму саме у такому порядку. (Колись писали програму для розпізнавання наклеєних баркодів на листку A4 - найважче, як виявилося, це знайти усі баркоди на сторінці й привести їх до нормального вигляду - саме розпізнавання реалізовувалося досить легко).PS.Допомогти нічим не зможу. :-(
От тільки Java є далеко не у всіх, та й у більшості дистрибутивів вона відсутня (через свою ліцензію) Тому й особливих переваг (крім проблем з запуском) такий підхід не дає...
Як такого готового алгоритму розпізнання немає. Я на даний момент, якраз працюю над алгоритмом розпізнавання. Алгоритм буде діяти так, растрове зображення букв переводити в вектори , і по співвідношенню векторів визначати символ.
PS.Допомогти нічим не зможу. :-(
Олександре, якщо хочете щось корисне зробити -- перекладіть (чи виправте) програму з тих, котрими користуєтеся. Напишіть чи покращіть документацію до неї. Допоможіть її користувачам-новачкам. Це буде краще.