#!/bin/shFILE=`ls dict????????_utf8.txt`DICT="dict.linux.org.ua"export LC_CTYPE=uk_UA.UTF-8export LC_COLLATE=uk_UA.UTF-8[ -d $DICT ] || mkdir $DICTgrep -vE "^#|^$" < $FILE | sed -r "s/\t*=\t*/\t/g" | python dictlin2dict.py $DICTtar cvfz dictlin-stardict-`date +%Y%M%d`.tgz $DICT
поки що виклав на сайті тимчасову версію для stardict, але є декілька проблем:* не шукаються слова з великих літер (треба бавитись з колатором, або, чого не хочеться, все переводити в нижній регістр)* не шукаються окремі слова (тобто без шаблонів шукається лише перше слово)* через перші дві не шукаються альтернативи та скорочення (типу "AC")* чомусь не показує джерела та стан* здається, щоб зробити гіперпосилання по див. треба інший формат словника...я спробую, як буде час, вдосконалити скрипт і зробити автоматичне оновлення stardict, але якщо хтось допоможе буду вдячний
На щастя мій варіант позбавлений згаданих Вами недоліків (спеціально перевірив).
тільки що нарешті стягнув Ваш варіант, але у Вашому словнику ті самі проблеми: в 2.4.8 не шукаються великі літери (в 3.0 з цим немає проблем в обидвох словниках), я пробував в 2.4.8 поставити колатор в unicode_utf8 але падає stardict...
але решта - це, я так розумію, так задумано, тобто типово stardict шукає лише з початку слова, тобто на "current" видасть лише сполуки, що починаються з "current", а щоб знайти "alternating current (AC)" треба набирати *current*, але скажімо *AC* навіть цього не дає (лише DAC), схоже, що зірка не любить дужки...не знаю, чи є легкий спосіб це обійти, ще буду шукати...якщо у Вас це працює по-інакшому, дайте, будь ласка, знати
P.S. проблема з Вашим підходом, що на сервері dict.linux.org.ua немає gcc, тобто правильно зібрати прогу буде дуже важко...
У мене 3.0... Мабуть доведеться відмовитися від legacy?
ЦитатаP.S. проблема з Вашим підходом, що на сервері dict.linux.org.ua немає gcc, тобто правильно зібрати прогу буде дуже важко...Вибачте, я не знав, буду пробувати щось інше. В принципі код не складний, спробую переписати на bash. Чи там і bash немає?
Я жахливо знаю пайтон (радше зовсім не знаю) /me пішов вчити пайтон...
та й той же пітон - такий собі спотворений С++ з (якогось біса) відступами для групування коду
якщо знаєте С++ то після цього всіляки Java, Python, Ruby не мусять вас лякати - це як українську писану транслітом читати
Цитата: DalekiyObriy від 2007-11-19 20:47:52Явна провокація флейму=)Off-topic:лише для тих, хто мови сприймає заблизько до серця, це як сперечатися, що краще лямпочка на 13Вт чи на 17 я на них дивлюся, як на засоби праці, а не улюблені іграшки, як приклад, пишу на всіх наведених мовах, окрім пітона, але як бачите взяв тулзу на ньому і хачу... а бурчати тому хто робить (на відміну від чистих флеймерів), думаю не забороняється ще й он людину примусив читати цю мову, так що це вже не провокація флейму, а чортічо щоправда відступ, як спосіб гуртування коду в мене викликає мурашки асемблеру БЕСМ, тому я таку ідею не дуже сприймающодо другого, то вміст був "С++ найскладніша мова з наведених", а не "найкраща", тобто не думаю, що хтось буде сперечатися, що знаючи С++ (на чому написана утиліта пана yurchor) прочитати код в 60 рядків на Python, майже половина з яких є виклики open, close та write на файлах не буде великою проблемою...P.S. чесно кажучи не думав, що в цю гілку хтось ще крім нас з yurchor ще заглядає
Явна провокація флейму=)
P.S. чесно кажучи не думав, що в цю гілку хтось ще крім нас з yurchor ще заглядає