Автор Гілка: Злиття англійського і українського тезаурусів  (Прочитано 8796 раз)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Давно хотів зробити щось подібне, проте ніяк руки не доходили. На хуткоруч злив два словника воєдино, трохи повозився — і готово. Я об'єднав англійський і український, щоб їх не перемикати, бо наші й англійські літери в словах ніколи не трапляються разом. Для тих, хто не в курсі, тезаурус — це перевірка правопису для різноманітних програм, приміром, Firefox. Звідси можна його звантажити. Якщо будуть проблеми — повідомляйте тут же.

Зі специфікаціями всіляких aspell не розбирався, але якщо в когось є бажання допомогти — будь ласка. Можливо, пан DalekiyObriy якось це краще організує й прокоментує. Словники є всередині архіву. Долучити до форуму не зміг — надто великий.

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
щось мені не подобається цей шлях. не розумію, чому немає можливості одночасної перевірки орфографії в кількох мовах.
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
не розумію, чому немає можливості одночасної перевірки орфографії в кількох мовах.
Бо, приміром, якщо поєднувати російську й українську — самі розумієте, що доброго мало. Ґуґл нічого путнього не сказав на цю тему, тому прийшлось іти іншим шляхом. Як мінімум, зручно.

Можливо, комусь траплялось живі приклади одночасної перевірки правопису кількох мов? Мені ні.
« Змінено: 2009-11-29 17:10:06 від Re. »

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3636
  • Карма: +3/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
щось мені не подобається цей шлях. не розумію, чому немає можливості одночасної перевірки орфографії в кількох мовах.
У Kate (3.4 для KDE 4.4) вже реалізовано автоматичне визначення мови для перевірки правопису. Оскільки від компонента Kate залежать всі текстові редактори KDE, у KDE це реалізовано. Логічно припустити, що скоро буде реалізовано і у GNOME.

Сумніваюся, що окрім резюме у статтях десь широко вживається суміш декількох мов у одному документі. Але навіть так, якщо цього ще немає (боюся встановлювати бету), воно буде вже за півроку точно.
Try to reach you before winter comes
Always a place for you in my heart
You're not alone
All used up
I'd give anything to talk to you

Відсутній cadca

  • Письменник
  • *****
  • дописів: 955
  • Карма: +0/-0
  • free like beer
Можливо, комусь траплялось живі приклади одночасної перевірки правопису кількох мов?
Звідси:
Цитата
MySpell was started by Kevin Hendricks to integrate various open source spelling checkers into the OpenOffice.org build.
Цитата
MySpell is currently used by other programs:
AbiWord
Mozilla Thunderbird
Mozilla Firefox 2.0, and older versions with the SpellBound extension. Firefox 3.0 uses Hunspell instead of MySpell
Aegisub 2.0 can use a dictionary created for MySpell by adding AFF and DIC files to the Dictionary folder.

Aspell and Vim 7 can now use a dictionary created for MySpell.
Чи я вас неправильно зрозумів?
Ubuntu 20.04/18.04; CentOS 7.x

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
Цитата
У Kate (3.4 для KDE 4.4) вже реалізовано автоматичне визначення мови для перевірки правопису. Оскільки від компонента Kate залежать всі текстові редактори KDE, у KDE це реалізовано. Логічно припустити, що скоро буде реалізовано і у GNOME.
це теж не варіант. Я маю розкладку ua unicode, що визначає мову, як українську, але писати можу, наприклад, білоруською. А європейці всі встановлюють розкладку своєї мови — французьку, німецьку чи італійську, й зі зрозумілих причин англійською мовою теж пишуть в цій розкладці.

тому хотілося б просто мати можливість вручну позначати текст як суміш мов А, Б і Ц, і щоб спелчекер сам об’єднував словники.
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3636
  • Карма: +3/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Цитата
У Kate (3.4 для KDE 4.4) вже реалізовано автоматичне визначення мови для перевірки правопису. Оскільки від компонента Kate залежать всі текстові редактори KDE, у KDE це реалізовано. Логічно припустити, що скоро буде реалізовано і у GNOME.
це теж не варіант. Я маю розкладку ua unicode, що визначає мову, як українську, але писати можу, наприклад, білоруською. А європейці всі встановлюють розкладку своєї мови — французьку, німецьку чи італійську, й зі зрозумілих причин англійською мовою теж пишуть в цій розкладці.

тому хотілося б просто мати можливість вручну позначати текст як суміш мов А, Б і Ц, і щоб спелчекер сам об’єднував словники.
Воно визначає мову не за розкладкою клавіатури (це занадто тупо). Щодо позначення мов, здається, все це є у OO.o.
Try to reach you before winter comes
Always a place for you in my heart
You're not alone
All used up
I'd give anything to talk to you

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
У Kate (3.4 для KDE 4.4) вже реалізовано автоматичне визначення мови для перевірки правопису.
Це затишна штука, але коли півтексту українською, а інша англійською? Приміром, є книжки для вивчення чужоземних мов за методикою Іллі Франка — там чергуються речення двома мовами. Особисто я користуюсь лише українською і англійською перевіркою правопису, тому мені зручніше не перемикати. Гадаю, що тут чимало таких, як я.
Чи я вас неправильно зрозумів?
Ага, точно. Є таке, але там ти виділяєш текст і позначаєш якою мовою він написаний. Тобто це трохи не то, воно ж не перевіряє і ту мову, і іншу одночасно. Загалом, універсально рішення я не бачу. Тому запропонував цей.
« Змінено: 2009-11-29 19:56:47 від Re. »

Відсутній oleksa

  • Кореспондент
  • ***
  • дописів: 214
  • Карма: +0/-0
Стривайте, пане. Тезаурус та спелчекер - це дві різні речі, як кажуть в Одесі. У випадку перевірки правопису, не бачу ніц проблемного - на прикладі ООо вибираєте собі параграф, клацаєте мишею та обираєте внизу потрібну мову, головне, аби словники були в наявности, або у разі складних випадків через меню "Сервіс->Мова". У випадку тезаурусу (словник синонімів), то я ще не бачив у Лінуксі грамотної реалізації (можливо щось випустив, або то мені завше не потрібно було....).

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Тезаурус та спелчекер - це дві різні речі, як кажуть в Одесі.
Тезаурус — одномовний словник. Spell-checker — одномовний словник з правилами перевірки орфографії. Почитайте тут, можна й через перекладач прогнати, якщо з англійською не дуже.

Тут радше йдеться як про додаток до Firefox. Щодо OOo cadca і я вже писав.
« Змінено: 2009-12-02 23:25:58 від Re. »

Відсутній Campana

  • Письменник
  • *****
  • дописів: 795
  • Карма: +0/-0
  • Проходив мимо
Тезаурус та спелчекер - це дві різні речі, як кажуть в Одесі.
Тезаурус — одномовний словник. Spell-checker — одномовний словник з правилами перевірки орфографії. Почитайте тут, можна й через перекладач прогнати, якщо з англійською не дуже.
Ви хоч би самі почитали те, на що посилаєтеся.  >:( Тезаурус — це аж ніяк не "одномовний словник".

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Тезаурус — це аж ніяк не "одномовний словник".
Даруйте, а це що таке тоді? :o

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
У випадку тезаурусу (словник синонімів), то я ще не бачив у Лінуксі грамотної реалізації (можливо щось випустив, або то мені завше не потрібно було....).
не зовсім зрозумів, що таке «грамотна реалізація», але розширення українського словника для ООо має як орфографічний словник так і тезаурус, наповнення там може і не фантастичне але десь з десяток тисяч слів є
Fedora 35 (x86-64)