Автор Гілка: Випробування з перекладу Татоеба  (Прочитано 1743 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3739
  • Карма: +9/-0
  • Програміст
Tatoeba Translation Challenge — це реалістичне випробування для систем штучного перекладу, яке містить 555 мов та 2963 мовних пар, включно з українською мовою. Випробування складається з текстів зібраних з різних джерел, напр. Вікіпедії, а також тестів, по яких обчислюється якість перекладу. Для нас, інтерес становлять українська мова, пари мов з українською, та багатомовні перекладачі, які містять українську. Наразі, доступні натреновані нейронні мережі від Гельсінського університету, які показують досить високі результати по точності перекладу, до 75%. На сайті HuggingFace можна завантажити натреновані моделі та навіть спробувати перекладача.

Підказка: для багатомовних перекладачів потрібно вказувати ідентифікатор цільової мови по стандарту ISO, напр. ">>ukr<<".

Натреновані мережі з можливістю спробувати: https://huggingface.co/models?filter=uk
Випробування: https://github.com/Helsinki-NLP/Tatoeba-Challenge
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3739
  • Карма: +9/-0
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #1 : 2021-02-28 20:44:30 »
Скомпілював Марʼяна, але без підтримки GPU, ніби працює.

[vlisivka@apollo5 uk-en]$ ./decode.sh
вітаю, світе
 Welcome, world
У лісі, лісі темному, де бродить хитрий лис
 In the woods, in the dark forest, where the cunning fox wanders
росла собі ялинонька і зайчик з нею ріс
 growing a Christmas tree and a bunny with it grew
Ішов тим лісом дід мороз, червоний в нього ніс.
 It was freezing, red nose in that forest.
Він зайчика, стрибайчика у торбі нам приніс.
 He's a bunny, a jumper in a bag brought us.
О сірий, сірий зайчику, ходи, ходи до нас.
 O gray rabbit, walk, come to us.
Гляди - яка ялинонька стоїть серед прикрас.
 The view is what the Christmas tree is like in the midst of a jewel.

https://marian-nmt.github.io/
« Змінено: 2021-02-28 21:30:15 від Володимир Лісівка »
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3739
  • Карма: +9/-0
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #2 : 2021-02-28 21:21:17 »
Приклад перекладу з англійської на українську:

[vlisivka@apollo5 en-uk]$ ./decode.sh
If you're just getting started with Jekyll, you can use this repository as a starting point for your own site.
 Якщо ви тільки почали з Jekill, ви можете скористатися цим сховищем як початковим пунктом для вашого власного сайту.
The leaky homes crisis is an ongoing construction and legal crisis in New Zealand concerning timber-framed homes built from 1988 to 2004 that were not fully weather-tight.
 Криза з протіканням будинків - це постійна будівельна і юридична криза у Новій Зеландії щодо будинків з дерев'яними блоками, побудованих з 1988 по 2004 роки, які не були повністю захищені від погодних умов.
The finaliser must be assigned into a variable, otherwise it will be destroyed immediately, rather than when it goes out of scope.
 Кінцевий елемент слід призначати змінній, інакше його буде знищено негайно, а не за межами області.
[Fedora Linux]

Відсутній webnibbana

  • Новачок
  • *
  • дописів: 2
  • Карма: +0/-0
Re: Випробування з перекладу Татоеба
« Відповідей #3 : 2021-03-02 11:20:27 »
Крута фіча, дякую ;)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3739
  • Карма: +9/-0
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #4 : 2021-03-02 11:41:06 »
Крута фіча, дякую ;)

Але дуже чутлива до змін:

Цитата
Ішов тим лісом дід Мороз, червоний в нього ніс.
 He was walking through that forest by his grandfather Christmas, his red nose.
Ішов тим лісом дід мороз, червоний в нього ніс.
 It was freezing, red nose in that forest.
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3739
  • Карма: +9/-0
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #5 : 2021-03-09 13:48:21 »
Неприємно вразило те, що український перекладач деколи чудово розмовляє російською. Напевно в наборі текстів для тренування багато російських текстів.

Цитата
Agile methods are not opposed to documentation, only to valueless documentation.
 Агресивні методи не протистоять документації, а лише марній документації.
Documents that assist the team itself can have value, but only if they are kept up to date.
 Документы, которые помогают команде, могут быть ценными, но только если их держать до сих пор.
[Fedora Linux]