Автор Гілка: Випробування з перекладу Татоеба  (Прочитано 459 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3474
  • Програміст
Tatoeba Translation Challenge — це реалістичне випробування для систем штучного перекладу, яке містить 555 мов та 2963 мовних пар, включно з українською мовою. Випробування складається з текстів зібраних з різних джерел, напр. Вікіпедії, а також тестів, по яких обчислюється якість перекладу. Для нас, інтерес становлять українська мова, пари мов з українською, та багатомовні перекладачі, які містять українську. Наразі, доступні натреновані нейронні мережі від Гельсінського університету, які показують досить високі результати по точності перекладу, до 75%. На сайті HuggingFace можна завантажити натреновані моделі та навіть спробувати перекладача.

Підказка: для багатомовних перекладачів потрібно вказувати ідентифікатор цільової мови по стандарту ISO, напр. ">>ukr<<".

Натреновані мережі з можливістю спробувати: https://huggingface.co/models?filter=uk
Випробування: https://github.com/Helsinki-NLP/Tatoeba-Challenge
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3474
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #1 : 2021-02-28 20:44:30 »
Скомпілював Марʼяна, але без підтримки GPU, ніби працює.

[vlisivka@apollo5 uk-en]$ ./decode.sh
вітаю, світе
 Welcome, world
У лісі, лісі темному, де бродить хитрий лис
 In the woods, in the dark forest, where the cunning fox wanders
росла собі ялинонька і зайчик з нею ріс
 growing a Christmas tree and a bunny with it grew
Ішов тим лісом дід мороз, червоний в нього ніс.
 It was freezing, red nose in that forest.
Він зайчика, стрибайчика у торбі нам приніс.
 He's a bunny, a jumper in a bag brought us.
О сірий, сірий зайчику, ходи, ходи до нас.
 O gray rabbit, walk, come to us.
Гляди - яка ялинонька стоїть серед прикрас.
 The view is what the Christmas tree is like in the midst of a jewel.

https://marian-nmt.github.io/
« Змінено: 2021-02-28 21:30:15 від Володимир Лісівка »
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3474
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #2 : 2021-02-28 21:21:17 »
Приклад перекладу з англійської на українську:

[vlisivka@apollo5 en-uk]$ ./decode.sh
If you're just getting started with Jekyll, you can use this repository as a starting point for your own site.
 Якщо ви тільки почали з Jekill, ви можете скористатися цим сховищем як початковим пунктом для вашого власного сайту.
The leaky homes crisis is an ongoing construction and legal crisis in New Zealand concerning timber-framed homes built from 1988 to 2004 that were not fully weather-tight.
 Криза з протіканням будинків - це постійна будівельна і юридична криза у Новій Зеландії щодо будинків з дерев'яними блоками, побудованих з 1988 по 2004 роки, які не були повністю захищені від погодних умов.
The finaliser must be assigned into a variable, otherwise it will be destroyed immediately, rather than when it goes out of scope.
 Кінцевий елемент слід призначати змінній, інакше його буде знищено негайно, а не за межами області.
[Fedora Linux]

Відсутній webnibbana

  • Новачок
  • *
  • дописів: 2
Re: Випробування з перекладу Татоеба
« Відповідей #3 : 2021-03-02 11:20:27 »
Крута фіча, дякую ;)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3474
  • Програміст
Re: Випробування з перекладу Татоеба
« Відповідей #4 : 2021-03-02 11:41:06 »
Крута фіча, дякую ;)

Але дуже чутлива до змін:

Цитата
Ішов тим лісом дід Мороз, червоний в нього ніс.
 He was walking through that forest by his grandfather Christmas, his red nose.
Ішов тим лісом дід мороз, червоний в нього ніс.
 It was freezing, red nose in that forest.
[Fedora Linux]