+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новини

Mozilla в рамках проекту Bergamot розпочала створення системи машинного перекладу

Mozilla в рамках проекту Bergamot приступила до створення системи машинного перекладу

Mozilla в рамках проекту Bergamot приступила до створення системи машинного перекладу, що працює на стороні браузера. Проект дозволить інтегрувати в Firefox самодостатній движок перекладу сторінок, який не звертається до зовнішніх хмарних сервісів і обробляє дані виключно на системі користувача. Головною метою розробки є забезпечення конфіденційності та захист даних користувача від можливих витоків при перекладі вмісту сторінок, що відкриваються в браузері.

Розробка Bergamot ведеться в берлінському офісі Mozilla за участю дослідників з кількох університетів Великобританії, Естонії та Чехії. Розробку фінансує Євросоюз у рамках гранту, отриманого за програмою Horіzon 2020. Розмір гранту становить три мільйони євро. Проект розрахований на три роки. У Mozilla відкрито вакансія фахівця з систем машинного навчання для участі в розробці движка для перекладу з однієї мови на іншу.

З суміжних розробок, що стосуються проекту Bergamot, згадані:

  • Фреймворк машинного перекладу, що розвивається в Единбурзькому університеті Marian, побудований на базі рекурентної нейронної мережі. Фреймворк написаний мовою C++, може задіяти GPU для прискорення навчання та перекладу, і постачається під ліцензією MIT.
  • Створений у Празькому університеті інструментарій Neural Monkey для обробки інформації природною мовою з використанням методів послідовного машинного навчання. Проект застосовує фреймворк TensorFlow та може використовуватись для швидкого створення прототипів систем машинного перекладу та класифікації інформації на природною мовою. Код доступний під ліцензією BSD.
  • Підготовлений в Шефілдському університеті проект QuEst++, який застосовується для оцінки та прогнозування якості систем машинного перекладу.
  • Розвиваються в Mozilla синтезатор мови (TTS) і движок розпізнавання промови (Deep Speech)
  • Фінансований Євросоюзом проект ParaCrawl, що накопичує базу синхронних перекладів різних фраз різними мовами, яку можна використовувати для тренування систем машинного навчання. Основою проекту є бот bitextor, який індексує багатомовні web-сайти і автоматично знаходить однакові тексти, представлені кількома мовами. База прикладів паралельних перекладів формується для 24 мов, у тому числі для російської (БД для російської мови займає 637MB у стислому вигляді і включає більше 12 млн прикладів перекладу).

Розробка Bergamot почалася в січні цього року, але напрацювання проекту поки що недоступні для публічного тестування. Проте кілька днів тому розробники опублікували відео з демонстрацією початкового прототипу.

Інші новини

Найкраща ціна