БизнесЦензор

16.05.19 19:45

Google представила технологию синхронного перевода устной речи

Google представила Translatotron - технологию синхронного перевода устной речи, которая построена на системе перевода отличной от существующих.

google

Об этом компания сообщила в блоге, передает БизнесЦензор со ссылкой на AIN.

В Google отмечают, что современные технологии по переводу устной речи обычно состоят из трех этапов: распознавание текста → перевод текста → синтез текста в голос. Такая "каскадная" система хорошо себя зарекомендовала во многих продуктах, в том числе в Google Translate.

Google представила технологию, которая предлагает новый подход к переводу. Translatotron не выполняет этап расшифровки речи в текст и обратно. Вместо этого технология анализирует спектограмму источника и генерирует спектограмму на нужном языке. Кроме этого, такая система может сохранять интонацию и паузы оригинальной речи.

В Google выделяют несколько преимуществ Translatotron. Технология может быстрее совершать перевод (по сравнению с "каскадными" системами), избавляется от возможных ошибок при распознавании текста и может лучше справляться со словами, которые не нуждаются в переводе (например, названия и имена собственные).

Сейчас Translatotron выдает перевод хуже, чем системы с распознаванием текста, но в Google уверены, что создать рабочую технологию прямого перевода устной речи возможно: "Насколько нам известно, Translatotron - первая модель, которая может напрямую переводить речь с одного языка на речь на другом языке. Мы надеемся, что эта работа послужит отправной точкой для будущих исследований подобных систем".

Смотреть комментарии → ← Назад в рубрику