Сегодня хорошо оцифрованы самые распространенные языки в мире, при этом 20% людей являются носителями, и используют как основной языки, с которыми не работают онлайн-переводчики. Часть этих языков них не имеют стандартизированного письма, а у части отсутствуют легкодоступные корпусы письменного текста. При отсутствии стандартизации и четкого языкового строя, представляется затруднительным прописать алгоритмы перевода и обучить «машину».
В Meta планируют использовать подход под названием No Language Left Behind, благодаря которому ИИ учится переводить, используя меньше обучающих примеров. Второй подход Universal Speech Translator предполагает разработку систем, которые переводят устную речь в устную, минуя, таким образом, «промежуточный» этап переложения устной речь в письменную, как сейчас делают все онлайн-переводчики.
Ранее мы писали о том, что компания «Яндекс» продемонстрировала прототип голосового переводчика видео, основанного на технологии распознавания речи, биометрии и машинном переводе.