DeepL запускает голосовой перевод в реальном времени: как это работает в Zoom и Teams
DeepL представил синхронный ИИ-перевод живой речи (фото: Getty Images)
Компания DeepL официально представила DeepL Voice - систему синхронного перевода речи. Теперь пользователи смогут общаться в Zoom или Microsoft Teams, слыша перевод в реальном времени или читая субтитры на экране.
Об этом информирует РБК-Украина со ссылкой на материал TechCrunch.
DeepL Voice предлагает два основных сценария использования, которые закрывают потребности как офисных работников, так и сервисного персонала:
- Для онлайн-конференций - интеграция в крупные платформы позволяет участникам слышать перевод прямо в наушниках. Это делает международные совещания такими же простыми, как и коммуникация на родном языке.
- Для живого общения - мобильное приложение позволяет переводить разговоры тет-а-тет. С помощью QR-кода к сессиям перевода могут присоединиться целые группы. Разработчики отмечают: это идеально подходит для воркшопов и лекций.
Технические преимущества
Главным вызовом для разработчиков стал баланс между качеством перевода и отсутствием задержек (latency). Именно поэтому внедрены функции:
- Контекстного интеллекта - в отличие от простых переводчиков, DeepL Voice распознает отраслевой сленг, специфические названия брендов и имена.
- Будущее без текста - сейчас система работает по схеме "голос - текст - перевод - голос", однако разработчики уже тестируют прямую модель, которая исключит текстовый этап для еще большей скорости.
Новые возможности для бизнеса и разработчиков
DeepL открывает API для сторонних компаний, что позволит внедрять голосовой перевод в любые сервисы - от программ для колл-центров до систем поддержки клиентов.
"ИИ-слой перевода поможет брендам работать на рынках, где сложно найти персонал со знанием редких языков", - отметил СЕО компании Ярек Кутиловский.
На данный момент сервис находится на стадии раннего доступа. Компании могут подать заявку на участие в тестировании через официальный сайт разработчика.