Что делает перевод речи уникальным — и как его понимание может преодолеть самые сложные языковые барьеры

Люди говорят не так, как пишут. Они также воспринимают устные разговоры иначе, чем чтение адреса электронной почты или статей. Наша способность понимать друг друга в момент разговора — объединяя все виды вербальной и невербальной коммуникации, чтобы мгновенно понять, что имеет в виду собеседник, — это сложный процесс человеческого самовыражения. Если отступить на шаг назад и подумать о том, что происходит во время разговора, то удивительно, как много информации передается за столь короткое время. 

Когда вы ставите перед собой задачу переводить устные диалоги в режиме реального времени, как это сделала DeepL с нашим новым решением DeepL Voice, вы открываете для себя множество интересных моментов, которые отличают перевод устной речи от перевода текста. В данной публикации я поделюсь некоторыми из этих идей и объясню, как мы используем их для преобразования опыта проведения встреч и бесед.

Проблемы перевода речи в режиме реального времени и способы их решения

Мгновенное общение в режиме диалога является неотъемлемой частью человеческой природы, и его чрезвычайно сложно воспроизвести с помощью технологий, даже таких передовых, как ИИ. Если вы стремитесь создавать решения для бизнеса, которые помогают людям следить за разговорами на нескольких языках и участвовать в них, вам необходимо начать с глубокого понимания связанных с этим задач.

Эти задачи включают в себя воспроизведение человеческой способности предвидеть, что люди скажут, еще до того, как они закончат говорить. При переводе речи в живых ситуациях также необходимо предвидеть, как слова собеседника могут быть наиболее точно выражены на другом языке. Однако, что особенно важно, необходимо сделать это до того, как вы точно узнаете, как закончится исходное предложение, чтобы избежать длительных задержек. Сложность заключается в том, что то, что кажется точным переводом нескольких слов, может оказаться неточным переводом, когда человек закончит свое предложение. 

Когда мы приступили к разработке DeepL Voice, мы понимали, что высококачественный перевод речи в реальном времени невозможно обеспечить с помощью одной только технологии. Это зависит от глубокого интереса к языку и понимания различных способов его функционирования. Поэтому мы собрали экспертов в области лингвистики, специализирующихся на устных разговорах, и использовали мощные возможности DeepL по контекстуальному пониманию того, как функционируют различные языки. Мы также сотрудничаем с предприятиями в качестве партнеров, чтобы изучить их приоритеты и опыт перевода речи, который создает для них наибольшую ценность.

Значительная разница, которую может сделать одна секунда

Одним из первых выводов, к которым мы пришли, является то, что при синхронном переводе встречи или разговора время имеет решающее значение. Если вы сможете приблизиться к скорости речи — отображать перевод предложения к моменту, когда говорящий его закончит, — то вы сможете значительно повлиять на то, насколько инклюзивными могут быть эти встречи. 

Как пояснила Кристин Обри, международный координатор глобального производителя кондитерских изделий Brioche Pasquier, в DeepL Dialogues, более быстрый перевод переключает людей из режима пассивного участия в режим активного. Вместо того, чтобы пытаться понять, что говорят другие на другом языке, они чувствуют себя в полной мере в курсе событий. Как носители языка, они имеют возможность вставлять замечания, формировать ход беседы и активно участвовать в ней. Секунда может иметь огромное значение.

Скорость, следовательно, является главным приоритетом при переводе речи в режиме реального времени. Однако скорость должна быть сбалансирована с другими приоритетами, которые также оказывают значительное влияние на опыт людей. Переводы должны быть максимально точными, чтобы избежать недоразумений и путаницы. По возможности, переводы должны минимизировать «мерцание», которое возникает, когда ранее переведенный текст необходимо исправить, потому что смысл изменился. Чем ниже частота этого мерцания, тем легче человеку естественно следить за разговором.

Как язык изменить, когда люди разговаривают, а не печатают

Для точного перевода устной речи важно понимать многочисленные различия между структурой письменного языка и ритмом речи. Например, манера речи людей гораздо более индивидуальна и менее последовательна, чем их манера письма. Они используют особые обороты речи и разговорные выражения, которые могут происходить как из региональных диалектов, так и из их индивидуальности или самооценки. Кроме того, люди строят и исправляют предложения во время речи, что приводит к неплавности речи, когда за одним грамматически неверным термином сразу следует другой, более правильный. Буквальное воспроизведение этих выражений в переводе не способствует пониманию их значения. 

В ходе разговоров люди также произносят короткие утвердительные звуки, такие как «ага», чтобы заверить собеседника в том, что они понимают или согласны с тем, что он говорит. Это способствует плавности разговора, но затрудняет перевод для тех, кто пытается следить за ним на другом языке. Рекомендуется исключить эти элементы языка из перевода.

Оптимизация для перевода в режиме реального времени

Задача становится еще более интересной, если учесть, что платформа для перевода в режиме реального времени не переводит полные предложения. Необходимо переводить предложение во время его произнесения, когда окончательный смысл этого предложения еще не ясен. Это требует от нас оптимизации переводов несколько иным способом. Мы стремимся не только к максимально точному переводу, но и к такому переводу, который будет достаточно гибким, чтобы включать новую информацию, которая может изменить смысл сказанного.

Вот пример: Представьте, что мы осуществляем перевод виртуальной встречи, в которой один из участников говорит на английском языке, а другой участник следит за его выступлением с помощью субтитров на немецком языке. Наш говорящий на английском собеседник прерывает разговор и говорит: «Я нашел это». Если мы предположим, что это полное предложение, то наиболее подходящим переводом на немецкий язык будет: «Ich habe es gefunden». Однако, поскольку это живая речь, мы не можем быть уверены, является ли предложение полным или нет.

В данном случае более подходящим вариантом может быть использование перевода «Ich fand es». Почему? Поскольку когда английский говорящий человек продолжает: «Я нашел это разочаровывающим», перевод «ich fand es» идеально подходит для простого добавления слова «frustrierend». Если бы первые три слова были переведены как «Ich habe es gefunden», то весь перевод потребовал бы пересмотра. Это тот тип значительных «перебоев», которые мешают интуитивно следить за разговором и которые DeepL стремится минимизировать, где это возможно.

Точный перевод речи в режиме реального времени предполагает широкий спектр контекстуальных оценок, которые наиболее эффективно осуществляются, когда технология опирается на человеческий опыт. Этот опыт включает в себя понимание того, где в разных языках обычно располагаются глаголы, которые имеют решающее значение для смысла предложения. Если они появляются в начале (как во французском и испанском языках), перевод можно отобразить быстрее, чем если бы они появлялись в конце. Все это способствует тому, что система делает паузу, достаточную для обеспечения точности, но не настолько длительную, чтобы неоправданно задерживать понимание.

Поиск оптимального решения через понимание особенностей языка

Сочетание лингвистической экспертизы и высокоточного перевода уже позволяет DeepL Voice значительно улучшить качество встреч и переговоров для международных компаний. Среди них — NEC Corporation, которая стала первой компанией, полностью внедрившей DeepL Voice. первой компанией, полностью устанавливающей DeepL Voice, всего через несколько недель после нашего официального запуска. 

Волнение вокруг DeepL Voice отражает тот факт, что это революционный момент в области перевода речи. Способность понимать и переводить то, что говорят люди, в то время как они это говорят, значительно увеличивает ценность, которую мы можем создать для международных компаний. Это преобразует способ взаимодействия команд, укрепляет отношения и обеспечивает постоянное учет различных идей и точек зрения. 

Достигнутые нами на данный момент успехи уже оказывают значительное влияние на работу организаций. Впереди еще много интересного!

Поделиться