Sözlü çeviriyi benzersiz kılan nedir ve bunu anlamak en zorlu dil engellerini nasıl aşabilir?

İnsanlar yazdıkları gibi konuşmazlar. Ayrıca, e-posta veya makale okurken yaşadıkları deneyimi, konuşma sırasında da aynı şekilde yaşamazlar. Konuşurken birbirimizi anlama yeteneğimiz — her türlü sözlü ve sözsüz iletişimi bir araya getirerek birinin ne demek istediğini anında kavramak — insan ifadesinin en zorlu kısmıdır. Bir adım geriye gidip bir konuşmada neler olduğunu düşündüğünüzde, bu kadar kısa sürede bu kadar çok bilginin aktarılması gerçekten şaşırtıcıdır.
DeepL'in yeni DeepL Voice çözümünde yaptığı gibi, konuşulan etkileşimleri anında çevirme görevini üstlendiğinizde yeni DeepL Voice çözümünde, konuşulan dili çevirmenin metin çeviriden farklı kılan unsurlar hakkında her türlü ilginç bilgiyi ortaya çıkarırsınız. Bu yazıda, bu içgörülerden bazılarını paylaşacağım ve bunları toplantı ve görüşme deneyimini dönüştürmek için nasıl kullandığımızı açıklayacağım.
Gerçek zamanlı konuşmayı çevirmenin zorlukları ve bunları nasıl aştığımız
Anlık, konuşma tarzı iletişim temelde insana özgüdür ve teknolojinin bunu taklit etmesi son derece zordur — yapay zeka gibi gelişmiş bir teknoloji bile. İnsanların birden fazla dilde yapılan konuşmaları takip etmelerine ve bunlara katılmalarına yardımcı olacak iş çözümleri oluşturmak istiyorsanız, öncelikle bu alandaki zorlukları derinlemesine anlamanız gerekir.
Bu zorluklar arasında, insanlar sözlerini bitirmeden önce ne söyleyeceklerini tahmin etme becerisini taklit etmek de yer almaktadır. Canlı durumlarda konuşmayı çevirirken, bir kişinin sözlerinin başka bir dilde en iyi nasıl ifade edilebileceğini de öngörmeniz gerekir. Ancak, uzun gecikmeleri önlemek için, orijinal cümlenin nasıl biteceğini kesin olarak bilmeden önce bunu yapmanız çok önemlidir. Buradaki zorluk, birkaç kelimenin doğru çevirisi gibi görünen şeyin, bireysel cümlesini tamamladığında yanlış bir çeviri olarak ortaya çıkabilmesidir.
DeepL Voice'u geliştirmeye başladığımızda, yüksek kaliteli canlı konuşma çevirisinin yalnızca teknolojiyle gerçekleştirilemeyeceğini biliyorduk. Bu, dilin işleyişine olan derin ilgiye ve farklı işleyiş biçimlerine olan anlayışa bağlıdır. Bu nedenle, konuşma diline uygulanan dilbilim uzmanlarını bir araya getirdik ve DeepL'in farklı dillerin nasıl işlediğine dair güçlü bağlamsal anlayışından yararlandık. Ayrıca, işletmelerle iş ortağı olarak, onların önceliklerini ve kendileri için en fazla değer yaratan sözlü çeviri deneyimini araştırdık.
Bir saniyenin yaratabileceği büyük fark
Öğrendiğimiz ilk bilgilerden biri, bir toplantı veya konuşmanın gerçek zamanlı çevirisi söz konusu olduğunda zamanlamanın her şey olduğu. Konuşma hızına yakın bir hız elde edebilirseniz (konuşmacı cümleyi bitirene kadar çevirisini görüntüleyebilirseniz), bu toplantıların ne kadar kapsayıcı olabileceğini büyük ölçüde etkileyebilirsiniz.
Küresel pastacılık üreticisi Brioche Pasquier'in uluslararası koordinatörü Christine Aubry'nin DeepL Dialogues'da, daha hızlı çeviriler insanların pasif katılım modunu aktif katılım moduna geçiriyor. Başkalarının başka bir dilde söylediklerini anlamaya çalışmak yerine, tamamen aynı hızda olduklarını hissederler. Bir dil konuşan bir kişi gibi, araya girme, konuşmayı şekillendirme ve aktif olarak katılma fırsatına sahiptirler. Bir saniye kadar bir süre büyük bir fark yaratır.
Bu nedenle, gerçek zamanlı konuşmayı çevirirken hız en önemli önceliktir. Ancak hız, insanların deneyimlerini büyük ölçüde etkileyen diğer önceliklerle dengelenmelidir. Yanlış anlaşılmaları ve karışıklıkları önlemek için çeviriler mümkün olduğunca doğru olmalıdır. Ve mümkün olduğunda, çeviriler, anlamın değiştirilmesi nedeniyle önceden çevrilmiş metnin düzeltilmesi gerektiğinde ortaya çıkan "titremeyi" en aza indirmelidir. Bu titreme oranı ne kadar düşükse, bir kişinin konuşmayı doğal bir şekilde takip etmesi o kadar kolay olur.
İnsanlar yazarken değil, konuşurken dil nasıl değiştirir?
Canlı konuşmayı doğru bir şekilde çevirmek için, yazılı dilin kalıpları ile konuşma ritimleri arasındaki birçok farkı anlamak önemlidir. Örneğin, insanların konuşma şekli, yazma şekillerinden çok daha bireysel ve tutarsızdır. Onlar, hem bölgesel lehçelerden hem de kendi kişiliklerinden veya öz imajlarından kaynaklanabilecek farklı deyimler ve konuşma dilinde kullanılan ifadeler kullanırlar. Ayrıca, insanlar konuşurken cümleleri kurar ve düzeltir, bu da gramer açısından yanlış bir terimin hemen ardından daha doğru bir terimin gelmesiyle akıcılık bozukluğuna yol açar. Bunları çeviride kelimesi kelimesine yeniden üretmek, anlamını anlamaya çalışan birine yardımcı olmaz.
Konuşmalar boyunca insanlar, konuşmacılara söylediklerini anladıklarını veya onayladıklarını belirtmek için "uh-huh" gibi kısa onaylamalar da söylerler. Bunlar konuşmanın akışına yardımcı olur, ancak başka bir dilde takip etmeye çalışan kişiler için çevirileri karmaşık hale getirir. Çeviride konuşulan dilin bu unsurlarını filtrelemek yararlıdır.
Gerçek zamanlı çeviri için optimizasyon
Gerçek zamanlı çeviri platformunun tam cümleleri çevirmediğini düşünürsek, bu zorluk daha da ilginç hale geliyor. Cümle söylenirken, cümlenin nihai anlamı henüz netleşmemişken çevrilmesi gerekir. Bu, çevirileri biraz farklı bir şekilde optimize etmemizi gerektirir. Sadece en doğru çeviriyi değil, söylenenlerin yönünü değiştirebilecek yeni bilgileri de içerecek kadar esnek olan doğru bir çeviri istiyoruz.
İşte bir örnek: Katılımcılardan birinin İngilizce konuştuğu ve diğer katılımcılardan birinin söylediklerini Almanca altyazılarla takip ettiği sanal bir toplantıyı çevirdiğimizi hayal edin. İngilizce konuşan arkadaşımız konuşmayı keserek, "Buldum" der. Şimdi, bunun tam bir cümle olduğunu varsayarsak, en iyi Almanca çevirisi "Ich habe es gefunden" olur. Ancak, bu canlı bir konuşma olduğu için cümlenin tamamlanmış olup olmadığından emin olamayız.
Bu durumda daha iyi bir seçenek, bunun yerine "Ich fand es" gibi bir çeviri kullanmak olabilir. Neden? Çünkü İngilizce konuşan kişi "I found it frustrating" (Bunu sinir bozucu buldum) dediğinde, "ich fand es" çevirisi "frustrierend" kelimesini eklemek için mükemmel bir konumdadır. İlk üç kelime "Ich habe es gefunden" olarak çevrilirse, çevirinin tamamı revize edilmelidir. Bu, bir konuşmayı sezgisel olarak takip etmeyi engelleyen ve DeepL'in mümkün olduğunca en aza indirgemeyi amaçladığı türden önemli bir "titreme"dir.
Doğru, gerçek zamanlı sözlü çeviri, teknolojinin insan uzmanlığı tarafından yönlendirildiğinde en iyi şekilde yapılabilen çok çeşitli bağlamsal yargıları içerir. Bu uzmanlık, farklı dillerin cümlenin anlamı için çok önemli olan fiilleri genellikle nereye yerleştirdiklerine dair içgörüler de içerir. Başlangıçta gelirlerse (Fransızca ve İspanyolca'da olduğu gibi), sonda geldiklerinden daha hızlı bir şekilde çeviriyi görüntülemek mümkündür. Tüm bunlar, sistemin doğru sonuçlar elde etmek için yeterli süre kadar duraklamasına yardımcı olur, ancak gereksiz yere anlamayı geciktirecek kadar uzun sürmez.
Dilin özgü anlayışla ideal noktayı bulmak
İnsan dilbilimi uzmanlığı ile yüksek doğrulukta çevirinin bu birleşimi, DeepL Voice for Meetings ve DeepL Voice for Conversations'un uluslararası işletmelerin toplantı ve görüşme deneyimlerinde büyük bir fark yaratmasını sağlıyor. Bunlar arasında, DeepL Voice'u tam olarak kullanan ilk şirket olan NEC Corporation da bulunmaktadır. DeepL Voice'u tam olarak kullanan ilk şirket olan birkaç hafta sonra DeepL Voice'u tam olarak kullanmaya başlayan ilk şirket oldu.
DeepL Voice etrafındaki heyecan, bunun sözlü çeviri için çığır açan bir an olduğunu yansıtıyor. İnsanların söylediklerini, söyledikleri anda çözme ve çevirme yeteneği, uluslararası işletmeler için yaratabileceğimiz değeri kat kat artırır. Ekimlerin işbirliği yapma şeklini dönüştürür, daha güçlü ilişkiler kurar ve farklı fikir ve bakış açılarının her zaman dahil edilmesini sağlar.
Şimdiye kadar kaydettiğimiz ilerlemeler, kuruluşların çalışma şekillerinde şimdiden büyük bir fark yaratıyor. Daha çok şey var!