Post-editing, avagy a gépi fordítások utószerkesztése

A fordítási piacon egyre elterjedtebb gyakorlattá kezd válni a gépi fordítások ember által történő utószerkesztését magában foglaló post-editing módszere. Az utószerkesztés első hallásra gyors eredményt hozó, költséghatékony megoldásnak tűnhet, de számos rejtett kockázatot tartogat a megrendelőkre és a szolgáltatókra nézve is. Cikkünkben ezekre a veszélyekre szeretnénk felhívni a figyelmet.

A gépi fordítások minősége

A fordítandó szövegek mennyiségének növekedésével megnőtt az igény a fordítások sebességének és hatékonyságának növelésére. Ennek egyik módja a gépi fordítás alkalmazása, amelyre a gyenge minőség miatt korábban szinte mindenki rossz szemmel nézett, mára már viszont szakmai – köztük fordítóirodai – körökben is olyannyira terjed, hogy több ismert fordítástámogató szoftver is lehetőséget biztosít gépi fordítási bővítmények használatára. (Koponen, 2016)

A gépek által fordított szövegek az újfajta technológiát képviselő mesterséges neurális háló alkalmazásának köszönhetően az utóbbi időben jelentős javuláson estek át, és a természetesebbnek ható végeredmények fényében valószínűleg ez is lesz a gépi fordítási piac vezető stratégiája (Oliver, 2020). A neurális gépi fordítási szolgáltatások között is léteznek azonban minőségbeli különbségek, ahogyan azt az alábbi példa is jól szemlélteti:

Eredeti mondat: Post-editing machine translation has some inherent risks.

Első gépi fordítás: A gépi fordítás utáni szerkesztése bizonyos kockázatokkal jár.

A fordítás a stílus egyszerűsége és a forrásszöveg szerkezetéhez való ragaszkodás miatt természetellenesnek hat, az „utáni szerkesztése” rész értelmetlensége és az „inherent” szó feletti teljes átsiklás pedig súlyos hibának minősül.

Második gépi fordítás: A gépi fordítás utólagos szerkesztése magában hordoz bizonyos kockázatokat.

A fordítás a gördülékeny, értelmező stílusnak köszönhetően sokkal olvasmányosabbnak hat, az „utószerkesztés” helyett használt „utólagos szerkesztés” kifejezés pontatlansága miatt azonban továbbra is legfeljebb egy fogalmazni jól tudó, ám a terminológiai kutatómunkába kevés energiát fektető fordító mércéjét üti meg.

A gépi fordítás további hátránya, hogy még egy neurális hálót használó motor sem tudja a szövegkörnyezetet figyelembe venni (Oliver, 2020), így a gép nem ismeri fel azokat az eseteket sem, amikor az azonos alakú, ismétlődő mondatokat eltérően kell a célnyelvre ültetni. A „Close window” például folyószövegben fordulhat „Zárja be az ablakot!”, gombfeliratként pedig „Ablak bezárása” értelemben is.

Az utószerkesztés veszélyei

A fenti példából is látszik, hogy a technológia fejlődése ellenére a gépek által fordított szövegek többek között a szókincs változatosságának hiánya, az eredeti szövegfelépítést szorosan követő szerkezetek és az összkép figyelmen kívül hagyása (Oliver, 2020) miatt továbbra sem alkalmasak a széles közönség előtti megjelentetésre (Koponen, 2016). Aki használt már bármilyen jellegű automatizmust, tisztában van azzal, hogy a gépek önmagukban még ma sem tudnak az emberéhez hasonló minőséget produkálni: az automatikus helyesírás-ellenőrző tévesen javítja az SMS-ek szövegét, a karakterfelismerő szoftverek rosszul ismerik fel a szavakat, és szerkesztési hibákkal teszik tele a dokumentumokat, a beszédfelismerő alkalmazások pedig pontatlanul ültetik az emberi beszédet írásba.

Az ilyen jellegű hibák alól a gépi fordítás sem kivétel, mindenképpen szükség van tehát emberi beavatkozásra, vagyis a gépek által fordított szövegek nyelvi szakember által történő utószerkesztésére. Tekintve azonban, hogy a gépi fordítás továbbra sincs olyan szinten, hogy a forrásnyelvi szöveg jelentését megbízhatóan átadja (Koponen, 2016), nem elegendő egynyelvű utószerkesztés keretében csupán a célnyelvi változat nyelvtanát és stílusát megigazítani, szükség van arra is, hogy minden lefordított mondat tartalma össze legyen vetve az eredetiével. Vagyis Kevés különbség van tehát egy kifogásolható minőséget produkáló fordító munkájának lektorálása és a gépi fordítás utószerkesztése között.

Az utószerkesztés költséghatékony módszernek tűnhet, hiszen a gördülékenységre és a természetességre törekvő emberi fordítással szemben a célja csupán az előre generált tartalmak elfogadhatóvá tétele. Figyelembe kell venni azonban azt is, hogy egyes mondatok gépi fordítása sokszor annyira félresikerül, hogy egyszerűbb őket teljesen újrafordítani (Teixeira, 2015), mint az automatikusan felkínált megoldást a forrásnyelvi szöveg értelméhez közelíteni, ahogyan azt az alábbi mondat gépi és emberi fordítása is jól példázza:

Eredeti mondat: He had his ducks in a row before his retirement.

Gépi fordítás: Nyugdíjazása előtt sorban voltak a kacsái.

A gép nyelvtanilag helyes, ámde értelmetlen, szó szerinti fordítást adott. Ennek oka valószínűleg az, hogy az adatbázisában kevés idióma szerepel, amelyből könnyen felismerhetné a mondatok másodlagos értelmét.

Emberi fordítás: Rendezte sorait, mielőtt nyugdíjba vonult volna.

Az emberi fordító tisztában van az angolszász nyelvekben használatos szófordulatokkal, ezért annak ellenére is tudott a célközönség kultúrájába gördülékenyen illeszkedő, értelmező fordítást készíteni, hogy az eredeti mondatban olvasható idiómának nem feltétlenül létezik egy az egyben megfeleltethető célnyelvi párja.

Az utószerkesztők tehát alacsonyabb áron végzik gyakorlatilag ugyanazt a munkát, mint az ilyen jellegű automatizmust nem használó fordítók. Az utószerkesztés folyamatából ráadásul kiveszik a jó fordítót a még jobb fordítótól megkülönböztető tényező, az egyéniség, a nyelvi szakemberek ugyanis kénytelenek a gépi fordítás különféle forrásokból összekombinált eredményére hagyatkozni (Oliver, 2020), és ügyelniük kell arra is, hogy a jelentős átdolgozást igénylő mondatok stílusa illeszkedjen a szöveg többi részéhez.

Ahhoz, hogy az utószerkesztés minél kevesebb energiabefektetéssel, minél gyorsabban produkáljon megfelelő minőségű eredményt, fontos, hogy az eredeti szöveg elérhető legyen a gép által feldolgozható formában (Tirosh, 2018), valamint hogy az adott nyelvpárban és szakterületen legyen elegendő párhuzamos szöveg, amelyből a gép táplálkozni tud. Ez jellemzően nagy nyelvek között és gyakran ismétlődő szerkezeteket tartalmazó, például jogi és műszaki szövegek esetén lehetséges. Kisebb nyelvek és kevésbé kötött fordulatokkal tarkított vagy nem anyanyelvi író által megfogalmazott szövegek esetén a gépi fordításból sokszor annyi munkát igényelne emberi fogyasztásra alkalmas tartalmat létrehozni, hogy költséghatékonyabb lenne a fordítást gép alkalmazása nélkül teljes egészében egy tapasztalt szakfordítóra bízni.

Post-editing helyett válassza inkább megbízható szakfordítási szolgáltatásainkat – Önnek is jobban megéri, végeredményként pedig egy igényes, minden tekintetben az Ön igényeihez igazított szöveget fog kézhez kapni!

Felhasznált szakirodalom

Koponen, M. (2016). Is machine translation post-editing worth the effort? A survey of research into post-editing and effort. The Journal of Specialised Translation, (25), 131–148.

Oliver, A. (2020). Human translation and machine translation. Specificities, uses, advantages and disadvantages. Linguapax Review 8. 111–129.

Teixeira, A. (2015. 03. 31.). I Don’t Offer Machine Translation Post-Editing Services, Here Is Why. Letöltés dátuma: 2019. 09. 29., forrás: Anthony Teixeira – Professional French Translator: https://www.at-it-translator.com/i-dont-offer-machine-translation-post-editing-here-is-why/

Tirosh, O. (2018. 08. 30.). Post-editing machine translation – all you need to know. Letöltés dátuma: 2021. 09. 24., forrás: Tomedes: https://www.tomedes.com/business-center/post-editing-machine-translation-need-to-know

hu_HUMagyar