DAVID MATUŠKA: UŠETŘÍME STÁTU MILIONY ZA PŘEKLADY A MŮŽEME PORAZIT I GOOGLE
Zapojováním Česka do evropských struktur roste potřeba písemné komunikace a znalosti cizích jazyků. Řešením mohou být automatické překlady, jako je například Google. Existuje však skupina českých expertů, kteří se podílejí na vývoji jiného překladatelského systému Euromatrix, jehož vznik platí Evropská unie. Roční rozpočet takového týmu činí desítky milionů korun. Jedním ze zástupců je David Matuška ze společnosti CEET. Hovořil také o tom, proč takový systém vzniká, pro koho je určen a zda se za něj bude platit.
* E15: Má takový systém uplatnění?
Evropská unie utrácí ročně až 1,3 miliardy eur (zhruba jedno procento z rozpočtu) za překlady a tlumočení zákonů, předpisů, nařízení, směrnic a projevů, zaměstnává tisíce překladatelů. Většina textů nebo jejich velkých částí se přitom neustále opakuje, což je pro strojový překlad ideální. Nejedná se o překlady beletrie či marketingových textů, za těmi bude zřejmě vždycky stát překladatel - spisovatel nebo kreativec. Evropské unii ale může strojový překlad přinést úspory v desítkách milionů eur ročně jen za překlady. Pokud by EU dále investovala do rozpoznávání mluveného slova (voice recognition), tak by v propojení se strojovým překladem mohla úspora činit dokonce 60 až 70 procent celkového rozpočtu na překlady.
* E15: Je Euromatrix určen pouze pro komerční užití?
Euromatrix plus je určen jak pro veřejnost a orgány EU, tak pro komerční společnosti. Jeho použití bude zdarma.
* E15: Kdo platí jeho vývoj?
Celkově bude projekt Euromatrix plus stát zhruba pět milionů eur, z toho 3,8 milionu eur „platí" Evropská komise, zhruba 1,1 milionu jde z rozpočtu výzkumných institucí, respektive z národních dotačních programů, a zhruba 60 tisíc eur investuje společnost CEET z vlastních zdrojů.
* E15: Proč jste se do projektu zapojili?
Strojový překlad ve spojení s překlady podporovanými počítačem (CAT překlady) a následnou „lidskou" korekturou je budoucnost překladatelského oboru. Z překladatelů se časem stanou spíše korektoři, vše ostatní bude řešit počítač. Je nezbytné být u vývoje a výzkumu těchto nových technologií, jinak by nám velmi snadno ujel vlak.
* E15: Je největším konkurentem Euromatrixu Google a lze ho porazit?
Systém Google pracuje výhradně na základě statistického modelu, kdy se do něj denně vkládají tisíce slov. On pak vyhodnocuje četnost a podle toho „překládá". Bohužel jen dvě až tři procenta těchto překladů jsou stoprocentně kvalitní. Euromatrix je ale hybridním modelem překladače, ke statistice přidává lingvistiku, a tím se kvalitativně dostává o několik kategorií výše.
* E15: Kdy by mohl být systém Euromatrix v provozu?
Záleží především na vůli a ochotě zodpovědných pracovníků překladatelských sekcí Evropské komise. Už nyní se částečně používá v portugalské překladatelské sekci. Troufám si tvrdit, že pokud Evropská komise rozhodne o používání strojových překladů, mohla by zhruba za pět let začít spořit desítky milionů eur ročně. Investice do projektu Euromatrix plus by se tak měla vrátit již po prvním roce aktivního používání. Už teď by ale měla Evropská komise trvat na důsledném používání překladů podporovaných počítačem - takzvaných CAT tools (Computer Aided Translation), které již překladatelské agentury běžně používají. Rozpočet EU na překlady by s nimi mohl okamžitě klesnout o 15 až 20 procent, což je asi až 50 milionů eur za rok.
* E15: Jaká bude dokonalost či věrohodnost Euromatrixu?
Kvalita překladů provedených přes hybridní strojový překlad bude stále dokonalejší. Pro uživatele bude rozhodující vědět, kolik následné práce (času, peněz) bude třeba, aby byl strojový překlad doladěn lidským korektorem. V budoucnu bychom se mohli dostat zhruba na čtvrtinu současných nákladů a čtvrtinu času. Takže když nyní trvá 100 stran přeložit a zkorigovat zhruba 13 až 14 dnů, budeme při použití strojových překladů s „lidskou" korekturou potřebovat jen tři až čtyři dny.
* E15: Jak se vůbec Češi dostanou k takovému projektu?
Musíte se o obor zajímat a musí o vás vědět vědecká veřejnost, CEET v této pozici je. Navíc v Praze už několik let úspěšně funguje Ústav formální a aplikované lingvistiky na Matematickofyzikální fakultě Univerzity Karlovy.
* E15: Co Euromatrix může přinést Česku?
Kromě prestiže na poli strojových překladů zejména úspory na překladech všech státních institucí. Při důsledném používání se může jednat o miliony až desítky milionů korun ročně.
* E15: V kolika jazycích by měl Euromatrix fungovat?
Měl by pokrýt všech 22 oficiálních jazyků EU, tedy 462 kombinací, a pokud přidáme arabštinu a čínštinu, dosáhneme rovných 506 kombinací.
***
David Matuška (35) Vystudoval matematiku a zeměpis na Pedagogické fakultě J. E. Purkyně v Ústí nad Labem. Již během studií pracoval pro společnost Skřivánek, kde se později stal generálním ředitelem. Ve „Skřivánku" působil devět let (1996-2005). Od roku 2005 je ředitelem a jednatelem společnosti CEET, kterou spoluvlastní. Volný čas věnuje rodině, rekonstrukci rodinného sídla v Býčkovicích u Litoměřic a také basketbalu. Hraje golf a má rád kvalitní víno. Je ženatý, má tři děti.
E15 Vít Chalupa 27.11.2009
