Menu
CHIP Speedtest

Wikipedistům přibyl mocný pomocník z Indie

19.10.2010 11:53 | Redakce Chip
Wikipedistům přibyl mocný pomocník z Indie
Wikipedistům je nyní dostupný pokročilý překladový nástroj, který spojuje strojový překlad s lidskými úpravami spravovanými a šířenými skrze cloud­‑computing.

Navštěvujete‑li Wikipedii, pak víte, v jakém nepoměru je její obsah anglický k obsahu například českému a v mnoha dalších jazycích.

Tým vedený doktorem KumaranemMicrosoft Research India v tom viděl jedinečnou příležitost. Již čtyři a půl roku proto vyvíjí nástroj, který má wikipedistům zpřístupnit pomoc překladu strojového, ale umožnit jim dále jej upravovat. Jejich úpravy se přitom využijí ke zpřesňování překladu strojového. To sice není nic nového nebo neobvyklého svou podstatou — strojový překlad můžete zpřesnit i v Google Translate — ale proč byste měli? Avšak od poskytnutí dostatečně užitečného nástroje pro Wikipedii si tým slibuje přísun nezanedbatelného objemu přiměřeně redigovaných textů.

Projekt se původně jmenoval WikiBABEL, ale v tomto vtělení je nazván WikiBhasha. Čti to „wikibhášá“ („bhášá“ znamená v sanskrtu „mluva“). Po několika předchozích prototypech, z nichž první byl pouze textový a uměl jen porovnat dvě věty, je to první verze natolik dokonalá, že si získala podporu Wikimedia Foundation. Kromě toho ji Microsoft nezvykle uvolnil jako otevřený kód, jenž je již zanesen do kmene WikiMedia pod licencí Apache Licence 2.0.

Doktor Kumaran vkládá do projektu velké naděje.
Doktor Kumaran vkládá do projektu velké naděje.

WikiBhášá běží v prohlížeči, nad Wikipedií. Instaluje se buďto jako bookmarklet (aplikační záložka) — podporován je Firefox a Internet Explorer — anebo máte‑li na Wikipedii účet, můžete si ji zpřístupnit jako Wikipedia Gadget (uživatelský skript).

WikiBhášá je navržena tak, aby byla dostatečně snadná a intuitivní pro přispěvatele občasného, a přitom obsahuje funkce, které využijí činní a zkušení wikipedisté. Pracujete s ní tak, že vyberete zdrojový článek anebo více zdrojových článků v angličtině, pro ty se vám zobrazí překlad strojový, a z něj si můžete vybírat vhodné úryvky, dále je upravovat a přímo z WikiBháši snadno vkládat do Wikipedie; třeba i založit článek úplně nový.

Skutečnou lahůdkou je to, že přitom můžete využít i práce jiných, ježto lidské opravy se shromažďují v takzvaném oblaku, a to v Collaborative Translation Framework, který patří k Microsoft Translator. Ke každé označené strojově přeložené větě se vám zobrazí i lidmi vytvořené náhrady, pokud v oblaku jsou. Můžete některou z nich vybrat, popřípadě ji dále upravit.

WikiBhasha prozatím pracuje co se zdrojovým jazykem s angličtinou, avšak v budoucnu by mohla překládat například i z němčiny, španělštiny nebo japonštiny. Podporovaných jazyků cílových je nyní třicet — ty podporované Microsoft Translatorem — je mezi nimi i čeština a slovenština.

V následujících měsících budou Wikimedia Foundation a Microsoft Research pořádat společné semináře v Brazílii, v Egyptě, v Indii a v Mexiku, na kterých se budou snažit získat pro WikiBhášu místní wikipedisty.

Podle doktora Kumarana je pro užitečný strojový překlad mezi dvěma jazyky potřebí míti v nich srovnány proti sobě asi čtyři miliony vět. Pro mnoho jazyků světa je to úkol nadlidský. Doktor Kumaran doufá, že Pomocí WikiBháši se podaří posbírat alespoň část potřebných podkladů, a tak rozšířit dostupnost překladu strojového i zvýšit jeho spolehlivost.

Výzkumnice Aishwarya předvádí práci s WikiBhášou:

Zajímavosti ze světa IT v e-mailu

Stačí odeslat svoji e-mailovou adresu


Odesláním formuláře souhlasíte se zpracováním svých osobních údajů a užitím pro marketingové účely vydavatelství Burda Praha, spol. s.r.o.

Předplatné / nákup chipu Digitální edice chipu Aktuální vydání