Informace o kvalifikační práci Hodnocení automatického překladu SMT systémů (Google translate, Bing) z francouzštiny do češtiny: kolokace z oblasti "odpadového hospodářství"
Tato bakalářská práce je zaměřena na hodnocení automatického překladu SMT systémů (Google Translate, Bing) z francouzštiny do češtiny: kolokace z oblasti "odpadového hospodářství".
Úvodní kapitola je věnována historii strojového překladu a jeho využití. Následně jsou popsány základní principy strojového překladu jako je pravidlový strojový překlad, statistický strojový překlad, hybridní strojový překlad a počítačem podporovaný strojový překlad. Dále jsou představeny online překladače Google Translate a Microsoft Bing Translator doplněné o konkrétní studie správnosti jejich automatických překladů.
Na základě nastíněné typologie vzniklých chyb jsou pak v praktické části hodnoceny evaluace těchto překladačů, které jsou předmětem analýzy této práce.
Anotace v angličtině
This bachelor thesis is focused on a Evaluation of SMT translation systems (Google Translate, Bing) from French to Czech: collocations related to "Waste management".
At first, the work describes a brief history of machine translation. Then the work describes the basic principles of machine translation like the rule-based machine transla-tion, the statistical machine translation, the hybrid machine translation and the by com-puter aided translation. The online translators GT and MB are introduced as well. These translators are completed by specific studies of correctness their evaluations.
The automatic translations of these tranlators are evaluated on the based of outlined typology of resulting mistakes. These automatic translations are the most important ob-ject of this bachelor thesis.
Tato bakalářská práce je zaměřena na hodnocení automatického překladu SMT systémů (Google Translate, Bing) z francouzštiny do češtiny: kolokace z oblasti "odpadového hospodářství".
Úvodní kapitola je věnována historii strojového překladu a jeho využití. Následně jsou popsány základní principy strojového překladu jako je pravidlový strojový překlad, statistický strojový překlad, hybridní strojový překlad a počítačem podporovaný strojový překlad. Dále jsou představeny online překladače Google Translate a Microsoft Bing Translator doplněné o konkrétní studie správnosti jejich automatických překladů.
Na základě nastíněné typologie vzniklých chyb jsou pak v praktické části hodnoceny evaluace těchto překladačů, které jsou předmětem analýzy této práce.
Anotace v angličtině
This bachelor thesis is focused on a Evaluation of SMT translation systems (Google Translate, Bing) from French to Czech: collocations related to "Waste management".
At first, the work describes a brief history of machine translation. Then the work describes the basic principles of machine translation like the rule-based machine transla-tion, the statistical machine translation, the hybrid machine translation and the by com-puter aided translation. The online translators GT and MB are introduced as well. These translators are completed by specific studies of correctness their evaluations.
The automatic translations of these tranlators are evaluated on the based of outlined typology of resulting mistakes. These automatic translations are the most important ob-ject of this bachelor thesis.
Diplomantka nejprve s využitím sekundární literatury charakterizuje principy strojového překladu a shrne současný stav i možnosti systémů založených na statistické analýze (SMT - statistical machine translation) v porovnání se systémy založenými na analýze jazykových pravidel (rule-based machine translation). Vzhledem k tomu, že SMT systémy jsou relativně úspěšnější při překládání víceslovných termínů, bude hlavním cílem její práce testovat a vyhodnotit úspěšnost překladu vybraných terminologických kolokací z oblasti "odpadové hospodářství" pomocí volně dostupných překladačů (Google translate, Bing). Kolokace pro analýzu bude autorka čerpat zejména ze vzorku a korpusu textů zpracovaných Lucií Papouškovou (2007). Pro hodnocení kvality překladů využije dostupné terminologické databáze (zejm. IATE) a stanoví si vhodná kritéria na základě sekundární literatury. Výstupy SMT systémů bude v případě potřeby sledovat i s ohledem na kontextualizaci vstupní kolokace.\\
Práce bude psána česky, součástí bude resumé ve francouzštině.\\
Zásady pro vypracování
Diplomantka nejprve s využitím sekundární literatury charakterizuje principy strojového překladu a shrne současný stav i možnosti systémů založených na statistické analýze (SMT - statistical machine translation) v porovnání se systémy založenými na analýze jazykových pravidel (rule-based machine translation). Vzhledem k tomu, že SMT systémy jsou relativně úspěšnější při překládání víceslovných termínů, bude hlavním cílem její práce testovat a vyhodnotit úspěšnost překladu vybraných terminologických kolokací z oblasti "odpadové hospodářství" pomocí volně dostupných překladačů (Google translate, Bing). Kolokace pro analýzu bude autorka čerpat zejména ze vzorku a korpusu textů zpracovaných Lucií Papouškovou (2007). Pro hodnocení kvality překladů využije dostupné terminologické databáze (zejm. IATE) a stanoví si vhodná kritéria na základě sekundární literatury. Výstupy SMT systémů bude v případě potřeby sledovat i s ohledem na kontextualizaci vstupní kolokace.\\
Práce bude psána česky, součástí bude resumé ve francouzštině.\\
Seznam doporučené literatury
Arnold D., et al., Machine Translation: An Introductory Guide. London: NCC Blackwell, 1994.\\
Flanagan M., Error Classification for MT Evaluation. In: Proceedings of AMTA, 1994, p. 65-72. .\\
Hanzl Jan, Power Relationships in the Translation Process - The "Acquis Communautaire" and its Translation into Czech prior to the Czech Republic's Accession to the EU. Folia Translatologica Vol. 10, Special Issue edited by Ivana Čeňková, 2008, s. 9-31.\\
Hutchins J. 2002. Machine translation and translation aids: systems, problems, uses, prospects. Università di Bologna, SSLMIT, Forl{\izpcarka}.\\
Koehn P., Monz Ch., Manual and Automatic Evaluation of Machine Translation between European Languages. Proceedings of the Workshop on Statistical Machine Translation, pages 102-121, New York City, June 2006. Online \\
Koehn P., Statistical machine translation, Cambridge, 2009.\\
Mikulík P., A Study of Selected Machine Translation Systems. FF MU Brno, diplomová práce, 2010.\\
Papoušková L., Francouzská a česká terminologie v evropských legislativních textech zaměřených na oblast: "Odpadové hospodářství a čisté technologie". České Budějovice, FF JU, bakalářská práce, 2007.\\
Radimský J., Dans quelle mesure est-il possible de traduire un terme juridique ? Etudes romanes de Brno, Sborník prací FF MU, L 25, Brno, 2004, s. 37-44.\\
Radimský J., La version tchèque du terme juridique européen: de quels critères disposons-nous pour juger de son adéquation? Etudes romanes de Brno, Sborník prací FF MU, L 29, Brno, 2008, s. 87-97.\\
Radimský J., Pour une étude de la norme dans les traductions du droit communautaire. In: Bochnakowa Anna et al. (sous la direction de): Norme, normativité, transgression. Oficyna Wydawnicza LEKSEM, Łask, 2007, p. 235-241.\\
Radimský J., Projet et construction d'un corpus des textes européens (CORTE). Etudes romanes de Brno, Sborník prací FF MU, L 28, Brno, 2007, s. 207-216.\\
Tomášek, M.: Překlad v právní praxi. Linde, Praha, 1998. (nebo Praha 2003 - 2. vyd.).\\
Vyhledání další sekundární literatury je součástí diplomního úkolu.\\
Seznam doporučené literatury
Arnold D., et al., Machine Translation: An Introductory Guide. London: NCC Blackwell, 1994.\\
Flanagan M., Error Classification for MT Evaluation. In: Proceedings of AMTA, 1994, p. 65-72. .\\
Hanzl Jan, Power Relationships in the Translation Process - The "Acquis Communautaire" and its Translation into Czech prior to the Czech Republic's Accession to the EU. Folia Translatologica Vol. 10, Special Issue edited by Ivana Čeňková, 2008, s. 9-31.\\
Hutchins J. 2002. Machine translation and translation aids: systems, problems, uses, prospects. Università di Bologna, SSLMIT, Forl{\izpcarka}.\\
Koehn P., Monz Ch., Manual and Automatic Evaluation of Machine Translation between European Languages. Proceedings of the Workshop on Statistical Machine Translation, pages 102-121, New York City, June 2006. Online \\
Koehn P., Statistical machine translation, Cambridge, 2009.\\
Mikulík P., A Study of Selected Machine Translation Systems. FF MU Brno, diplomová práce, 2010.\\
Papoušková L., Francouzská a česká terminologie v evropských legislativních textech zaměřených na oblast: "Odpadové hospodářství a čisté technologie". České Budějovice, FF JU, bakalářská práce, 2007.\\
Radimský J., Dans quelle mesure est-il possible de traduire un terme juridique ? Etudes romanes de Brno, Sborník prací FF MU, L 25, Brno, 2004, s. 37-44.\\
Radimský J., La version tchèque du terme juridique européen: de quels critères disposons-nous pour juger de son adéquation? Etudes romanes de Brno, Sborník prací FF MU, L 29, Brno, 2008, s. 87-97.\\
Radimský J., Pour une étude de la norme dans les traductions du droit communautaire. In: Bochnakowa Anna et al. (sous la direction de): Norme, normativité, transgression. Oficyna Wydawnicza LEKSEM, Łask, 2007, p. 235-241.\\
Radimský J., Projet et construction d'un corpus des textes européens (CORTE). Etudes romanes de Brno, Sborník prací FF MU, L 28, Brno, 2007, s. 207-216.\\
Tomášek, M.: Překlad v právní praxi. Linde, Praha, 1998. (nebo Praha 2003 - 2. vyd.).\\
Vyhledání další sekundární literatury je součástí diplomního úkolu.\\
Přílohy volně vložené
1 CD ROM
Přílohy vázané v práci
tabulky
Převzato z knihovny
Ano
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Diplomantka představila svou práci, použité metody a shrnula výsledky. Na diskusní připomínky oponentů a komise reagovala pertinentně a prokázala, že se v tématu své BP orientuje po teoretické i empirické stránce velmi dobře.