Vyučující
|
-
Radimský Jan, prof. PhDr. Ph.D.
-
Šmídová Markéta, Mgr. Ph.D.
|
Obsah předmětu
|
1. Korpusová lingvistika, korpus, typy korpusů, technické otázky a metodologická východiska. Přístup corpus driven a corpus based. Metodologie jazykovědného výzkumu, validita, reliabilita. 2. Historie korpusové lingvistiky, typologie korpusů podle různých hledisek. 3. Reprezentativnost korpusu; pojem reprezentativnosti jazykových dat. 4. Základní statistika v korpusu: četnost (frekvence) absolutní a relativní, srovnání četnosti. Měření souvýskytu (MI-score, T-score). Pojem "kolokace". Tzv. "statistické" a "funkční" pojetí kolokací. 5. Český národní korpus, složení, možnosti výzkumu, využití pro překladatelskou praxi. Paralelní korpus Intercorp. 6. Vybrané národní korpusy (francouzština: Frantext, SketchEngine, Le Monde; italština: La Repubblica, CORIS/CODIS, ITWAC; španělština: CRAE, Ancora, Coser, Cluvi). 7. Anotace korpusu a její typy. Vyhledávání v korpusu, komplikovanější CQL dotazy, zpracování výstupů - práce s frekvenčními seznamy. 8. Aplikované problémy komputační lingvistiky: information retrieval, information extraction, question answering, text summarization, term extraction. 9. Strojový překlad - systémy založené na pravidlech (rule-based) a na statistice (statistical machine translation), hybridní systémy. Principy fungování, možnosti a meze strojového překladu, evaluace chyb. 10. Řešení konkrétních problémů s pomocí korpusu a nástrojů strojového překladu.
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž), Demonstrace, Aktivizující (simulace, hry, dramatizace)
|
Výstupy z učení
|
Předmět seznamuje studenty se základními pojmy, metodami a problémy korpusové a komputační lingvistiky a s možnostmi, které tato disciplína nabízí pro řešení aplikovaných jazykovědných otázek, zejména s ohledem na překlad textu v přirozeném jazyce.
Studenti budou schopni pracovat s textovým korpusem, vyhledávat v něm pomocí regulárních výrazů, využívat lingvistické anotace korpusu. Na paralelních korpusech budou schopni dohledávat respondenty výrazů v cizím jazyce. Budou rozumět základním principům fungování strojového překladu a počítačem podporovaného překladu, což jim umožní efektivně využívat tyto nástroje ve vlastní praxi.
|
Předpoklady
|
Žádné zvláštní předpoklady.
|
Hodnoticí metody a kritéria
|
Ústní zkouška, Analýza výkonů studenta
Aktivní účast na semináři, samostatné řešení úkolů, ústní zkouška.
|
Doporučená literatura
|
-
ČERMÁK - KLÍMOVÁ - PETKEVIČ (2000). Studie z korpusové lingvistiky. Praha..
-
ČERMÁK, F. - BLATNÁ, R. (eds.), (2005). Jak využívat Český národní korpus. Praha..
-
ČERMÁK, F. - BLATNÁ, R. (2006). Korpusová lingvistika: Stav a modelové přístupy. Praha..
-
ČERMÁK, F. (1995). Jazykový korpus: Prostředek a zdroj poznání. Slovo a Slovesnost, č. 56, s. 119 - 140..
-
KOLEKTIV AUTORŮ (2000). Český národní korpus. Úvod a příručka uživatele. Praha..
-
RADIMSKÝ, JAN (2005). Des méthodes de vérification en linguistique. In: Čermák Petr, Tláskal Jaromír (editores): Las lenguas románicas: su unidad y diversidad, Praha, Univerzita Karlova v Praze, Filozofická fakulta, s. 178-184..
-
RADIMSKÝ, JAN (2007). Projet et construction d'un corpus des textes européens (CORTE). Etudes romanes de Brno, Sborník prací FF MU, L 28, Brno, s. 207-216..
-
ŠTÍCHA, FRANTIŠEK (1994). Čas korpusové lingvistiky. Slovo a slovesnost, 55, s. 141-145..
-
ŠULC, MICHAL (1999). Korpusová lingvistika (první vstup). Praha..
-
TEUBERT, WOLFGANG (ed.), (2007). Text Corpora and Multilingual Lexicography. John Benjamins..
-
WILLIAMS, G. (2005). La linguistique de corpus. Rennes, Presses universitaires de Rennes..
|