Tato bakalářská práce se zabývá kolokabilitou nejfrekventovanějších substantiv používaných účastníky na diskusních fórech ohledně tématu COVID-19. Internetová diskusní fóra jsou známá především různorodostí názorů jejich navštěvovatelů, kde každý z nich může mít svůj specifický styl vyjadřování, formování vět a také slovník slov, které často využívá. Teoretická část se zabývá především pojmy fraseologie a kolokace. V rámci kolokace je kromě obecného popisu pohlíženo i na jednotlivé druhy a typy. Závěr teoretické části se zabývá přiblížením pojmu kolokability. Praktická část obsahuje korpusový výzkum dat získaných pomocí skriptu z diskusního fóra Reddit. Tato data jsou podrobena analýze a je z nich vytvořen korpus s pomocí programu #LancsBox. Následně je v korpusu vytvořen frekvenční seznam substantiv a vypracován kolokační profil pro ta nejčastější substantiva. Práce zkoumá, jaká slovní spojení se nejčastěji vyskytují mezi neprofesionály na diskusních fórech ohledně aktuálního tématu COVID-19 a v jaké frekvenci se tak vyskytují.
Anotace v angličtině
This Bachelor's thesis deals with the collocability of the most frequent nouns used by users in COVID-19 forum threads. Online discussion forums are well-known for the diversity of opinions of its users where every user may have their own specific style of expression, sentence formation, and also vocabulary of often used words. The theoretical part mostly concentrates on the terms "phraseology" and "collocations". Regarding collocations, besides general description a closer look at individual categories and types of collocations is also provided. The ending of the theoretical part concentrates on collocability and its concept. The practical part contains the corpus research of data gathered using a script from a Reddit forum. This data is subjected to analysis and is used in the creation of a corpus with the help of #LancsBox software. Subsequently, a frequency list of nouns is created and a collocational profile for the most frequent nouns is developed. The thesis analyses which collocations most often occur among non-professionals in discussion forums on the current topic of COVID-19 and at what frequency they occur.
Tato bakalářská práce se zabývá kolokabilitou nejfrekventovanějších substantiv používaných účastníky na diskusních fórech ohledně tématu COVID-19. Internetová diskusní fóra jsou známá především různorodostí názorů jejich navštěvovatelů, kde každý z nich může mít svůj specifický styl vyjadřování, formování vět a také slovník slov, které často využívá. Teoretická část se zabývá především pojmy fraseologie a kolokace. V rámci kolokace je kromě obecného popisu pohlíženo i na jednotlivé druhy a typy. Závěr teoretické části se zabývá přiblížením pojmu kolokability. Praktická část obsahuje korpusový výzkum dat získaných pomocí skriptu z diskusního fóra Reddit. Tato data jsou podrobena analýze a je z nich vytvořen korpus s pomocí programu #LancsBox. Následně je v korpusu vytvořen frekvenční seznam substantiv a vypracován kolokační profil pro ta nejčastější substantiva. Práce zkoumá, jaká slovní spojení se nejčastěji vyskytují mezi neprofesionály na diskusních fórech ohledně aktuálního tématu COVID-19 a v jaké frekvenci se tak vyskytují.
Anotace v angličtině
This Bachelor's thesis deals with the collocability of the most frequent nouns used by users in COVID-19 forum threads. Online discussion forums are well-known for the diversity of opinions of its users where every user may have their own specific style of expression, sentence formation, and also vocabulary of often used words. The theoretical part mostly concentrates on the terms "phraseology" and "collocations". Regarding collocations, besides general description a closer look at individual categories and types of collocations is also provided. The ending of the theoretical part concentrates on collocability and its concept. The practical part contains the corpus research of data gathered using a script from a Reddit forum. This data is subjected to analysis and is used in the creation of a corpus with the help of #LancsBox software. Subsequently, a frequency list of nouns is created and a collocational profile for the most frequent nouns is developed. The thesis analyses which collocations most often occur among non-professionals in discussion forums on the current topic of COVID-19 and at what frequency they occur.
V době moderní techniky hrají v jazykovém výzkumu důležitou roli korpusy, které slouží jako zdroj autentických dat, na nichž lze do jisté míry objektivně pozorovat jazykový vývoj. Z lexikálního hlediska jsou korpusy využívány zejména pro zkoumání opakujícího se souvýskytu lexikálních jednotek, který lze dělit do čtyř hlavních kategorií; kolokace, koligace, sémantická preference a sémantická prosodie (Sinclair, 1991). Kolokace je bezesporu nejdiskutovanější z těchto čtyř termínů, jelikož se jedná o jev, který nám umožnuje měřit frekvenci lexikálních kombinací v daném jazyce a následně tyto poznatky uplatnit v dalších oblastech, jako např. tvorba slovníků, výuka cizích jazyků, překladatelství aj. Tato práce bude zkoumat kolokabilitu nejfrekventovanějších substantiv používaných účastníky na diskuzních fórech k aktuálnímu tématu COVID-19.
V teoretické části autor po prostudování odborné literatury detailně popíše termíny kolokace a kolokabilita v kontextu lexikální sémantiky a korpusového výzkumu.
V praktické části autor provede vlastní korpusový výzkum, přičemž použije reprezentativní množství dat z diskuzního fóra (Reddit) a následně z těchto dat vytvoří vlastní korpus s pomocí softwaru LancsBox. V korpusu poté vytvoří frekvenční seznam substantiv a vypracuje kolokační profil pro ta nejčastější z nich.
Cílem práce je samotný proces tvorby korpusu a následné práce s ním, výsledkem pak kolokační profily nejčastějších substantiv užívaných neprofesionály v diskuzi na téma COVID-19.
Zásady pro vypracování
V době moderní techniky hrají v jazykovém výzkumu důležitou roli korpusy, které slouží jako zdroj autentických dat, na nichž lze do jisté míry objektivně pozorovat jazykový vývoj. Z lexikálního hlediska jsou korpusy využívány zejména pro zkoumání opakujícího se souvýskytu lexikálních jednotek, který lze dělit do čtyř hlavních kategorií; kolokace, koligace, sémantická preference a sémantická prosodie (Sinclair, 1991). Kolokace je bezesporu nejdiskutovanější z těchto čtyř termínů, jelikož se jedná o jev, který nám umožnuje měřit frekvenci lexikálních kombinací v daném jazyce a následně tyto poznatky uplatnit v dalších oblastech, jako např. tvorba slovníků, výuka cizích jazyků, překladatelství aj. Tato práce bude zkoumat kolokabilitu nejfrekventovanějších substantiv používaných účastníky na diskuzních fórech k aktuálnímu tématu COVID-19.
V teoretické části autor po prostudování odborné literatury detailně popíše termíny kolokace a kolokabilita v kontextu lexikální sémantiky a korpusového výzkumu.
V praktické části autor provede vlastní korpusový výzkum, přičemž použije reprezentativní množství dat z diskuzního fóra (Reddit) a následně z těchto dat vytvoří vlastní korpus s pomocí softwaru LancsBox. V korpusu poté vytvoří frekvenční seznam substantiv a vypracuje kolokační profil pro ta nejčastější z nich.
Cílem práce je samotný proces tvorby korpusu a následné práce s ním, výsledkem pak kolokační profily nejčastějších substantiv užívaných neprofesionály v diskuzi na téma COVID-19.
Seznam doporučené literatury
Cruse, D. A. (2004) Meaning in Language. 2nd ed. Oxford University Press.
Čermák, F. (2007) Frazeologie a idiomatika česká a obecná/Czech and General Phraseology. Praha: Univerzita Karlova v Praze - Nakladatelství Karolinum.
Geeraerts, D. (2010) Theories of Lexical Semantics. Oxford University Press.
Mel'čuk, I. A. (1998) Collocations and lexical functions. In Anthony P. Cowie (ed.), Phraseology, Theory, Analysis, and Applications, 23-53. Oxford: Clarendon Press.
Sinclair, J. M. (1991) Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Sinclair, J. M. (2004) Trust the Text: Language, Corpus and Discourse. London: Routledge.
Seznam doporučené literatury
Cruse, D. A. (2004) Meaning in Language. 2nd ed. Oxford University Press.
Čermák, F. (2007) Frazeologie a idiomatika česká a obecná/Czech and General Phraseology. Praha: Univerzita Karlova v Praze - Nakladatelství Karolinum.
Geeraerts, D. (2010) Theories of Lexical Semantics. Oxford University Press.
Mel'čuk, I. A. (1998) Collocations and lexical functions. In Anthony P. Cowie (ed.), Phraseology, Theory, Analysis, and Applications, 23-53. Oxford: Clarendon Press.
Sinclair, J. M. (1991) Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Sinclair, J. M. (2004) Trust the Text: Language, Corpus and Discourse. London: Routledge.