Předmět: Data Mining - pro učitelství středních škol

» Seznam fakult » FPR » UAI
Název předmětu Data Mining - pro učitelství středních škol
Kód předmětu UAI/691U
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu nespecifikována
Rok studia nespecifikován
Četnost výuky V každém akademickém roce, jen v letním semestru.
Semestr Letní
Počet ECTS kreditů 5
Vyučovací jazyk čeština
Statut předmětu nespecifikováno
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Skrbek Miroslav, Ing. Ph.D.
Obsah předmětu
1. Úvod do předmětu, cíle data miningu, proces vytěžování dat 2. Zdroje a typy dat, datová matice, metody a formáty ukládání dat 3. Statistika: střední hodnota, rozptyl, medián, korelace, normální rozdělení 4. Platforma RapidMiner, základní principy, vytvoření jednoduchého projektu 5. Předzpracování dat: normalizace, extrakce příznaků z dat, textových dokumentů, www stránek a obrázků 6. Redukce dimenzionality dat: metoda hlavních komponent, hodnocení a výběr atributů 7. Míry podobnosti, metody shlukové analýzy 8. Jednoduché modely dat: lineární a logistická regrese 9. Modelování dat: rozhodovací stromy, asociační pravidla 10. Klasifikátory: k-NN, naivní bayesovský klasifikátor 11. Testování a hodnocení kvality modelů 12. Pokročilé metody modelování 13. Interpretace výsledků a tvorba reportů

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Laboratorní práce
  • Domácí příprava na výuku - 18 hodin za semestr
  • Účast na výuce - 52 hodin za semestr
  • Semestrální práce - 40 hodin za semestr
  • Příprava na zkoušku - 40 hodin za semestr
Výstupy z učení
Cílem předmětu je seznámit studenty se základy data miningu. Předmět zahrnuje témata pokrývající celý proces vytěžování dat, počínaje pořízením a přípravou dat, přes předzpracování dat, vlastní analýzu a extrakci znalostí, až po vizualizaci interpretaci a tvorbu reportů. Studenti se seznámí s vybranou množinou nejčastěji užívaných principů a algoritmů. Ve cvičeních se studenti získají praktické dovednosti v data miningu s využitím jednoduchých nástrojů typu tabulkový kalkulátor a sofistikovaným dataminingovým nástrojem.
Student získá základní přehled v oblasti data miningu a praktické zkušenosti s data miningovým nástrojem.
Předpoklady
Znalost programování v jazyce Java. Znalost Excelu a zakladní znalost statistiky a operačních systémů a databází.

Hodnoticí metody a kritéria
Písemná zkouška, Seminární práce, Průběžné hodnocení

Student za semestr může získat maximálně 100 bodů ve struktuře 55 bodů zkouška, 45 bodů cvičení. Pro získání zápočtu musí student získat 25 bodů ze cvičení. Pro úspěšné složení zkoušky musí celkový součet za cvičení i zkoušku být >= 50 bodů, přičemž ve zkouškovém testu musí student dosáhnout alespoň polovinu bodů. Pokud není některá z těchto dvou podmínek splněna, student neuspěl.
Doporučená literatura
  • Berka, P. Dobývání znalostí z databází. Academia, 2003. ISBN 80-200-1062-9.
  • Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar. Introduction to Data Mining (2nd edition). 2018. ISBN 978-0133128901.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr