Vyučující
|
-
Skrbek Miroslav, Ing. Ph.D.
|
Obsah předmětu
|
1. Úvod do předmětu, cíle data miningu, proces vytěžování dat 2. Zdroje a typy dat, datová matice, metody a formáty ukládání dat 3. Statistika: střední hodnota, rozptyl, medián, korelace, normální rozdělení 4. Platforma RapidMiner, základní principy, vytvoření jednoduchého projektu 5. Předzpracování dat: normalizace, extrakce příznaků z dat, textových dokumentů, www stránek a obrázků 6. Redukce dimenzionality dat: metoda hlavních komponent, hodnocení a výběr atributů 7. Míry podobnosti, metody shlukové analýzy 8. Jednoduché modely dat: lineární a logistická regrese 9. Modelování dat: rozhodovací stromy, asociační pravidla 10. Klasifikátory: k-NN, naivní bayesovský klasifikátor 11. Testování a hodnocení kvality modelů 12. Pokročilé metody modelování 13. Interpretace výsledků a tvorba reportů
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž), Laboratorní práce
- Domácí příprava na výuku
- 18 hodin za semestr
- Účast na výuce
- 52 hodin za semestr
- Semestrální práce
- 40 hodin za semestr
- Příprava na zkoušku
- 40 hodin za semestr
|
Výstupy z učení
|
Cílem předmětu je seznámit studenty se základy data miningu. Předmět zahrnuje témata pokrývající celý proces vytěžování dat, počínaje pořízením a přípravou dat, přes předzpracování dat, vlastní analýzu a extrakci znalostí, až po vizualizaci interpretaci a tvorbu reportů. Studenti se seznámí s vybranou množinou nejčastěji užívaných principů a algoritmů. Ve cvičeních se studenti získají praktické dovednosti v data miningu s využitím jednoduchých nástrojů typu tabulkový kalkulátor a sofistikovaným dataminingovým nástrojem.
Student získá základní přehled v oblasti data miningu a praktické zkušenosti s data miningovým nástrojem.
|
Předpoklady
|
Znalost programování v jazyce Java. Znalost Excelu a zakladní znalost statistiky a operačních systémů a databází.
|
Hodnoticí metody a kritéria
|
Písemná zkouška, Seminární práce, Průběžné hodnocení
Student za semestr může získat maximálně 100 bodů ve struktuře 55 bodů zkouška, 45 bodů cvičení. Pro získání zápočtu musí student získat 25 bodů ze cvičení. Pro úspěšné složení zkoušky musí celkový součet za cvičení i zkoušku být >= 50 bodů, přičemž ve zkouškovém testu musí student dosáhnout alespoň polovinu bodů. Pokud není některá z těchto dvou podmínek splněna, student neuspěl.
|
Doporučená literatura
|
-
Berka, P. Dobývání znalostí z databází. Academia, 2003. ISBN 80-200-1062-9.
-
Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar. Introduction to Data Mining (2nd edition). 2018. ISBN 978-0133128901.
|