Vyučující
|
-
Bukovský Ivo, doc. Ing. Ph.D.
-
Skrbek Miroslav, Ing. Ph.D.
-
Beránek Ladislav, prof. Ing. CSc., MBA
|
Obsah předmětu
|
1. Úvod do předmětu, cíle data miningu, proces vytěžování dat. 2. Zdroje a typy dat, datová matice, metody a formáty ukládání dat. 3. Statistika: střední hodnota, rozptyl, medián, korelace, normální rozdělení. 4. Sofistikovaný data miningový nástroj, základní principy, vytvoření jednoduchého projektu. 5. Předzpracování dat: normalizace, extrakce příznaků z dat, textových dokumentů, www stránek a obrázků. 6. Redukce dimenze dat: metoda hlavních komponent, hodnocení a výběr atributů. 7. Míry podobnosti, metody shlukové analýzy. 8. Jednoduché modely dat: lineární a logistická regrese. 9. Modelování dat: rozhodovací stromy, asociační pravidla. 10. Klasifikátory: k-NN, naivní bayesovský klasifikátor. 11. Testování a hodnocení kvality modelů. 12. Pokročilé metody modelování. 13. Interpretace výsledků a tvorba reportů. Sada praktických úloh pokrývajících témata přednášek.
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž), Práce s multimediálními zdroji (texty, internet, IT technologie), Projektová výuka, Praktická výuka, Případová studie
- Domácí příprava na výuku
- 20 hodin za semestr
- Semestrální práce
- 24 hodin za semestr
- Účast na výuce
- 56 hodin za semestr
- Příprava na zkoušku
- 25 hodin za semestr
|
Výstupy z učení
|
Cílem předmětu je seznámit studenty se základy data miningu. Předmět zahrnuje témata pokrývající celý proces vytěžování dat, počínaje pořízením a přípravou dat, přes předzpracování dat, vlastní analýzu a extrakci znalostí, až po vizualizaci interpretaci a tvorbu reportů. Studenti se seznámí s vybranou množinou nejčastěji užívaných principů a algoritmů. Ve cvičeních se studenti získají praktické dovednosti v data miningu s využitím jednoduchých nástrojů typu tabulkový kalkulátor a sofistikovaným data miningovým nástrojem.
Práce s daty na PC, schopnost použití dataminingu, matematické analýzy a řešení úloh s využitím programovacích nástrojů.
|
Předpoklady
|
nespecifikováno
|
Hodnoticí metody a kritéria
|
Test, Seminární práce
Vypracování semestrální úloh ve cvičeních a vypracování zkouškového testu se ziskem min. 50% všech možných bodů.
|
Doporučená literatura
|
-
Berka, P. Dobývání znalostí z databází. Academia, 2003. ISBN 80-200-1062-9.
-
Ethem Alpaydin. Introduction to Machine Learning.The MIT Press; fourth edition, March 24, 2020. ISBN 978-0262043793.
-
Kris Jamsa. Introduction to Data Mining and Analytics. Jones & Bartlett Learning, February 17, 2020. ISBN 978-1284180909.
-
Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar. Introduction to Data Mining (2nd edition). 2018. ISBN 978-0133128901.
|