Vyučující
|
-
Skrbek Miroslav, Ing. Ph.D.
|
Obsah předmětu
|
1. Úvod do předmětu, cíle data miningu, proces vytěžování dat 2. Zdroje a typy dat, datová matice, metody a formáty ukládání dat 3. Statistika: střední hodnota, rozptyl, medián, korelace, normální rozdělení 4. Platforma RapidMiner, základní principy, vytvoření jednoduchého projektu 5. Předzpracování dat: normalizace, extrakce příznaků z dat, textových dokumentů, www stránek a obrázků 6. Redukce dimenzionality dat: metoda hlavních komponent, hodnocení a výběr atributů 7. Míry podobnosti, metody shlukové analýzy 8. Jednoduché modely dat: lineární a logistická regrese 9. Modelování dat: rozhodovací stromy, asociační pravidla 10. Klasifikátory: k-NN, naivní bayesovský klasifikátor 11. Testování a hodnocení kvality modelů 12. Pokročilé metody modelování 13. Interpretace výsledků a tvorba reportů
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž)
- Příprava na zkoušku
- 40 hodin za semestr
- Účast na výuce
- 39 hodin za semestr
- Semestrální práce
- 40 hodin za semestr
|
Výstupy z učení
|
Cílem předmětu je seznámit studenty se základy data miningu se zaměřením na bioinformatiku. Předmět zahrnuje témata pokrývající celý proces vytěžování dat, počínaje pořízením a přípravou dat, přes předzpracování dat, vlastní analýzu a extrakci znalostí, až po vizualizaci interpretaci a tvorbu reportů.
Student získá základní přehled v oblasti data miningu a praktické zkušenosti s data miningovým nástrojem.
|
Předpoklady
|
Znalost programování v jazyce Java. Znalost Excelu a zakladní znalost statistiky a operačních systémů a databází.
|
Hodnoticí metody a kritéria
|
Písemná zkouška, Seminární práce, Průběžné hodnocení
Student může za semestr získat maximálně 100 bodů ve struktuře 55 bodů zkouška, 45 bodů cvičení. Pro získání zápočtu musí student získat 25 bodů ze cvičení. Pro úspěšné složení zkoušky musí celkový součet za cvičení i zkoušku být >= 50 bodů, přičemž ve zkouškovém testu musí student dosáhnout alespoň polovinu bodů. Pokud není některá z těchto dvou podmínek splněna, student neuspěl.
|
Doporučená literatura
|
-
Berka P. Dobývání znalostí z databází. Academia.
|