Předmět: Data Mining in Bioinformatics

» Seznam fakult » FPR » UAI
Název předmětu Data Mining in Bioinformatics
Kód předmětu UAI/665
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Četnost výuky V každém akademickém roce, jen v zimním semestru.
Semestr Zimní
Počet ECTS kreditů 4
Vyučovací jazyk angličtina
Statut předmětu nespecifikováno
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Skrbek Miroslav, Ing. Ph.D.
Obsah předmětu
1. Úvod do předmětu, cíle data miningu, proces vytěžování dat 2. Zdroje a typy dat, datová matice, metody a formáty ukládání dat 3. Statistika: střední hodnota, rozptyl, medián, korelace, normální rozdělení 4. Platforma RapidMiner, základní principy, vytvoření jednoduchého projektu 5. Předzpracování dat: normalizace, extrakce příznaků z dat, textových dokumentů, www stránek a obrázků 6. Redukce dimenzionality dat: metoda hlavních komponent, hodnocení a výběr atributů 7. Míry podobnosti, metody shlukové analýzy 8. Jednoduché modely dat: lineární a logistická regrese 9. Modelování dat: rozhodovací stromy, asociační pravidla 10. Klasifikátory: k-NN, naivní bayesovský klasifikátor 11. Testování a hodnocení kvality modelů 12. Pokročilé metody modelování 13. Interpretace výsledků a tvorba reportů

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž)
  • Příprava na zkoušku - 40 hodin za semestr
  • Účast na výuce - 39 hodin za semestr
  • Semestrální práce - 40 hodin za semestr
Výstupy z učení
Cílem předmětu je seznámit studenty se základy data miningu se zaměřením na bioinformatiku. Předmět zahrnuje témata pokrývající celý proces vytěžování dat, počínaje pořízením a přípravou dat, přes předzpracování dat, vlastní analýzu a extrakci znalostí, až po vizualizaci interpretaci a tvorbu reportů.
Student získá základní přehled v oblasti data miningu a praktické zkušenosti s data miningovým nástrojem.
Předpoklady
Znalost programování v jazyce Java. Znalost Excelu a zakladní znalost statistiky a operačních systémů a databází.

Hodnoticí metody a kritéria
Písemná zkouška, Seminární práce, Průběžné hodnocení

Student může za semestr získat maximálně 100 bodů ve struktuře 55 bodů zkouška, 45 bodů cvičení. Pro získání zápočtu musí student získat 25 bodů ze cvičení. Pro úspěšné složení zkoušky musí celkový součet za cvičení i zkoušku být >= 50 bodů, přičemž ve zkouškovém testu musí student dosáhnout alespoň polovinu bodů. Pokud není některá z těchto dvou podmínek splněna, student neuspěl.
Doporučená literatura
  • Berka P. Dobývání znalostí z databází. Academia.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr