Vyučující
|
-
Prokýšek Miloš, PhDr. Ph.D.
-
Budík Ondřej, Ing.
-
Geyer Jakub, Mgr. Ph.D.
-
Bukovský Ivo, doc. Ing. Ph.D.
|
Obsah předmětu
|
1. Relační a NoSQL datová úložiště 2. Datawarehouse a. Hvězdné, sněhové vločky a vzory datových úložišť b. ETL, OLAP, OLTP 3. Distribuované databázové systémy a. CAP teorém b. master-slave, zrcadlení, sharding 4. Databázové systémy NoSQL a. Key-value b. Sloupcově orientované c. Dokumentové databáze d. Grafové databáze e. Databáze časových řad 5. Big data a. Rychlost, variabilita, objem b. Nestrukturovaná data c. Zpracování ELT, curated data 6. Zpracování proudových dat a. Vyrovnávací paměť b. Rozdělení c. Skladování d. Zpracování v reálném čase 7. Dolování dat a. Zdroje dat a datové typy b. Datová matice c. Úložiště dat 8. Měření podobnosti, metody shlukové analýzy 9. Základní datové modely a. Lineární a log-lineární regrese 10. Modelování dat a. Rozhodovací stromy, asociační pravidla 11. Klasifikátory a. k-NN b. naivní Bayesův klasifikátor 12. Datová jezera a. Distribuované souborové systémy b. Rodina řešení Hadoop
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž)
- Účast na výuce
- 56 hodin za semestr
- Domácí příprava na výuku
- 56 hodin za semestr
- Semestrální práce
- 20 hodin za semestr
- Příprava na zkoušku
- 20 hodin za semestr
|
Výstupy z učení
|
Cílem předmětu je prohloubit znalosti studentů v oblasti technik ukládání dat a zpracování dat. Kurz se zaměřuje na techniky zpracování velkých dat a ukládání dat v nerelačních databázích, analýzu dat a data mining.
Znalost pokročilých architektur a metod pro zpracování dat.
|
Předpoklady
|
Znalost relačních databází a základní znalost dotazovacích a programovacích jazyků.
|
Hodnoticí metody a kritéria
|
Ústní zkouška
Zápočtový test: Praktický test (zpracování a analýza dat), konec semestru (zápočtový týden). Zkouška: Ústní zkoušení se dvěma teoreticky orientovanými otázkami. Student musí zodpovědět každou otázku alespoň uspokojujícím způsobem.
|
Doporučená literatura
|
-
A. GORELIK. The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science, 1st Edition, O'Reilly Media 2019, ISBN: 978-1491931554.
-
C. CHURCHER. Beginning Database Design: From Novice to Professional. 1st Corrected ed., Apress 2007. ISBN: 978-1590597699.
-
J. GRUS. Data Science from Scratch: First Principles with Python, 2nd Edition, O'Reilly Media 2019, ISBN: 978-1492041139.
-
P.-N. TAN, M. STEINBACH, A. KARPATNE, V. KUMAR. Introduction to Data Mining (2nd edition), 2018. ISBN 978-0133128901.
|