Předmět: Advanced data storages and analyses

« Zpět
Název předmětu Advanced data storages and analyses
Kód předmětu UAI/504
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia nespecifikován
Četnost výuky V každém akademickém roce, jen v zimním semestru.
Semestr Zimní
Počet ECTS kreditů 6
Vyučovací jazyk angličtina
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Dostupnost předmětu Předmět je nabízen přijíždějícím studentům
Vyučující
  • Geyer Jakub, Mgr.
  • Bukovský Ivo, doc. Ing. Ph.D.
  • Prokýšek Miloš, PhDr. Ph.D.
  • Budík Ondřej, Ing.
Obsah předmětu
1. Relační a NoSQL datová úložiště 2. Datawarehouse     a. Hvězdné, sněhové vločky a vzory datových úložišť     b. ETL, OLAP, OLTP 3. Distribuované databázové systémy     a. CAP teorém     b. master-slave, zrcadlení, sharding 4. Databázové systémy NoSQL     a. Key-value     b. Sloupcově orientované     c. Dokumentové databáze     d. Grafové databáze     e. Databáze časových řad 5. Big data     a. Rychlost, variabilita, objem     b. Nestrukturovaná data     c. Zpracování ELT, curated data 6. Zpracování proudových dat     a. Vyrovnávací paměť     b. Rozdělení     c. Skladování     d. Zpracování v reálném čase 7. Dolování dat     a. Zdroje dat a datové typy     b. Datová matice     c. Úložiště dat 8. Měření podobnosti, metody shlukové analýzy 9. Základní datové modely     a. Lineární a log-lineární regrese 10. Modelování dat     a. Rozhodovací stromy, asociační pravidla 11. Klasifikátory     a. k-NN     b. naivní Bayesův klasifikátor 12. Datová jezera     a. Distribuované souborové systémy     b. Rodina řešení Hadoop

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž)
  • Účast na výuce - 56 hodin za semestr
  • Domácí příprava na výuku - 56 hodin za semestr
  • Semestrální práce - 20 hodin za semestr
  • Příprava na zkoušku - 20 hodin za semestr
Výstupy z učení
Cílem předmětu je prohloubit znalosti studentů v oblasti technik ukládání dat a zpracování dat. Kurz se zaměřuje na techniky zpracování velkých dat a ukládání dat v nerelačních databázích, analýzu dat a data mining.
Znalost pokročilých architektur a metod pro zpracování dat.
Předpoklady
Znalost relačních databází a základní znalost dotazovacích a programovacích jazyků.

Hodnoticí metody a kritéria
Ústní zkouška

Zápočtový test: Praktický test (zpracování a analýza dat), konec semestru (zápočtový týden), 2 termíny (=><b>max. 2 pokusy</b>). Zkouška: Ústní zkoušení se dvěma teoreticky orientovanými otázkami. Student musí zodpovědět každou otázku alespoň uspokojujícím způsobem.
Doporučená literatura
  • A. GORELIK. The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science, 1st Edition, O'Reilly Media 2019, ISBN: 978-1491931554.
  • C. CHURCHER. Beginning Database Design: From Novice to Professional. 1st Corrected ed., Apress 2007. ISBN: 978-1590597699.
  • J. GRUS. Data Science from Scratch: First Principles with Python, 2nd Edition, O'Reilly Media 2019, ISBN: 978-1492041139.
  • P.-N. TAN, M. STEINBACH, A. KARPATNE, V. KUMAR. Introduction to Data Mining (2nd edition), 2018. ISBN 978-0133128901.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr