Předmět: Artificial intelligence (AI) in biological data acquisition and analysis

« Zpět
Název předmětu Artificial intelligence (AI) in biological data acquisition and analysis
Kód předmětu KMB/024
Organizační forma výuky Přednáška + Cvičení + Seminář
Úroveň předmětu Doktorský
Rok studia nespecifikován
Četnost výuky V každém akademickém roce, jen v letním semestru.
Semestr Letní
Počet ECTS kreditů 2
Vyučovací jazyk angličtina
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Bondar Alexey, Mgr. Ph.D.
  • Kulik Natallia, Ing. Ph.D.
  • Kulich Ivan, Mgr. Ph.D.
  • Opelka Jakub, Mgr.
Obsah předmětu
Kombinované bloky přednášek a praktických cvičení: 1. Úvod do strojového učení (ML), hlubokého učení (DL) a umělé inteligence (AI) v biologii Úvodní sekce. Základní terminologie tématu, obecné principy stojící za AI, ML a DL. Seznámení s obecně použitelnými nástroji AI v biologii (ChatGPT, Perplexity, Copilot, Grok, Gemini, NightCafe). Úvod do Pythonu, Jupyteru a Colabu pro ML/DL v biologii. 2. Data v biologii: Typy, problémy a předběžné zpracování dat Principy práce s různými typy biologických dat (sekvenční data DNA/RNA, sekvenční data proteinů, mikroskopické snímky, velké soubory textů). Normalizace a čištění dat, práce s odlehlými hodnotami a chybějícími daty. Anonymizace dat. Příprava dat pro trénování a provádění modelů. 3. Algoritmy řízeného učení Principy řízeného učení, anotace dat, výběr příznaků. Běžné algoritmy řízeného učení (logistická regrese, náhodný les). Anotace datové sady a trénování modelu řízeného učení na základě anotovaných dat. Využití modelu pro testovací soubor dat. 4. Algoritmy neřízeného učení Principy a oblasti použití pro neřízené učení. Běžné neřízené algoritmy (k-means, analýza hlavních komponent). Noise2Void. Použití algoritmů neřízeného učení pro objevování vzorů. 5. Vyhodnocení a ověření modelu Vyhodnocení ML/DL modelů a validace získaných výsledků. Parametry pro hodnocení ML/DL modelů. Statistické testování výsledků, ukazatele nadměrného fitování, spolehlivé generalizační parametry. 6. Generativní modely v biologii Variační autoenkodéry a generativní adverzní sítě v biologii. Velké jazykové modely (LLM) a jejich využití při zpracování biologických dat. Seminář 1: sdílení osobních zkušeností s využíváním umělé inteligence pro studium a výzkum. 7. Konvoluční neuronové sítě v biologické mikroskopii AI a DL v analýze mikroskopických dat. Konvoluční filtry a lokální vzory. Neuronová síť U-Net, detekce objektů YOLO. Adaptivní optika. Detekce a klasifikace buněk pomocí Cellpose a QuPath. 8. Rekurentní neuronové sítě a sekvenční modely Klasifikace sekvencí DNA/RNA. Síťová paměť. Dlouhodobá krátkodobá paměť, řízená rekurentní jednotka. Praktické cvičení v oblasti predikce sestřihových míst (SpliceAI) a vazby transkripčních faktorů (DeepBind). 9. Umělá inteligence v predikci struktury proteinů a objevování léčiv Predikce proteinových struktur, vazebných kontaktů a proteinových komplexů. Syntetické ligandy a objevování léčiv. AlphaFold a RoseTTAFold pro analýzu struktury proteinů. 10. Umělá inteligence v proteomice a predikce funkce proteinů Aplikace umělé inteligence pro stanovení funkční aktivity, interakcí a lokalizace proteinů. Praktické cvičení v předpovídání subcelulární lokalizace proteinů a vytváření syntetických obrazů. 11. Zpracování přirozeného jazyka a dolování z textů v biologii Zpracování přirozeného jazyka vs. text mining v biologickém kontextu. Dostupné rozsáhlé textové databáze (PubMed, UniProt). Klasické vytěžování textu vs. přístupy založené na hlubokém učení. Dolování z textů pomocí BioBERT. 12. Etické problémy a budoucnost umělé inteligence v biologii Vlastnictví dat, citlivé údaje, spotřeba energie. Halucinace umělé inteligence. Budoucí směry, povědomí a technologická singularita. Seminář 2: ukázka využití AI ve vlastním výzkumu.

Studijní aktivity a metody výuky
  • Účast na výuce - 30 hodin za semestr
  • Příprava na zkoušku - 10 hodin za semestr
  • Domácí příprava na výuku - 10 hodin za semestr
Výstupy z učení
Cílem kurzu je seznámit studenty se základními pojmy umělé inteligence, strojového učení a hlubokého učení a představit jim různé dostupné nástroje pro biologické aplikace včetně jejich vlastního výzkumu.
Kurz je primárně určen pro studenty doktorského studia, ale přihlásit se mohou i zájemci z řad studentů magisterského studia.
Předpoklady
Jsou vyžadovány základní znalosti jazyka Python, Google Colab a Unix Shell. Zkušenosti s programováním jsou výhodou, ale nejsou podmínkou. Doporučené vzdělávací kurzy: Google Colab: https://colab.research.google.com/ Unix Shell: https://swcarpentry.github.io/shell-novice/ Python: https://swcarpentry.github.io/python-novice-inflammation/ https://swcarpentry.github.io/python-novice-gapminder/

Hodnoticí metody a kritéria
nespecifikováno
Student musí úspěšně absolvovat všechna praktická cvičení a 2 semináře během kurzu (60 %) a splnit písemný test (40 %).
Doporučená literatura
  • AI in Biological Sciences 2022: https://www.mdpi.com/2075-1729/12/9/1430.
  • AI/ML in Space Biology https://canvas.instructure.com/courses/9595041/assignments/syllabus.
  • Exemplary generative AI course: https://www.coursera.org/learn/generative-ai-for-everyone.
  • Google AI training centre: https://www.ai.google/get-started/learn-ai-skills/.
  • Python programming essential for AI applications: https://www.deeplearning.ai/short-courses/ai-python-for-beginners/.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr