Diplomová práce se zabývá problematikou počítačového vidění a porovnáním trénovaných deep learning modelů. V teoretické části je rozpracován podrobný přehled fyzikálních vlastností elektromagnetického záření viditelného spektra a principů záznamu digitálního snímku, včetně jeho vlastností. Následuje rešerše metod zpracování obrazu, kde jsou stručně charakterizovány konvenční metody a poté i konvoluční neuronové sítě. Praktická část je zaměřena na vytvoření vhodného datasetu s anotacemi, jenž je dále aplikován pro trénování vybraných modelů. Z hlediska zvolených vyhodnocovacíh metrik, a také na základě experimentálního stanovení vstupních parametrů pro trénování, je analyzována variabilita a přesnost získaných výsledků.
Anotace v angličtině
The thesis is focused on computer vision and the comparison of trained deep learning models. In the theoretical part, a detailed overview of the physical properties of the visible electromagnetic spectrum and the principles of the digital image, including it, is processed. This is followed by a review of image processing methods, where conventional methods and then convolutional neural networks are briefly characterized. The practical part is focused on creating a suitable dataset with annotations, which is further applied for training selected models. The variability and accuracy of the obtained results is analyzed from the point of view of the selected evaluation metrics, as well as based on the experimental determination of input parameters for training.
Electromagnetic spectrum, digital image, image processing, convolution, data annotation, training neural networks
Rozsah průvodní práce
74
Jazyk
CZ
Anotace
Diplomová práce se zabývá problematikou počítačového vidění a porovnáním trénovaných deep learning modelů. V teoretické části je rozpracován podrobný přehled fyzikálních vlastností elektromagnetického záření viditelného spektra a principů záznamu digitálního snímku, včetně jeho vlastností. Následuje rešerše metod zpracování obrazu, kde jsou stručně charakterizovány konvenční metody a poté i konvoluční neuronové sítě. Praktická část je zaměřena na vytvoření vhodného datasetu s anotacemi, jenž je dále aplikován pro trénování vybraných modelů. Z hlediska zvolených vyhodnocovacíh metrik, a také na základě experimentálního stanovení vstupních parametrů pro trénování, je analyzována variabilita a přesnost získaných výsledků.
Anotace v angličtině
The thesis is focused on computer vision and the comparison of trained deep learning models. In the theoretical part, a detailed overview of the physical properties of the visible electromagnetic spectrum and the principles of the digital image, including it, is processed. This is followed by a review of image processing methods, where conventional methods and then convolutional neural networks are briefly characterized. The practical part is focused on creating a suitable dataset with annotations, which is further applied for training selected models. The variability and accuracy of the obtained results is analyzed from the point of view of the selected evaluation metrics, as well as based on the experimental determination of input parameters for training.
Electromagnetic spectrum, digital image, image processing, convolution, data annotation, training neural networks
Zásady pro vypracování
Diplomová práce se bude zabývat problematikou počítačového vidění a aplikací vybraných metod hlubokého učení k detekci stanovených objektů v obrazu. V teoretické části bude rozpracován podrobný přehled fyzikálních vlastností elektromagnetického záření viditelného spektra a principů záznamu digitálního snímku, včetně jeho vlastností. Následně diplomantka naváže rešerší metod zpracování obrazu, kde nejprve stručně charakterizuje konvenční metody a poté se blíže zaměří na konvoluční neuronové sítě. Praktická část bude zaměřena na vytvoření vhodného datasetu s anotacemi, jenž bude dále aplikován pro trénování vybraných deep learning modelů z frameworku Detectron2 či MMDetection. Součásti práce s daty bude také jejich augmentace. Na základě experimentálního stanovení vstupních parametrů pro trénování bude analyzována variabilita a přesnost získaných výsledků.
Zásady pro vypracování
Diplomová práce se bude zabývat problematikou počítačového vidění a aplikací vybraných metod hlubokého učení k detekci stanovených objektů v obrazu. V teoretické části bude rozpracován podrobný přehled fyzikálních vlastností elektromagnetického záření viditelného spektra a principů záznamu digitálního snímku, včetně jeho vlastností. Následně diplomantka naváže rešerší metod zpracování obrazu, kde nejprve stručně charakterizuje konvenční metody a poté se blíže zaměří na konvoluční neuronové sítě. Praktická část bude zaměřena na vytvoření vhodného datasetu s anotacemi, jenž bude dále aplikován pro trénování vybraných deep learning modelů z frameworku Detectron2 či MMDetection. Součásti práce s daty bude také jejich augmentace. Na základě experimentálního stanovení vstupních parametrů pro trénování bude analyzována variabilita a přesnost získaných výsledků.
Seznam doporučené literatury
Aghdam, H., Heravi, J.E.: Guide to Convolutional Neural Networks. Springer International Publishing, 2017. ISBN 978-3-319-57550-6
Forsyth, D.A., Ponce, J.: Computer Vision A Modern Approach. Prentical Hal, 2011. ISBN 978-0136085928
Goodfellow, I., Bengio, Y., Courville, A.: Deep learning. MIT Press, 2016. ISBN 978-0-262-03561-3
Halliday, D., Resnick, R., Walker, J.: Fyzika. Druhé přepracované vydání. Přeložil Černý, M. Brno, Vysoké učení technické v Brně - Nakladatelství VUTIOM, 2013. ISBN 978-80-214-4123-1.
Hassaballah, M., Awad, A.I.: Deep learning in computer vision principles and applications. Boca Raton, CRC Press, Taylor & Francis Group, 2020. ISBN 978-1-138-54442-0
Hlaváč, V., Sedláček, M.: Zpracování signálů a obrazů. Vyd. 3. Praha, České vysoké učení technické, 2009. ISBN 978-80-01-04442-1
Malý, P.: Optika. Praha, Karolinum, 2008. ISBN 978-80-246-1342-0
Peatross, J., Ware, M.: Physics of Light and Optics. BYU Bookstore, 2015. ISBN 978-1-312-92927-2
Petrou, M., Petrou, C.: Image processing: the fundamentals. Second edition. Chichester, Wiley, 2010. ISBN 978-0-470-74586-1
Venkatesan, R., Li, B.: Convolutional neural networks in visual computing: a concise guide. Boca Raton, CRC Press, Taylor & Francis Group, 2017. ISBN 978-1-4987-7039-2
Seznam doporučené literatury
Aghdam, H., Heravi, J.E.: Guide to Convolutional Neural Networks. Springer International Publishing, 2017. ISBN 978-3-319-57550-6
Forsyth, D.A., Ponce, J.: Computer Vision A Modern Approach. Prentical Hal, 2011. ISBN 978-0136085928
Goodfellow, I., Bengio, Y., Courville, A.: Deep learning. MIT Press, 2016. ISBN 978-0-262-03561-3
Halliday, D., Resnick, R., Walker, J.: Fyzika. Druhé přepracované vydání. Přeložil Černý, M. Brno, Vysoké učení technické v Brně - Nakladatelství VUTIOM, 2013. ISBN 978-80-214-4123-1.
Hassaballah, M., Awad, A.I.: Deep learning in computer vision principles and applications. Boca Raton, CRC Press, Taylor & Francis Group, 2020. ISBN 978-1-138-54442-0
Hlaváč, V., Sedláček, M.: Zpracování signálů a obrazů. Vyd. 3. Praha, České vysoké učení technické, 2009. ISBN 978-80-01-04442-1
Malý, P.: Optika. Praha, Karolinum, 2008. ISBN 978-80-246-1342-0
Peatross, J., Ware, M.: Physics of Light and Optics. BYU Bookstore, 2015. ISBN 978-1-312-92927-2
Petrou, M., Petrou, C.: Image processing: the fundamentals. Second edition. Chichester, Wiley, 2010. ISBN 978-0-470-74586-1
Venkatesan, R., Li, B.: Convolutional neural networks in visual computing: a concise guide. Boca Raton, CRC Press, Taylor & Francis Group, 2017. ISBN 978-1-4987-7039-2