Prejsť na obsah
dizertácie

Dovoľujeme si oznámiť, že dňa

10. 11. 2016 o 15.00 hod.

sa uskutoční na Fakulte informatiky a informačných technológií STU v Bratislave
Ilkovičova 2, v miestnosti 3.08 obhajoba dizertačnej práce

Ing. Jakuba Ševcecha

Názov dizertačnej práce:
Towards Symbolic Representation of Potentially Infinite Time Series
Smerom k symbolickej reprezentácii potenciálne nekonečných časových radov

Odbor: 9.2.6 Informačné systémy

Školiteľ: prof. Ing. Mária Bieliková, PhD. - FIIT STU v Bratislave

Oponenti dizertačnej práce:
prof. RNDr. Jaroslav Pokorný, CSc. - MFF UK v Prahe, ČR
doc. RNDr. Jaroslav Zendulka, CSc.- FIT VUT v Brne, ČR

Abstrakt:

Pri spracovávaní veľmi dlhých časových radov, najmä ak sú spracovávané vo forme prúdov údajov, sa musíme vysporiadať s niekoľkými otvorenými problémami. Tie najvýznamnejšie sú veľká dimenzionalita údajov, problémy spojené s porovnávaním veľmi dlhých časových radov a spracovanie údajov pri obmedzeniach spracovania potenciálne nekonečných prúdov údajov. Z týchto problémov vyplýva viacero príležitostí v oblasti reprezentácie údajov, redukcie dimenzionality a zapojenia metód z oblasti spracovania textu do oblasti analýzy časových radov.
V našej práci sa venujeme týmto problémom a využívame tieto príležitosti navrhnutím symbolickej reprezentácie potenciálne nekonečných časových radov a k nej asociovanej metriky podobnosti. Skúmame použiteľnosť navrhnutej reprezentácie v rôznych úlohách analýzy údajov ako je klasifikácia alebo predpoveď budúcich hodnôt s použitím rôznych typov krátkych a dlhých časových radov. Špeciálnu pozornosť venujeme spracovaniu údajov pri obmedzeniach spôsobených požiadavkami na systémy na spracovanie prúdov údajov a navrhujeme naše prístupy v súlade s týmito požiadavkami.

Wen processing very long time series, especially when they are processed in form of data streams, we have to deal with several open problems. The most eminent are the high dimensionality of the data, problems related to comparison of very long time series and processing of the data under constraints faced when processing potentially infinite streams of data. From these problems, several opportunities arise in the field of data representation, dimensionality reduction and employment of methods from text processing in time series data analysis.
In our work, we address these problems and exploit these opportunities by proposing a symbolic representation of potentially infinite time series data and associated similarity measure. We explore applicability of proposed representation in various data analysis tasks such as classification or forecasting, with various types of short and long time series. We pay special interest to processing of the data under constraints imposed by requirements for stream data processing systems and we propose our approaches in accordance with these requirements.

Autoreferát dizertačnej práce zaslaný do vedeckého časopisu Information Sciences and Technologies - Bulletin of ACM Slovakia

Dizertačná práca je k nahliadnutiu na Študijnom oddelení FIIT STU.