Dovoľujeme si oznámiť, že dňa
11. 7. 2018 o 11.00 hod.
sa uskutoční na Fakulte informatiky a informačných technológií STU v Bratislave
Ilkovičova 2, v miestnosti 3.08 obhajoba dizertačnej práce
Mgr. Petra Laurinca
Názov dizertačnej práce:
Vplyv reprezentácií časových radov a zhlukovania na spresňovanie predpovedí
Improving Forecasting Accuracy through the Influence of Time Series Representations and Clustering
Odbor: 9.2.6 Informačné systémy
Školiteľ: doc. RNDr. Mária Lucká, PhD. - FIIT STU v Bratislave
Oponenti dizertačnej práce:
prof. RNDr. Valerie Novitzká, PhD. - FEI TU v Košiciach
doc. Ing. Pavel Kordík, Ph.D. - FIT ČVUT v Prahe
Abstrakt:
Získavanie a objavovanie znalostí z veľkých údajových množín je progresívna oblasť informatiky a štatistického učenia vďaka rýchlemu nasadzovaniu technológií založených na údajoch zo spoločností a výskumných inštitúcií. Údaje z časových radov sú jedným z mnohých typov takto získavaných údajov. Sú vytvorené zo zdrojov ako senzory, ekonómia, alebo energetika. Inteligentná sieť je ekosystém vytvorený z inteligentných meračov, ktoré dokážu kontrolovať veľkosť spotreby elektrickej energie alebo aj veľkosť výroby, zhromažďujúc veľké množstvo údajov. Tieto informácie je možné použiť pri rozhodovaní o regularizácii výroby, alebo predpovedaní budúcich stavov.
V našej práci sa zameriavame na zlepšenie procesu objavovania znalostí na predpovedanie veľkého množstva časových radov alebo predpovedanie časového radu pomocou veľkého množstva časových radov. Pre túto úlohu používame metódy analýzy časových radov ako reprezentácie časových radov a zhlukovanie. Pri tejto úlohe berieme do úvahy niekoľko netriviálnych problémov spojených s charakterom údajov z inteligentných meračov ako rýchlo pribudajúce dáta, vysoko zašumený charakter alebo viacnásobné sezónnosti. Hlavným príspevkom tejto práce je navrhnutie nových metód reprezentácie časových radov pre efektívnejšie spracovanie sezónnych časových radov a tiež nové adaptabilné predikčné metódy pre časové rady.
The knowledge extraction and discovery in large databases is an progressive area of computer science and statistical learning thanks to the rapid deployment of data-driven technologies in companies and research institutions. Time series data is one of the many types of stored data. They are created from sources as sensors, economy and power engineering. A smart grid is an ecosystem created from smart meters that can control or monitor electricity load or both load and production, collecting a large amount of time series data. This information can be used to make important decisions for the regularisation of production, and forecasting future states and monitoring.
In our work, we focus on improving the data mining workflow for forecasting a large amount of time series or forecasting the time series with the help of a large amount of time series data. For this task, we are using time series data mining methods as time series representations and clustering for creating more predictable groups of time series. We are taking into account many non-trivial challenges connected with the character of smart meter data such as fast coming data, the highly noisy character and multiple seasonalities. The main contributions of this work are developed new time series representation methods for more efficient processing of seasonal time series and new adaptable forecasting methods.
Autoreferát dizertačnej práce zaslaný do vedeckého časopisu Information Sciences and Technologies - Bulletin of ACM Slovakia.
Dizertačná práca je k nahliadnutiu na Študijnom oddelení FIIT STU.