Prejsť na obsah
dizertácie

Dovoľujeme si oznámiť, že dňa

8. 2. 2017 o 13.00 hod.

sa uskutoční na Fakulte informatiky a informačných technológií STU v Bratislave
Ilkovičova 2, v miestnosti 3.08 obhajoba dizertačnej práce

Ing. Máriusa Šajgalíka

Názov dizertačnej práce:
Modelling Text Semantics
Modelovanie sémantiky textu

Odbor: 9.2.6 Informačné systémy

Školiteľ: prof. Ing. Mária Bieliková, PhD. - FIIT STU v Bratislave

Oponenti dizertačnej práce:
doc. Ing. Peter Butka, PhD. - FEI TU v Košiciach
doc. RNDr. Michal Laclavík, PhD. – Magnetic, s. r. o.

Abstrakt:

V rámci dizertačnej práce sa zameriavame na modelovanie sémantiky textu. Identifikujeme dva podciele, ktoré sa zameriavajú na modelovanie abstraktnej sémantiky textu. Zatiaľ čo prvý podcieľ je orientovaný na modelovanie všeobecnej sémantiky textu, druhý cieľ sa sústredí na diskriminačnú sémantiku, ktorá môže mať vyššiu informačnú hodnotu.
Náš príspevok môžeme rozdeliť na tri časti. Najprv navrhujeme metódu modelovania abstraktnej sémantiky textu prostredníctvom kľúčových konceptov a ukazujeme ako sa zlepšuje oproti štandardným metódam extrakcie kľúčových slov. Ako druhý príspevok navrhujeme metódu modelovania diskriminačnej abstraktnej sémantiky textu, ktorá využíva kategorizované textové dokumenty. Ukazujeme ako lepšia reprezentácia sémantiky textu dokáže zlepšiť výsledky v porovnaní so súčasnými metódami, ktoré dosahujú najlepšie výsledky, aj v prípade použitia tradičných kľúčových slov. Nakoniec navrhujeme prístup ako modelovať záujmy používateľa s využitím našej metódy na extrakciu diskriminačných kľúčových slov, ktorý vyhodnocujeme na reálnych zašumených dátach v rôznych doménach.

In the dissertation, we focus on modelling text semantics. We identify two sub-goals, which aims at modelling abstract text semantics. While the first sub-goal is oriented on modelling the general text semantics, the second sub-goal is focused on the discriminative semantics, which can possibly be of more information value. Besides proposing new methods to fulfil these sub-goals, we also examine a practical application of our proposed method of discriminative keyword extraction.
Our contribution can be split into three parts. First, we propose a method to model abstract text semantics via key-concepts and show how it improves over standard keyword extraction methods. As a second contribution, we propose a method to model discriminate abstract text semantics, which is based on categorised text documents. We show how better representation of text semantics can improve over state-of-the-art methods in text categorisation even with traditional keywords. Finally, we propose an approach to modelling user interests using our method of discriminative keyword extraction, which is evaluated on real-world noisy data in diverse domains.

Autoreferát dizertačnej práce zaslaný do vedeckého časopisu Information Sciences and Technologies - Bulletin of ACM Slovakia

Dizertačná práca je k nahliadnutiu na Študijnom oddelení FIIT STU.