Prejsť na obsah
dizertácie

Dovoľujeme si oznámiť, že dňa

29. 1. 2014 o 13.15 hod.

sa uskutoční na Fakulte informatiky a informačných technológií STU v Bratislave
Ilkovičova 2, v miestnosti 3.08 obhajoba dizertačnej práce

Ing. Tomáša Kramára

Názov dizertačnej práce:     Utilizing Leightweight Semantics for Search Context Acquisition in Personalized Search
Odbor:     9.2.5. Softvérové inžinierstvo

Školiteľ:

  • prof. Ing. Mária Bieliková, PhD., FIIT STU v Bratislave

Oponenti dizertačnej práce:

  • RNDr. Marek Ciglan, PhD. - ÚI SAV Bratislava
  • prof. Ing. Ján Paralič, PhD. - FEI TU v Košiciach

Abstrakt:

    Vyhľadávač potrebuje na zodpovedanie dopytu nájsť textové zhody medzi dopytom a dokumentmi a potom ich usporiadať tak, aby najrelevantnejšie výsledky boli na horných priečkach zoznamu. Ideálne zoradenie výsledkov je také, ktoré rozumie používateľovmu zámeru – cieľu, ktorý je vyjadrený formou kľúčových slov dopytu – a radí výsledky tak, že na horných priečkach sú dokumenty, ktoré súvisia s používateľovým cieľom. Aby sme vedeli porozumieť zámeru používateľa, musíme porozumieť sémantike dopytov a výsledkov. Existuje viacero prístupov, ktoré používajú sémantiku, sú však ťažkopádne, vyžadujú externé bázy znalostí a sú ťažko implementovateľné v tak dynamickej doméne, ako je otvorený Web. V tejto práci sa sústredíme na všadeprítomnú sémantiku vo forme kľúčových slov pochádzajúcich z výsledkov vyhľadávania. Navrhujeme flexibilný model kontextu založený na metadátach dokumentov a navrhujeme metódy, ktoré ho zužujú na krátkodobý kontext, alebo naopak, rozširujú ho dodatočnými dátami od podobných používateľov. Identifikovali a experimentovali sme s niekoľkými zdrojmi kontextu: časový kontext vo forme vzorov správania sa používateľov, kontext aktivity vo forme predošlých dopytov a sociálny kontext vo forme podobnosti medzi používateľmi.

    In order to answer a query, the search engine has to find full-text matches in the background document corpus and then rank them so that the more relevant results are placed higher in the list. An ideal ranking function should understand user’s intent – the goal that is expressed via the query keywords, and order the results such that the results matching user’s intent are ranked higher. To understand the user’s intent, we need to understand the semantics of the queries and the documents. There are various approaches that leverage semantics, but they are heavy-weight, require external knowledge bases and are very hard to implement in a highly dynamic, open corpus domain, such as the Web. In our work, we focus on the omnipresent lightweight semantics coming from the search result documents. We propose a flexible metadata-based context model and propose methods that scope it to the short-term interests or expand it with additional data. We identify and experiment with several sources of search context: temporal context in form of behavioral search patterns, activity-based context in form of past queries and social context in form of user similarity.

    Autoreferát dizertačnej práce zaslaný do vedeckého časopisu Information Sciences and Technologies - Bulletin of ACM Slovakia

Dizertačná práca je k nahliadnutiu na Študijnom oddelení FIIT STU.