Prejsť na obsah
Témy dizertačných prác

v odbore Softvérové inžinierstvo

 

Školitelia a témy pre prijímacie konanie v ak. roku 2015/16

Doktorandské štúdium na Fakulte informatiky a informačných technológií STU

prof. Ing. Mária Bieliková, PhD.

  1. Správanie sa človeka v digitálnom priestore webu
    Efektívne vykonávanie úloh v digitálnom priestore webu, ako vyhľadávanie a odvodzovanie informácií, učenie sa, využívanie služieb či komunikácia, významne ovplyvňujú kvalitu života. Digitalizácia sa šíri do všetkých oblastí života a klasický Web sa stáva aj Webom ľudí, miest a vecí. Zároveň narastá vnútorná zložitosť digitálnych priestorov: počet a zložitosť služieb a nástrojov, ktoré pracujú nad neustále rastúcim množstvom dát. Otvára sa priestor pre skúmanie nových modelov a metód získavania a spracovania informácií dôležitých pre pochopenie informačného správania sa človeka v digitálnom priestore. Pozornosť možno upriamiť na automatickú analýzu informačného správania sa na základe indikátorov (implicitnej/explicitnej) spätnej väzby, následne odvodenie záujmov, charakteristík či problémov pri práci v digitálnom priestore, vytvorenie predikcie správania a definovanie prispôsobenia obsahu, navigácie alebo rozhrania. Vzhľadom na vybavenie UX labu je tu možnosť zapojenia nových signálov implicitnej spätnej väzby, ako je sledovanie pohľadu či fyziologické ukazovatele. Výskum možno smerovať aj do skúmania vplyvu používateľských rozhraní na správanie sa človeka v digitálnom priestore webu, čo môže vyústiť do nových metód návrhu používateľských rozhraní.
  2. Sprístupňovanie informácií na sociálnom adaptívnom webe
    Explózia informácií na webe, rozšírenie webu a teda aj nárast používateľov a premena webu na aktívny digitálny priestor vytvára nové otvorené problémy v oblasti návrhu metód inteligentného vyhľadávania, prehliadania, odporúčania, navigácie a prezentácie obsahu v rozsiahlych otvorených aj uzavretých digitálnych priestoroch s využitím znalosti ich sémantiky a/alebo sociálneho správania sa človeka. Skúmajú sa metódy získavania a/alebo objavovania sémantiky automaticky alebo aj manuálne, najmä metódami využívajúcimi sociálne správanie používateľov – konzumentov informácií. Objavovanie vzťahov v sociálnych sieťach, skúmanie vplyvu správania sa používateľov, dynamiky vzťahov na možnosti lepšie automaticky odhadnúť informačné potreby používateľa a sprístupňovať informácie v prostredí viacerých kontextov a pre rôzne typy zariadení. Pre viaceré úlohy je relevantné aj skúmanie problémov spojených s prácou s rozsiahlymi dátami, čo môže tvoriť samostatné smerovanie výskumu. Perspektívne smerovanie je skúmanie implicitnej spätnej väzby a jej potenciálu pre zlepšenie práce s informáciami v špecifických doménach, ako je napr. vývoj programov, vzdelávanie alebo pre špecifické skupiny, ako napr. starších ľudí. Podstatnú zložku tu tvorí aj skúmanie používateľského zážitku a jeho vplyvu na riešené úlohy.

doc. Mgr. Daniela Chudá, PhD.

  1. Rozpoznanie podobnosti textov, programových kódov
    Podobnosť textov a programových kódov je možné využiť pri skúmaní rozpoznania opisovania, či určenia autorstva, ako aj pri skúmaní kvality verzií. Pri rozpoznaní podobnosti textov, programových kódov sa riešia problémy predspracovania textu, tokenizácie programového kódu, rozpoznania čiastočnej podobnosti s “indexom zahmlievania”, určovanie výslednej podobnosti, problémy vizualizácie podobnosti. Potenciál skúmania je vo výpočte zahmlievania, automatickom určení zdroja opisovania, pri podobnosti programových kódov v identifikovaní plagiátorských operácií. Úpravou textu v prirodzenom alebo programovacom jazyku získame podobný text, relácia medzi nimi však nie je symetrická. Problémom je definovanie takejto relácie. V závislosti od definície treba hľadať vhodné spôsoby vyjadrenia a vizualizácie výslednej podobnosti.
  2. Model používateľa pre jeho identifikáciu
    Biometrické charakteristiky ako dynamika písania na klávesnici, dynamika práce s myšou, aktivity vykonávané v počítačovom systéme sú charakteristické pre používateľa. Môžeme ich použiť pri modelovaní používateľa pre identifikáciu, pre rozpoznanie emocionálneho stavu, detekcii počítačových skúseností. Potenciál skúmania je v oblasti budovania používateľských profilov pri práci v počítačovom systéme, pri identifikácii používateľa, pri zvyšovaní presnosti používateľského profilu pre rôzne typy používateľov.

doc. RNDr. Mária Lucká, PhD.

  1. Analýza a modelovanie v prostredí veľkých dynamických dát
    Súčasná doba je charakterizovaná produkovaním obrovského množstva dát, ktorých zložitosť neustále narastá a ich spracovanie je v záujme mnohých odborníkov, napr. v oblasti techniky, obchodu, prírodných vied, medicíny a bioinformatiky. Výskum v oblasti spracovania veľkých dátových korpusov sa orientuje predovšetkým na odhaľovanie nielen nových poznatkov a súvislostí, ale aj efektívnych metód a nástrojov rýchleho spracovania dát. Okrem spracovania veľkých statických súborov sú zaujímavé aj prístupy práce s dynamickými dátami, kde sa objavujú nové metódy zohľadňujúce inkrementálny charakter dát, napríklad výskum v oblasti prediktívneho modelovania zahŕňa vývoj rôznych adaptívnych techník pre prúdy dát. Tvorba prediktívnych modelov má svoje miesto napríklad pri návrhu a modelovaní inteligentných sietí, kde sa kladie veľký dôraz na presnosť predikcie, reflektovanie veľkého objemu dát, rýchlosť zmien a ich rôznorodosť. Na dosiahnutie škálovateľnosti a spracovanie v reálnom čase sa využívajú moderné metódy práce s veľkými dátami, založené na mohutných paralelných nástrojoch distribuovaného spracovania dát.
  2. Analýza a získavanie informácií z veľkých distribuovaných dátových súborov
    Veľké dátové súbory, distribuované na rôznych miestach siete, sú vzhľadom na ich objem, rôznosť a premenlivosť náročné na spracovanie klasickými metódami, a tak sú výzvou pre hľadanie nových metód a softvérových nástrojov pri získavaní významných údajov a informácií. V prípade distribuovaných dát je často využívaným paralelným rámcom MapReduce (Hadoop, Spark), s cieľom maximálneho využitia pôvodného umiestnenia dát, paralelného spracovania a minimalizácie komunikačných nárokov. Ešte zaujímavejšou výzvou je výskum v oblasti hľadania efektívnych metód, ktoré sú schopné pomocou analytických nástrojov odhaliť rôzne súvislosti skryté v dátach a význam vygenerovaných údajov. Inteligentná analýza vedie často k riešeniu úloh dolovania dát, ich klastrovaniu a hľadaniu vzorov vo veľkých dátach. Tu sa otvára priestor pre hľadanie nových prístupov, efektívnych algoritmov a nástrojov, ktoré sú kľúčové pre inteligentnú analýzu veľkých dát. Úspešné vyriešenie projektu môže byť prínosom aj pre výskum v príbuzných vedeckých oblastiach, napr. spracovania bioinformatických dát a dát z oblasti počítačovej bezpečnosti.

prof. Ing. Pavol Návrat, PhD.

  1. Prieskumné prechádzanie informačného priestoru
    Vyhľadávanie na základe dopytu je postup vhodný pre niekoho, kto vie dosť presne, akú informáciu hľadá. Mnohokrát ľudia nevedia presne, čo chcú. Informačný priestor webu, zahŕňajúci množstvo digitálnych zdrojov (knižníc) obsahuje často nielen cieľovú informáciu, ktorú sa bude chcieť záujemca dozvedieť, ale aj informácie a poznatky, ktoré mu pomôžu vyjasniť si, čo ho zaujíma. Z v podstate jednorazového aktu vyhľadávania dopytom sa stáva proces, v ktorom sa záujemca prechádza informačným priestorom hľadajúc, čo bude vyhľadávať. Táto prieskumná fáza zahŕňa sprístupňovanie, čítanie a analýzu zdrojov (dokumentov) a prelína sa s vyhľadávaním. Treba skúmať, aká metóda by podporila (navigovala, odporúčala atď.) záujemcu ujasňujúceho si, čo ho zaujíma.
  2. Práca s informáciami na webe v individuálnom aj sociálnom kontexte
    Práca s informáciami (vyhľadávanie, odporúčanie a pod.) na webe je stále dosť neefektívna. Jednou z ciest, ako takéto činnosti ho urobiť presnejšími alebo viac pokrývajúcimi, je urobiť ich informovanejšími. Napríklad pri vyhľadávaní je jedným úzkym hrdlom tvar dopytu, pozostávajúci zo zopár slov. Pritom používateľ zanecháva po sebe zvyčajne mnoho stôp, z ktorých by sa dalo usúdiť, čo presnejšie hľadá. Medzi také potenciálne užitočné informácie patria informácie o kontexte, v ktorom sa vyhľadávanie deje vrátane záujemcových preferencií (personalizácia) alebo odporúčaní sociálnej skupiny podobných ľudí (grupizácia). Ďalšie informácie o používateľovi a jeho záujme môžeme získať, ak vyhodnotíme vhodne zvolené údaje o jeho správaní sa pri práci na webe napríklad sledovaním jeho pohľadu alebo vo všeobecnosti akejkoľvek sledovateľnej interakcie používateľa na rozhraní so zariadením v minulosti známym ako počítač, mobilný telefón a podobne. Takého informácie môžu byť základom pre model používateľa, avšak s rastúcou mierou kolaborácie, prepojenia a sociálnej komunikácie stúpa aj dôležitosť poznania ďalších vlastností používateľa. Napríklad akekoľvek vyjadrenie nejakého používateľa bude tým dôveryhodnejšie, čím vyššiu dôveru má k nemu čitateľ toho vyjadrenia. Treba navrhnúť vhodné modely takýchto pojmov pre prostredie webu, v ktorom interagujú ľudia, ktorí sa možno vôbec nepoznajú, aj keď sa povedzme označujú za priateľov.
  3. Analýza rozsiahlych korpusov dát
    So zlepšujúcimi sa možnosťami získavania (snímania, rozpoznania, extrakcie apod.) dát z najrôznejších procesov alebo systémov (organizmov) prudko narástlo množstvo dát, ktoré máme o príslušnom systéme alebo procese k dispozícii. Zvyšuje sa možnosť vyťažiť z nich nové informácie o sledovaných procesoch alebo skúmaných systémoch alebo aj objaviť o nich nové znalosti. Príkladmi rozsiahlych korpusov dát sú množiny fragmentov DNA. Rozsiahle prúdy dát vznikajú napríklad zbieraním dát snímaných dlhodobo v čase a na mnohých miestach.
    Pri analýze a spracovaní veľkých množín dát statického charakteru (fragmenty DNA) je nevyhnutné hľadanie nových modelov, ktoré dokážu rýchlo a efektívne spracovávať veľké dátové súbory. Navrhované modely sa môžu zamerať na paralelné spracovanie veľkého množstva distibuovaných dát.
    Prúdové dáta sú charakterizované rýchlym, často asynchrónnym pribúdaním. V prípade, ak nie sú tieto dáta uložené, alebo ihneď spracované sú stratené. Príkladmi týchto typov dát sú hodnoty automaticky merané zo senzorov, meračov, prúd klikov pri prehliadavaní webu. Metódy analýzy a spracovania prúdových využívajú obmedzené množstvo pamäte, obmedzený čas potrebný na spracovanie dát a v určenom časovom okamihu sú schopné poskytnúť sledovanú informáciu. V tejto oblasti sa často skúmajú úlohy analýzy časových radov, klasifikácie, zhlukovania, predikcie, detekovanie zmien a anomálií.
  4. Skúmanie používateľa riešiaceho problém prostredníctvom webového rozhrania
    Ľudia čoraz viac riešia problémy v prostredí webu. Nemáme teraz na mysli len všetkých tých, ktorí vyhľadávajú odpoveď na svoj problém na webe. Poskytovanie vzdelávania všeobecne a učenia sa programovania zvlášť sa čoraz viac posúva do interakcie cez rozhranie, ktoré je prístupné prostredníctvom webu. Podpora zefektívnenia používateľovho úsilia vyžaduje spoznanie domény, v ktorej sa riešia problémy. Navrhovanie metód zefektívnenia môže od domény závisieť. Aj spôsoby interakcie, t.j. obojstranného odovzdávania informácií cez rozhranie, vrátanie vhodných spôsobov vizualizácie, môžu ovplyvniť efektívnosť používateľovho úsilia. Nevyhnutné je však dozvedieť sa viac o používateľovi samotnom, čo vedie k vytvoreniu vhodného modelu používateľa. S ním môžeme lepšie skúmať napríklad v prípade učenia sa programovania schopnosť programovať, algoritmicky myslieť, rýchlosť učenia sa. Všeobecnejšie možno skúmať napr. metódy verifikovania používateľa, rozpoznania niektorých jeho osobnostných čŕt alebo odhadovania jeho úspešnosti v riešení problému.

doc. Ing. Viera Rozinajová, PhD.

  1. Analýza veľkých objemov dát
    Súčasná doba je charakterizovaná generovaním veľkého množstva dát rôznych typov, ktoré je potrebné efektívne spracovávať. Informácie obsiahnuté v nich často pomáhajú podporiť presnosť a správnosť výstupov v procesoch rozhodovania, čím sa dáta stávajú „novodobým zlatom“. V tomto ohľade je dôležité neustále zefektívňovanie celého životného cyklu veľkých objemov dát – od ich získania, organizácie a uloženia až po analýzu a použitie. Zaujímavé sú najmä nové prístupy k dátovej analýze, ktoré umožňujú inteligentné získavanie informácií z dostupných dát, odhaľovanie skrytých vzťahov, hľadanie rôznych súvislostí, atď. Vývoj v oblasti analytiky je v súčasnej dobe veľmi dynamický – od deskriptívnej a prediktívnej analýzy, ktoré tu sú už nejakú dobu, sa v súčasnosti prechádza k preskriptívnej analýze, kde ide nielen o rôzne typy prognóz, ale aj o návrh možných rozhodnutí a ukázanie ich pravdepodobných dôsledkov.
    Aktuálnou výzvou je návrh nových prístupov k analýze rozsiahlych objemov údajov, zachytenie nových trendov v tejto oblasti a ich aplikovanie na vybraný problém dátovej analýzy.

doc. Ing. Valentino Vranić, PhD.

  1. Pokročilá modulárnosť softvéru
    Aspektovo-orientovaný vývoj softvéru úspešne rieši niektoré záležitosti modulárnosti softvéru. Po určitú úroveň toto tiež platí pre prístupy, ktoré nie sú explicitne označené ako aspektovo-orientované počnúc prípadmi použitia a vlastnosťami ako analytickými a návrhovými konceptmi po určité mechanizmy programovacích jazykov ako sú črty (traits), otvorené triedy (open classes) alebo prototypy. Potrebné je skúmať ďalej modulárnosť softvéru vzhľadom na ich nasadenie v priebehu životného cyklu vývoja softvéru vo všeobecnosti a v rámci špecifických prístupov ako rady softvérových výrobkov, vývoj založený na rolách, vývoj založený na komponentoch, vývoj vnorených systémov, vývoj mobilných aplikácií, modelovanie biznis procesov, vývoj založený na službách atď., vrátane toho, ako je ovplyvnená a ako vplýva na organizáciu vývoja softvéru.
  2. Zachovanie zámeru v priebehu vývoja softvéru
    Špecifikačné a analytické artefakty sa takmer úplne rozplývajú v návrhových modeloch a kóde. Anotačné techniky určite môžu zlepšiť ich sledovateľnosť. Dômyselnejší prístup zahŕňa použitie aspektovo-orientovaného programovania na modularizáciu kódu podľa prípadov použitia. DCI (Data, Context, and Interaction) redukuje fragmentáciu zámeru v objektovo-orientovanom programovaní a tiež zachováva podstatnú časť prípadov použitia v kóde. Na úrovni kódu možno použiť doménovo špecifické jazyky na udržanie programovania bližšie k doménovým abstrakciám alebo – v širšom zmysle – mentálneho modelu koncového používateľa. Toto môže tiež zahŕňať netextové formy, ako v tzv. intenčnom programovaní (intentional programming). Je tu viac otvorených výskumných otázok, ako sú či tieto prístupy možno zlepšiť, či môžu spolupracovať, či je iný, lepší spôsob zachovania zámeru vo vývoji softvéru, alebo až či organizácia vývoja softvéru – agilného a úsporného (lean) zvlášť – ovplyvňuje zachovanie zámeru.
  3. Agilná a úsporná (lean) organizácia vývoja softvéru
    Aj keď sa organizácia vývoja softvéru môže javiť ako hlavne technická záležitosť, kľúčom k nej je predsa človek. Agilné a úsporné (lean) prístupy – a Scrum obzvlášť – ťažia z prirodzene pozitívneho vzťahu ľudí k práci zdôrazňujúc rolu človeka ako jednotlivca, ale ešte viac interakcie ľudí, ktorá sa dá úspešne vyjadriť organizačnými vzormi. V tomto zmysle je potrebné skúmať spôsoby a podporu nasadenia agilných a úsporných prístupov vzhľadom na špecifické podmienky organizácie a prístupov k vývoju softvéru, ako aj ich vzťah k technikám a technológiám vývoja softvéru.