Prejsť na obsah
dizertácie

Dovoľujeme si oznámiť, že dňa

25. 6. 2014 o 11.30 hod.

sa uskutoční na Fakulte informatiky a informačných technológií STU v Bratislave
Ilkovičova 2, v miestnosti 4.08 obhajoba dizertačnej práce

Ing. Juraja Pálfyho

Názov dizertačnej práce:     Analýza dysfluencií výpočtovou inteligenciou
Analysis of Dysfluencies by Computational Intelligence
Odbor:     9.2.9. Aplikovaná informatika

Školiteľ:

  • prof. RNDr. Jiří Pospíchal, DrSc., FIIT STU v Bratislave

Oponenti dizertačnej práce:

  • prof. Ing. Jozef Juhár, CSc., FEI TU v Košiciach
  • doc. Ing. Gregor Rozinaj, PhD. - FEI STU v Bratislave

Abstrakt:

    Práca prezentuje prehľad spracovania dysfluencií vo zvuku. Pomenuje adekvátne prístupy výpočtovej inteligencie na analýzu ľudskej reči. Prezentuje klasifikátory výpočtovej inteligencie na základe štatistických modelov a na báze optimalizácií nákladovej funkcie. Vyberá symptómy, ktoré sú pre našu tému zaujímavé a uvádza súčasný stav počítačovej analýzy zajakavej reči. Na experimentoch študuje umelé neurónové siete a Support Vector Machines pri riešení úloh rozpoznávaní jednoduchých dysfluencií. Na riešenie problému detekovania komplexných dysfluentných javov, hľadá inšpirácie v oblasti dolovania údajov a v oblasti bioinformatiky. Uvádza novú metodológiu na spracovanie dlhých neplynulých rečových intervalov na báze transformácií rečových signálov do symbolických sekvencií. Prezentuje nové algoritmy, schopné detekovať komplexné dysfluencie. Uvádza nové príznaky dysfluencií odvodené z výstupov našich nových algoritmov. Inšpiráciou z oblasti analýzy videosekvencií odvodzuje nové funkcie určené pre detekciu špecifických dysfluencií. Novú metodológiu symbolickej analýzy neplynulej reči, nové vlastnosti komplexných dysfluencií a nové algoritmy uvádza do vzájomného vzťahu s zavedenými riešeniami a štatisticky ich porovnáva.

    The work presents a contemporary perspective of the field of dysfluent speech processing. It deals with suitable approaches of computational intelligence to consider for speech analysis. It presents computational intelligence classifiers, based on probabilistic decision theory and classifiers based on cost function optimization. It selects the symptoms that are the subject of interest and describes the state-of-the-art of computer analysis in stuttered speech. In experiments it deals with Artificial Neural Networks and with Support Vector Machines, to solve the task of recognizing simple dysfluencies. In data mining and in bioinformatics looks for inspiration, to handle the problem of detecting complex dysfluent events. The proposed new methodology for processing long dysfluent speech intervals is based on the speech signal transformation into symbolic sequences. It presents new algorithms, able to detect complex dysfluencies. Moreover it derives new features of dysfluencies from the outputs of new algorithms. It borrows functions from the field of video sequence analysis to be applied and to help derive new functions designed to detect specific dysfluent events. The new methodology for symbolic analysis of dysfluent speech, the new features of complex dysfluencies and the new algorithms were related to previous methodologies and statistically compared.

    Autoreferát dizertačnej práce zaslaný do vedeckého časopisu Information Sciences and Technologies - Bulletin of ACM Slovakia

Dizertačná práca je k nahliadnutiu na Študijnom oddelení FIIT STU.