Announcement of the defence of the dissertation of Ing. Igor Jánoš
Dovoľujeme si oznámiť, že dňa 28. novembra 2024 o 10.00 hod.
sa uskutoční na Fakulte informatiky a informačných technológií STU v Bratislave, Ilkovičova 2, 842 16 Bratislava, v miestnosti č. 2.06, obhajoba dizertačnej práce/
We would like to announce that on 28 November 2024 at 10:00 a.m. will be held at the Faculty of Informatics and Information Technology STU in Bratislava, Ilkovičova 2, 842 16 Bratislava, in room No. 2.06, the defence of the doctoral thesis of a PhD student
Ing. Igora Jánoša/
Ing. Igor Jánoš
Názov dizertačnej prác/Thesis title:
Použitie hlbokých neurónových sietí vo futbale/
Application of Deep Neural Networks in Football Domain
Odbor/Study field: Informatika/Computer Science
Študijný program/Study program: Aplikovaná informatika/Applied informatics
Školiteľ/Supervisor: prof. Ing. Vanda Benešová, PhD. – FIIT STU v Bratislave
Abstrakt/Annotation:
Výskum v oblasti počítačového videnia zaznamenal v priebehu desaťročí pozoruhodný pokrok, ktorý výrazne ovplyvnil rôzne sektory spoločnosti. Techniky počítačového videnia výrazne zlepšili automatizáciu, efektivitu a bezpečnosť v priemysle. V zdravotníctve tieto algoritmy zohrávajú kľúčovú úlohu pri diagnostikovaní vážnych ochorení.
Táto práca sa zameriava na oblasť športu, kde je presnosť a rýchlosť algoritmov kľúčová. Skúmame problém šošovkového skreslenia obrazu v doméne futbalových záznamov. Na jeho riešenie sme vytvorili špeciálny dataset a stanovili preň základné výsledky pomocou najmodernejších metód z literatúry založených na hlbokých neurónových sieťach. Naše zistenia naznačujú, že oprava menších skreslení je oveľa náročnejšia ako oprava výrazných skreslení. Ukazujeme, že presnosť korekcie šošovkového skreslenia je možné zlepšiť využitím dodatočnej úlohy pri učení, ktorá zabraňuje pretrénovaniu a vedie k lepšej generalizácii. Okrem toho navrhujeme penalizačný člen na zlepšenie presnosti korekcie veľmi jemného šošovkového skreslenia. Náš výskum sa tiež zaoberá praktickým problémom registrácie futbalového ihriska. Vytvorili sme nový dataset, ktorý je tisíckrát väčší než predchádzajúce verejne dostupné datasety, ako napríklad WorldCup 2014, a obsahuje obrázky s presnými homografiami založenými na reálnych futbalových panorámach. Zavádzame náhradný kalibračný vzor, ktorý extrahuje korešpondencie bodov z futbalových obrázkov so subpixelovou presnosťou. Využitím týchto korešpondencií môžeme spoľahlivo a presne odhadnúť homografiu medzi futbalovým obrázkom a hracím polom.
Naša metóda preukázala schopnosť efektívnejšie sa učiť z náročných dát v porovnaní s inými najmodernejšími technikami a výrazne ich prekonala. Tento výskum má významné praktické dôsledky pre športový priemysel, inšpiruje nové aplikácie a pokroky.
Computer vision research has made remarkable strides over the decades, significantly influencing various sectors of society. Computer vision techniques have markedly improved automation, efficiency, and safety in the industry. In healthcare, these algorithms play a vital role in diagnosing severe diseases.
This work concentrates on the sports domain, where the precision and speed of algorithms are critical. We investigate the issue of radial lens distortion in football images. To address this, we
have compiled a special dataset for correcting radial lens distortion and established baseline results using existing methods based on deep neural networks. Our findings indicate that correcting minor distortions is far more challenging than addressing severe ones. We demonstrate that incorporating a secondary learning task can enhance the accuracy of radial lens distortion correction, preventing overfitting and fostering better generalization. Additionally, we propose a penalty term to improve the accuracy of minor radial lens distortion correction.
Our research also delves into the practical problem of football field registration. We have developed a newly published dataset that is a thousand times larger than previously available public
datasets, such as the WorldCup 2014, and includes images with accurate ground truth homographies generated from real football panoramas. We introduce a surrogate calibration pattern that
extracts point correspondences from football images with subpixel precision. By leveraging these correspondences, we can robustly and accurately estimate the homography between the football image and the playing field. Our method has been shown to learn more effectively from challenging data compared to other state-of-the-art techniques, surpassing them by a significant margin. This research has significant practical implications for the sports industry, inspiring new applications and advancements.