Toto téma sice není aktuální, ale je možné společnost
Profinit EU, s.r.o. kontaktovat
přes formulář se zájmem pro podobné téma.
Společnost
Profinit EU, s.r.o. přijímá návrhy témat studentů.
Práce si klade za cíl vytvořit model, který bude schopný generovat textový přepis lidské řeči pomocí odezírání z úst ve videu beze zvuku. Model by měl cílit na český jazyk a pro trénování může využít filmy s titulky nebo televizní vysílání s titulky.
Zdroje:
https://dspace5.zcu.cz/handle/11025/39247?locale=en
Lip Reading using Deep Neural Networks, Jan Horák 2018, CTU FIT
https://www.researchgate.net/profile/Stephen-Cox-17/publication/280624514_Improving_Lip-reading_Performance_for_Robust_Audiovisual_Speech_Recognition_using_DNNs/links/55bf891308ae092e9666988f/Improving-Lip-reading-Performance-for-Robust-Audiovisual-Speech-Recognition-using-DNNs.pdf