Bakalárska práca

Názov práce

Prepis hovorenej reči, podpora slovenského jazyka.

Vedúci práce

RNDr. Erik Bruoth, PhD.

Ciele

  1. Analyzovať existujúce prístupy STT
  2. Vytvoriť tréningovú sadu pre úlohu pomocou dostupných zdrojov (napr.audio knihy)
  3. Identifikovať open source implementácie modelov (min. 2) rozpoznávania reči (STT)
  4. Navrhnúť stratégiu treningu modelov a ladenia hyperparametrov
  5. Základne porovnanie modelov na základe vybraných metrík resp. popis hlavných problémov.

Literatúra

  1. Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft https://web.stanford.edu/~jurafsky/slp3/edbook_oct162019.pdf)
  2. Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning (http://www.deeplearningbook.org)
  3. Jacob Eisenstein. Natural Language Processing
  4. http://web.stanford.edu/class/cs224n/
  5. https://github.com/espnet/interspeech2019-tutorial
  6. https://github.com/mozilla/DeepSpeech open source

Prezentácie

Prezentácia PBS (8.4.2020)

Prezentácia BZP1a (5.11.2020)

Motivácia

Motivačná esej

Článok 1

Článok (25.01.2021)

Článok 2

Článok (18.04.2021)

Poster

Poster (02.05.2021)