Into Automatic Speech Recognition

ASR Automatic Speech Recognition ASR 관련 논문을 읽기 위해 필요한 사전 지식들을 정리보았다 Librispeech에서 좋은 결과를 낸 ContextNet 논문을 예로 사용한다

서론

다음 글들을 해석할 수 있을 정도의 지식을 습득하는 것이 목표 이다

* 80 dimensional filterbank
* 25ms Window
* 10ms stride

* sentencepiece
* presented by BERT

* Leveinstein Distance

* time warp
* frequency mask
* time mask

* used with beamsearch