SpecAugment: A Simple Data Augmentation Method

[논문] SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

음성인식 모델 관련 논문을 찾아보면 SpecAugment가 대부분 사용되는 것을 볼 수 있다

SpecAugment 논문에 어떤 기법들이 제시되어 있는지 알아본다.

Continue reading

Into Automatic Speech Recognition

ASR Automatic Speech Recognition ASR 관련 논문을 읽기 위해 필요한 사전 지식들을 정리보았다 Librispeech에서 좋은 결과를 낸 ContextNet 논문을 예로 사용한다

Continue reading

KsponSpeech: Korean Spontaneous Speech Corpus for ASR

ETRI에서 공개한 한국어 음성 인식 관련 논문이다

AI 허브에서 공개한 한국어 대화 데이터(KsponSpeech) 데이터셋을 사용한다

[논문] KsponSpeech: Korean Spontaneous Speech Corpus for ASR

[Link] https://www.mdpi.com/2076-3417/10/19/6936

Continue reading

WER with Levenstein Distance

서론

ASR 음성인식의 정확성을 검증하는데 사용하는 Word-Error-Rate(WER)에 대해 알아보겠습니다. WER은 Levenshtein Distance을 사용해 두 문장 간의 Distance를 계산합니다.

Continue reading

RNN Transducer Review

서론

음성인식을 위해 알아야하는 Alignment 기법들, 그 중 RNN-T에 대해 알아보겠습니다. Alex Graves의 RNN-T 논문을 참고했습니다 (https://arxiv.org/pdf/1211.3711.pdf)

Continue reading

Attention Mechanism

서론

Self-Attention을 배우기에 앞서 Attention 기법을 소개드립니다 밑바닥부터 시작하는 딥러닝2를 참고 했습니다.

Continue reading

spaCy 패키지 정리

개요

설명된 블로그공식 페이지를 참고했습니다. 표와 같은 구조화된 데이터를 다루는데 Pandas를 이용한다면,
NLP에서는 텍스트와 같이 구조화되지 않은 데이터를 다루는데 SpaCy를 사용합니다. 데이터 분석에 사용되는 spaCy 라이브러리를 소개합니다.

Continue reading

Pagination


© 2021.06. by ekspertos

Powered by theorydb