디지털과 아날로그 통신
in University / Jekyll on Communications, Blog, Github, Pages, Jekyll, Spacy
디지털과 아날로그의 특성
- Analog System
- 품질이 우수하다
- 노이즈에 약하다
- 해상도에 제한이 없다
in University / Jekyll on Communications, Blog, Github, Pages, Jekyll, Spacy
in University / Jekyll on Communications, Blog, Github, Pages, Jekyll, Spacy
메모리를 사용한 채널코딩 방식이다 Covolutional Code와 Turbo Code로 나뉜다.
in projects / Jekyll on Blog, Github, Pages, Jekyll, Spacy
[논문] SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition
음성인식 모델 관련 논문을 찾아보면 SpecAugment가 대부분 사용되는 것을 볼 수 있다
SpecAugment 논문에 어떤 기법들이 제시되어 있는지 알아본다.
in projects / Jekyll on Blog, Github, Pages, Jekyll, Spacy
ASR Automatic Speech Recognition ASR 관련 논문을 읽기 위해 필요한 사전 지식들을 정리보았다 Librispeech에서 좋은 결과를 낸 ContextNet 논문을 예로 사용한다
in projects / Jekyll on Blog, Github, Pages, Jekyll, Spacy
ETRI에서 공개한 한국어 음성 인식 관련 논문이다
AI 허브에서 공개한 한국어 대화 데이터(KsponSpeech) 데이터셋을 사용한다
[논문] KsponSpeech: Korean Spontaneous Speech Corpus for ASR
[Link] https://www.mdpi.com/2076-3417/10/19/6936
in projects / Jekyll on Blog, Github, Pages, Jekyll, Spacy
ASR 음성인식의 정확성을 검증하는데 사용하는 Word-Error-Rate(WER)에 대해 알아보겠습니다. WER은
Levenshtein Distance
을 사용해 두 문장 간의 Distance를 계산합니다.
in projects / Jekyll on Blog, Github, Pages, Jekyll, Spacy
음성인식을 위해 알아야하는 Alignment 기법들, 그 중
RNN-T
에 대해 알아보겠습니다. Alex Graves의 RNN-T 논문을 참고했습니다 (https://arxiv.org/pdf/1211.3711.pdf)
Self-Attention을 배우기에 앞서 Attention 기법을 소개드립니다
밑바닥부터 시작하는 딥러닝2
를 참고 했습니다.
RNN에서 파라미터가 어떻게 학습하는지 알아볼 것 입니다.
in projects on Blog, Github, Pages, Jekyll, Spacy
설명된 블로그와 공식 페이지를 참고했습니다. 표와 같은 구조화된 데이터를 다루는데 Pandas를 이용한다면,
NLP
에서는 텍스트와 같이 구조화되지 않은 데이터를 다루는데SpaCy
를 사용합니다. 데이터 분석에 사용되는 spaCy 라이브러리를 소개합니다.