Inverse Transform Sampling

컴퓨터는 어떻게 특정 확률분포에서 샘플을 간단한 함수 호출만으로 생성할 수 있을까? 확률분포란 특수한 환경에서 관측된 데이터들이 어떤 통계적 패턴을 가지는지 수학적으로 기술한 모델이다. 컴퓨터에서 이런 물리적 상황을 그대로 시뮬레이션하는 방식으로 확률변수 샘플을 얻을 수도 있지만, 이러한 접근은 일반적으로 비효율적이거나 경우에 따라서는 불가능한 경우도 많다. 그렇다면 컴퓨터에서는 어떻게 Gaussian이나 chi-square와 같은 다양한 확률분포의 샘플을 효율적으로 생성할 수 있을까? 그 해답이 바로 Inverse Transform Sampling 기법이다.

Continue reading

Data Regularization

딥러닝 모델은 입력과 출력 사이의 패턴을 학습하고 학습된 패턴을 기반으로 새로운 입력에 대해 적절한 출력을 예측한다. 그리고 다양한 입력에 대해 잘 일반화(generalization)하기 위해 다양한 상황를 포함한 충분한 데이터가 필요하다. 하지만 실제로 모든 상황을 고려한 입력을 수집하는 것은 불가능하기 때문에 제한된 입력으로만 학습이 되는 경우가 많다. 데이터가 부족 하면 모델은 사전에 접한 입력에만 출력을 예측하고 새로운 입력에 대해 제대로 응답을 예측 못할 수 있다. 이러한 과적합 (overfitting) 현상을 완화하기 위해 실제로는 모델 복잡도를 조절하거나 학습을 안정화하는 다양한 정규화 (regularization) 기법들이 사용된다. 이번 포스트에서는 최근 모델에서 일반적으로 사용되는 다양한 정규화 기법들을 자세히 살펴본다.

Continue reading

마크다운 사용해보기

이번 포스트에서는 깃허브 블로그 작성에 사용되는 마크다운(Markdown) 에 대해 알아본다. 마크다운은 처음 접할 때는 문법이 다소 낯설게 느껴질 수 있지만, 한 번 익숙해지고 나면 HTML과 같은 다른 웹 기반 언어보다 훨씬 간결하고 편리하게 문서를 작성할 수 있다. 특히 코드 블록, 링크, 이미지, 표와 같은 요소들을 간단한 문법만으로 표현할 수 있어 기술 문서나 개발 블로그 작성에 널리 사용된다. 이번 글에서는 이러한 마크다운의 기본 문법과 실제 블로그 작성에서 자주 사용되는 기능들을 함께 살펴본다.

Continue reading

20210604 Git version 3.20.0 오류

GitHub 블로그를 구축하는 과정에서 발생한 Git 에러와 그 해결 방법을 정리하고자 한다. Git 블로그에서는 로컬에서 수정한 포스트를 GitHub에 반영하기 위해 git push 명령어를 사용한다. 그러나 git push를 처음 사용하는 과정에서 OpenSSH 인증 단계로 넘어간 뒤, 서버가 응답하지 않는 문제가 발생할 수 있다. 본 포스트에서는 해당 문제 상황에서 출력되는 Git 디버깅 로그를 살펴보고, 이를 기반으로 해결 방법을 설명한다.

Continue reading

Pagination


© 2021.06. by ekspertos

Powered by Ekspertos