5. 분포와 확률#

데이터는 분석하는 경우 자료가 어떤 형태로 집중이 되어 있는지, 얼마나 넓게 퍼져있는지를 파악하는 것이 중요하다. 자료의 분포에 대한 시각적인 분석과 기초 통계량을 이용한 요약은 데이터 과학의 첫 걸음이다.

자료의 분포가 지닌 다양한 특성을 파악하는 기초적인 방법을 알아보면서 우리는 일상에서 접할 수 있는 분포들이 정규분포와 매우 유사하게 나타난다는 사실도 확인할 것이다. 우리는 정규분포가 만들어지는 과정을 우연성과 확률 실험을 통해서 확인할 것이며 이는 현실에 나타나는 데이터의 분포의 특성을 이해하는 중요한 열쇠를 제공한다.

더 나아가 우연성과 가능성을 과학적으로 다룰 수 있는 도구인 확률의 기본개념과 기초적인 계산법에 대하여 공부하고자 한다.