6. 표본과 경험적 분포#
표본은 분석의 관심의 대상이 되는 전체 자료의 일부분이다. 빅데이터 시데에 들어오면서 분석의 대상이 되는 전체 자료를 얻을 수 잇는 가능성이 점점 높아지고 잇다.
하지만 아직도 데이터과학에서 사용되는 대부분의 자료는 전체 자료의 일부분, 즉 표본으로 부터 얻는 자료인 경우가 대부분이다. 이번 장에서는 표본의 과학적인 추출 방법과 경험적 분포의 의미를 학습한다. 또한 표본이 지닌 불확실성을 계량할 수 있는 여러 가지 통계적 개념들을 알아볼 것이다.