각종 적색표본평균(m)이 모집단평균(m)을 정확히 충족시키지 못했지만 신뢰도 95% 수준에서 모집단표준편차(), 표본사이즈(n)를 이용해 모집단평균()을 포함하는 데 성공했다. 장벽이 99%로 높아지면 100회 중 한 번만 선발되기 때문에 이런 까다로운 요구에 부응하려면 구간을 늘려야 한다. 반대로 허들을 90%로 낮추면 사람은 틀릴 수 있는 모드가 트리거 됩니다).좁은 섹션에서는 더 대담하게 추정할 수 있습니다. 키 73~273㎝, 키 172.5~173.5㎝ 정도의 농담 등 '정확하고 믿을 만한' 극단적인 상황은 아니더라도 장벽의 높이는 중간 정도의 타협의 문제다. 어쨌든 구간 추정이 포인트 추정보다 우월하다는 점은 추정치가 틀렸을 수 있다는 불확실성을 인식하고 체계적으로 관리함으로써 책임 있는 추정치를 만들 수 있다는 점이다.
상기 그림은 이 링크상에서 똑같이 시뮬레이트할 수 있습니다. 좌측의 방법에서는, 평균, 법선, z에 시그마, ==0, ==10, n=30, 간격=20, 신뢰도를 각각 95%로 설정해, 상기와 같은 화상을 표시합니다. 반복해서 클릭할 때마다 모든 20이 수집 평균을 포함하는 경우도 있고, 두 개 또는 세 개의 실수를 포함하는 경우도 있는데 하단의 Running Total은 필요한 신뢰 수준으로 서서히 조정됩니다. 검정을 위해 모집단 표준편차()와 표본사이즈 (n)를 조정하면 단면길이에도 영향을 미치는 것으로 확인됩니다. 오른쪽 아래의 표본통계로부터도 매개변수를 포함한 일반표본(■)이 비모수의 "표본"(■)보다 훨씬 많은 것을 알 수 있습니다.
그러나 위에서 설명한 바와 같이 이러한 방식으로 추정하는 전략이 어려울 수도 있다. 첫째, 사실 우리는 인구의 본질에 대해 잘 모릅니다. 달리 말하면 사람들은 종종 인구가 얼마나 분산되어 있는지 모르고 추정하려고 한다. 하지만 샘플이 크면 이 문제는 무시할 수 있다. 표본 크기가 충분히 클 경우(n3030) 평균 표본 분포의 분산은 모집단의 분산이 작은지 큰지에 크게 영향을 받지 않기 때문에 정규 분포를 가정하고 z 값을 자신 있게 사용할 수 있습니다. 한편 표본이 너무 작으면(n < 30) 모집단의 분산도가 평균 표본분포의 분산을 흔들어 극단적인 분산치가 튀어나올 수 있다. 극단적이지만 흔한 분산치 패턴은 벨형 곡선을 깨 표본 분포의 정규성을 위반할 위험이 있다.
그러나 어쨌든 이 두 상황에 있는 사람들이 가정해야 하는 것은 문제다. 다행히 오래 전에 양조장에서 일하던 똑똑한 직원이 있어 이런 위험을 피하기 위해 정규 분포와 비슷한 장작을 나눠주고 있었습니다.우리는 "T"라는 확률 변수를 고안해냈습니다. 이 확률 변수가 그리는 분포를 t-distribution이라 부른다. 그 후 작은 샘플을 활용할 필요가 있을 때 누구나 일련의 t분포만을 사용했다. 이 때문에 현대사회통계교육과정에서도 작은 표본일 때는 값이 아닌 t값을 사용한다는 t분포를 기다리는 자유도라는 복병이 있어 문제가 되고 있다.
자유도 개념은 통계적으로 가장 설명하기 어려운 개념 중 하나로 여겨지고 있으며, 현재도 많은 교수와 강사가 문과 학생에게 설명하는 방법을 모색하고 있다(…[ 실제로 t-분포에 자유도가 도입된 것은 상기 각주에서 간단히 소개한 -2-분포에서 유래하여 t-분포 자체가 자유도의 영향을 받아 형태를 바꾸기 때문이다. 어쨌든 먼저 분포의 자유도는 기본적으로 표본 사이즈 (n)로부터 1을 뺀 값(k=n-1)이다. 위의 불쾌도 추정에서 설명한 것처럼 표본분산은 완전히 치우침이 없는 친분산 추정에만 정의되며 수학적 순도는 약간 낮은 (…) 기묘한 분산이다. 표본분산은 정확히 친분산을 가리킨다는 전제에 달려 있다. 그 결과, 관측치의 분산을 「기술적」으로 할 때 자유도에 관계되지 않았던 평균 계산이, 여기서 우리의 자유도를 하나 희생시켜, 부모 분산을 「추정」하는 부담을 지웠다.
댓글