본문 바로가기
카테고리 없음

통계학 11. 통계학 구간추정: 추정의 오류 관리4

by 소곤소곤정보 2021. 6. 26.

자유도는 미지에 대한 대응에 대한 정보의 자유도와 비슷하다. 미지수가 확인되거나 관찰되거나 확인될 때마다 자유도는 하나씩 감소한다. 현재로서는, 그것은 간단하고, 마지막으로, 다른 미지의 정보에 의존하는 미지의 것은 자유도를 제공하지 않는다. a + b + c + d + e = 10이 설정되었을 경우, 마지막 e는 자유도를 제공하지 않기 때문에 자유도는 4에 불과하다. 왜냐하면 마지막 e는 자동적으로 식별되는 다른 미지 정보를 충족시키는 것에 의존하기 때문이다. 기본적으로 미지는 공동체가 없는 것이며 주어진 자유도 안에서는 악당처럼 무모하게 미지에 정보를 넣음으로써 공식을 깨뜨릴 수 없다. 그러나 그 이상으로, 당신은 정보를 자유롭게 넣을 수 없습니다. 왜냐하면나머지는이미완전히특정되어있거나우리가입력한정보에종속되어있기때문입니다. 물론 다른 미지수에 종속되는 여러 미지수가 있을 경우 하나를 더 많이 빼야 한다. 여기서 중요한 점은 표본분산에는 하나의 종속미지수가 있으며 표본분산에 기초한 22-분포와 t-분포도 종속미지수를 유지한다는 것이다.

어쨌든 이 정도의 자유도(k=n-1)에 따라 t-분포 형태가 달라지는데 좋은 소식이 있다. 시료가 충분히 클 경우(n3030) t분포의 형상은 정규분포의 깨끗한 벨 형상에 한없이 가깝고 실제로는 n=300000으로 이미 겹쳐 있어도 정규분포와 시각적으로 구별하기 어렵다. 따라서 t-값이 사용되는지, z-값이 충분히 큰 샘플에서 사용되는지는 중요하지 않습니다. 문제는 표본이 너무 작을 경우(n<30) 대칭 벨의 형태는 안정적으로 유지되지만 자유도가 작아질수록 중심 윗부분이 낮아져 양쪽 꼬리가 굵어진다는 점이다. 연속확률변수는영역별확률을얻는다는것,기억하세요.0.95의 t-분포 영역은 같은 95% 신뢰수준에서 부호를 삽입해도 중간이 밀리기 때문에 정규 분포 영역보다 좌우가 넓습니다. 실제로 정규 분포는 1.96의 위치에 부호를 배치하고, t-분포는 자유도(k=n-1)에 따라 양쪽 주소로 조금 떨어진 위치에 t-값의 부호를 배치한다. 샘플사이즈가 20미만이 되면 주소는 2.xxx로 계속 이동하고 샘플사이즈가 3(k=2)일 경우 먼 거리의 4.30으로 이동합니다. 이는 표본이 작음에도 불구하고 필요한 신뢰수준을 충족할 정도로 구간을 넓게 유지할 수밖에 없으며 t 분포는 표본의 크기에 민감하게 구간을 조정하는 좋은 분포임을 의미한다.

따라서 t-분포를 이용해 신뢰구간을 계산하는 것은 전술한 것보다 약간 복잡하다. 위에서는 z-value를 식별하기 위해 중요도()가 어느 정도 필요한지만 알면 된다. 그러나 t-value를 이용하려면 중요도 외에 자유도(k=n-1)에 관한 정보가 필요하다.(). 물론 여기서의 자유도는 샘플 사이즈에서 1만 차감됩니다. 단, z분포표를 이용해 z값을 구하므로, t분포표를 따로 이용해 종렬로부터 원하는 유의레벨에 대응하는 열을 읽어내고 횡렬로부터 자유도를 구한다. 물론 t-값을 자동으로 검색하는 웹사이트도 있다.

 

t-분포표의 경우 표본이 12(n=12)인 작은 표본이고, 필요한 유의수준이 0=0.05인 경우 간격의 양쪽에 기호를 배치해야 하기 때문에 우선 세로줄 0.025를 적용하여 구한다. 자유도가 11(k=12-1=11)에 해당하기 때문에, 두 조건을 충족시키는 t-값은 t(0.025, 11)=2.201이 된다. 샘플이 같은 중요도 레벨로 충분히 큰 경우,±1.96 주소가 됩니다. z값으로 부호를 작성하는 것은 가능했으나 샘플사이즈가 작기 때문에 주소2.201로 t값이 넓은 부호를 삽입하는 초안이 작성되었다. 그 결과 같은 장벽이 적용됐음에도 불구하고 추정 구간이 더 늘어났다.

또한, 상기와 같이 모집단의 분산 정도를 모르고 t-분포를 필요로 하는 하위 샘플의 상황을 추정하는 경우가 많다. 따라서 표준편차()는 간격을 추정할 때 그대로 사용되는 것이 아니라 표본의 표준편차(s)를 사용한다. 위와 같이, 표본 분산(s2)은 특별한 것이며, 근원 표본 표준 편차(s)는 특별한 것인 샘플 분산(s)은 특별한 것이다. 추정의 편리성을 배제하고 자유를 희생하고 꾸준한 기능을 하고 온 통계이다. 따라서 친표준 편차 대신 간판 위치 결정장치로 사용하는 것이 불편함을 인정할 수 있다(). 어쨌든 구간 추정식은 P(m-t(k2, k) snnμ≦+m+t(/2, k) sn) [=1-k(%)이고, 오차의 허용 한계는 t=t(%2, k) sn)이다.

댓글