플로라도의 data workout
신뢰수준 95%의 의미 본문
신뢰수준(confidence level)은 아마도 고교 통계 시간에서부터 접하는 개념으로,
데이터 사이언스 분야에서는 파라미터의 추정치에 관하여 신뢰할 수 있는 정도를 알고자 할때 사용되곤 하는 것 같다.
그런데 여기서 신뢰(confidence)라는 것은 사실은 묘한 뉘앙스인 것이
정확(precise)과 믿을 수 있는(reliable)것의 중간적인 성격이다.
신뢰수준이라는 개념을 배울때 처음에 반드시 헷갈리는것이
"신뢰수준 95%의 의미는 신뢰구간에 95%의 확률로 모평균이 포함될것이다." 라는 해석을 내놓는 것이다.
이 말의 의미를 조금 더 살펴보면, 95%확률이라는 것은 대게 100번중 95번은 모평균이 저 신뢰구간에 포함될 수 있다는 말인데, 어떻게 결정된 값인 모평균이 확률적으로 저 구간에 포함될 수도 있고, 안될수도 있다는 말인가?
무언가 이상함을 느끼는가?
이러한 해석은 엄밀한 해석이 아니며, 사실 정반대로 이해하고 있는것과도 같다.
무엇이 잘못되었는지 알기 위하여, 신뢰구간은 어떤 방식으로 구해지는지 상기해보자.
신뢰구간을 구하기 위해서는,
1. 먼저 표본을 추출한다.
표본이라는 것은 모집단에서 특정한 방법에 의해 샘플링된 집합이다. (기왕이면 bias없이 랜덤하게 샘플링 되었으면 좋겠다. 라던지의 꼬투리가 붙는다.)
2. 이후 통계량을 계산한다.
통상 통계량이라는 것은 표본 데이터로부터 구할 수 있는 표본 평균과 표본 비율 등이 있다.
3. 신뢰구간을 계산한다.
신뢰구간의 계산은 구한 통계랑과 표준 오차, 그리고 특정 신뢰수준에 해당하는 Z값(95%의 경우 널리 알려진 1.96)이나 t값(t분포 이용)을 사용하여 신뢰구간을 계산한다. Z값을 이용하면 Z검정 통계량이 되고, t값을 이용하면 t검정 통계량이 된다.
\begin{equation}
Z = \frac{(\bar{x} - \mu)}{\left(\frac{\sigma}{\sqrt{n}}\right)}
\end{equation}
\begin{equation}
t = \frac{(\bar{x} - \mu)}{\left(\frac{s}{\sqrt{n}}\right)}
\end{equation}
여기서 신뢰수준은 같은 모집단에서 같은 방법으로 무작위 표본을 여러번 추출하여 각각에 대해 신뢰구간을 계산했을 때, 계산된 신뢰구간 중 실제 모수를 포함하는 비율로 정의된다.
예를 들어, 100번의 다른 표본추출에서 95% 신뢰구간을 계산하면, 이 중 약 95개의 신뢰구간이 모집단의 실제 평균을 포함할 것이라는 해석이다.
일반적으로 신뢰수준은 실험자의 판단에 따라 90%, 95%또는 99%를 설정하곤 하는데 일반적으로는 주로 95%사용한다.
만약 신뢰수준을 99%로 사용하면 마치 모평균에 대하여 대단히 "정확한" 신뢰구간인 것처럼 해석할 여지가 생기는데, 오히려 정반대이다.
만약 신뢰구간을 100%라고 생각해보자. 신뢰구간이 100%가 되기위해서는 범위가 어떻게 되어야할까?
바로 $ \infty$에서 $-\infty$ 범위이다.. 모든 범위에 걸쳐야지만, 이 구간안에 반드시 모평균이 존재하게 된다.
그런데 어떤 값이 무한대의 범위에 존재한다고 말하면, 이것이 의미가 있는걸까?
마찬가지이다. 95%의 신뢰수준에서 99%의 신뢰수준으로 파라미터를 추정하는 것은, 파라미터를 점점 '보수적으로' 추정을 하는 것이다. 따라서 해당 파라미터값이 정말 '정확한'값이라고 말할 수 있는 근거는 없다.
따라서 적절한 신뢰구간의 선정이 중요하며, 대게는 95%를 사용하는 것이다.
Reference)
'기초 노트 > 인공지능 수학' 카테고리의 다른 글
marginalize의 의미 (0) | 2024.04.22 |
---|---|
샘플링(Sampling)과 리샘플링(Resampling) (0) | 2024.03.06 |
고유값(eigen value)와 고유벡터(eigen vector)에 대해 설명해주세요. 그리고 머신러닝에서 왜 중요할까요? (0) | 2024.03.04 |
빈도 주의자와 베이지언 주의자 그리고 불확실성(uncertainty) (5) | 2024.03.01 |
함수의 4가지 종류 -일변수 스칼라함수, 일변수 벡터함수, 다변수 스칼라함수, 다변수 벡터함수 (0) | 2023.06.18 |