통계를 배우다 보면 가장 많이 듣게 되는 말 중 하나가 “p값이 0.05보다 작다”는 말이다. 하지만 이게 무슨 뜻인지 제대로 설명할 수 있는 사람은 많지 않다. 사실 p값은 계산보다 해석이 훨씬 어려운 개념이다.
p값은 이렇게 생각하면 된다.
내가 관찰한 결과가 사실은 아무런 차이도 변화도 없다는 전제 하에(=귀무가설=영가설이 참이라면) 우연히 나올 수 있는 정도를 수치로 표현한 것이다. 다시 말해 지금 내 눈앞에 있는 결과가 정말 “우연히 생긴 일”일 가능성이 얼마나 되냐는 질문에 대한 답이 바로 p값이다.
예를 들어, 어떤 수면보조제를 먹은 사람들이 평균적으로 잠을 더 잘 잤다고 하자. 그런데 이 차이가 정말 보조제 덕분인지 아니면 그냥 우연히 나온 차이인지는 쉽게 알 수 없다. 그래서 “보조제 효과는 없다”는 가정 하에 지금처럼 큰 차이가 우연히 나올 확률을 계산해 보는 것이다. 그 확률이 바로 p값이다.
만약 이 p값이 아주 작다면 우리는 이렇게 말할 수 있다.
“이 결과가 우연히 나타났을 가능성은 매우 낮다. 그러므로 보조제의 효과가 진짜일 수 있다.”
이런 식으로 p값은 결과의 ‘우연성’을 판단하는 기준이 된다.
하지만 p값이 작다고 해서 무조건 효과가 ‘크다’는 뜻은 아니다.
p값은 오직 “통계적으로 유의한가?”만 말해줄 뿐, 그 결과가 실질적으로 중요한지 효과가 얼마나 큰지는 말해주지 않는다. 그래서 p값과 함께 효과크기도 함께 해석하는 것이 중요하다.
퀴즈(quiz)
Q. 어떤 연구에서 수면보조제를 복용한 사람들과 복용하지 않은 사람들을 비교했더니, 복용한 집단이 평균적으로 더 오래 잤다. 연구자가 “보조제의 효과는 없다”는 가정 하에서 지금처럼 큰 차이가 우연히 나올 가능성을 계산했더니 p값은 0.004였다. 이 결과에 대한 올바른 해석은?
- 보조제가 수면에 미치는 효과는 통계적으로 유의하다고 볼 수 있다.
- p값이 작기 때문에 보조제는 모든 사람에게 효과가 있다.
- 보조제의 효과는 없다. 이 차이는 우연히 생긴 것이다.
- p값은 작지만 그 값이 작기 때문에 결과는 무의미하다.
정답: 1
해설: p값이 작다는 것은 “이 결과가 우연히 나타났을 가능성이 매우 낮다”는 뜻이며 이는 효과가 존재할 수 있다는 해석으로 이어진다. 다만 효과의 크기나 실질적 중요성은 별도로 해석해야 한다.
참고문헌(reference)
ⓒ 르네의 심리통계 | jamovi.ai
본 콘텐츠는 저작자에 의해 제작된 창작물이며 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스
(Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License, CC BY-NC-ND 4.0)에 따라 보호됩니다. 출처를 명시하시면 비영리 목적에 한해 공유가 가능하며 내용의 수정 또는 영리적 활용은 허용되지 않습니다.
통계를 배우다 보면 가장 많이 듣게 되는 말 중 하나가 “p값이 0.05보다 작다”는 말이다. 하지만 이게 무슨 뜻인지 제대로 설명할 수 있는 사람은 많지 않다. 사실 p값은 계산보다 해석이 훨씬 어려운 개념이다.
p값은 이렇게 생각하면 된다.
내가 관찰한 결과가 사실은 아무런 차이도 변화도 없다는 전제 하에(=귀무가설=영가설이 참이라면) 우연히 나올 수 있는 정도를 수치로 표현한 것이다. 다시 말해 지금 내 눈앞에 있는 결과가 정말 “우연히 생긴 일”일 가능성이 얼마나 되냐는 질문에 대한 답이 바로 p값이다.
예를 들어, 어떤 수면보조제를 먹은 사람들이 평균적으로 잠을 더 잘 잤다고 하자. 그런데 이 차이가 정말 보조제 덕분인지 아니면 그냥 우연히 나온 차이인지는 쉽게 알 수 없다. 그래서 “보조제 효과는 없다”는 가정 하에 지금처럼 큰 차이가 우연히 나올 확률을 계산해 보는 것이다. 그 확률이 바로 p값이다.
만약 이 p값이 아주 작다면 우리는 이렇게 말할 수 있다.
“이 결과가 우연히 나타났을 가능성은 매우 낮다. 그러므로 보조제의 효과가 진짜일 수 있다.”
이런 식으로 p값은 결과의 ‘우연성’을 판단하는 기준이 된다.
하지만 p값이 작다고 해서 무조건 효과가 ‘크다’는 뜻은 아니다.
p값은 오직 “통계적으로 유의한가?”만 말해줄 뿐, 그 결과가 실질적으로 중요한지 효과가 얼마나 큰지는 말해주지 않는다. 그래서 p값과 함께 효과크기도 함께 해석하는 것이 중요하다.
퀴즈(quiz)
Q. 어떤 연구에서 수면보조제를 복용한 사람들과 복용하지 않은 사람들을 비교했더니, 복용한 집단이 평균적으로 더 오래 잤다. 연구자가 “보조제의 효과는 없다”는 가정 하에서 지금처럼 큰 차이가 우연히 나올 가능성을 계산했더니 p값은 0.004였다. 이 결과에 대한 올바른 해석은?
정답: 1
해설: p값이 작다는 것은 “이 결과가 우연히 나타났을 가능성이 매우 낮다”는 뜻이며 이는 효과가 존재할 수 있다는 해석으로 이어진다. 다만 효과의 크기나 실질적 중요성은 별도로 해석해야 한다.
참고문헌(reference)
ⓒ 르네의 심리통계 | jamovi.ai
본 콘텐츠는 저작자에 의해 제작된 창작물이며 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스
(Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License, CC BY-NC-ND 4.0)에 따라 보호됩니다. 출처를 명시하시면 비영리 목적에 한해 공유가 가능하며 내용의 수정 또는 영리적 활용은 허용되지 않습니다.