p값(p-values)은 생물의학(biomedical) 등의 연구 논문에서 가장 일반적으로 보고되는 통계 데이터 유형 가운데 하나입니다. 가설 검정에서 p값은 “귀무가설(null hypothesis, 영가설, 변수 간에 무관함을 설명. 연구자들이 이를 무효화하고자 증거 수집)에 대한 증거의 강도를 측정하는 척도”로, 귀무가설이 참이었을 때 결과가 나올 수 있는 가능성을 나타냅니다. 일반적으로 p값은 연관성, 그룹 간의 차이 등이 우연에 의한 것인지 연구 중인 변수에 의한 것인지를 알려줍니다.
연구자들은 일반적으로 유의성 임계값으로 알려진 p값(.05, .01 또는 .001)에 대한 컷오프 값을 설정합니다. 얻은 p값이 이 임곗값 아래로 떨어지면 해당 결과는 "통계적으로 유의미한" 것으로 간주됩니다.
p값은 연구 논문에서 일반적으로 사용되지만, 논문에서 강력하고 유용한 증거를 제공하도록 신중하게 보고해야 합니다. 다음은 연구자들이 명심해야 하는 몇 가지 핵심 사항입니다.
학술 논문에서 p값을 보고하는 요령
- "유의함"을 설명하는 모든 변화, 차이 또는 관계에 대해 p값을 제공합니다.
- 가능하면 정확한 p값을 제공하되, 값이 매우 작으면, "P < .001"이라 해도 무방합니다.
- 방법 섹션에서 유의 임곗값과 해당 수준을 선택한 이유를 설명합니다.
- 검정 통계량(t, F 등), 보정 또는 회귀 계수(Pearson's r, Spearman's p 등) 또는 효과 크기 측정값을 제공합니다.
- "P = 0.000"를 피합니다. P 값은 기술적으로 0과 동일할 수 없습니다. 일부 소프트웨어 프로그램은 자동 절삭 또는 반올림하여 "P = 0.000"으로 출력합니다. "P < .001"이라 말할 수 있습니다.
p값 보고 방법
p값 보고 방법에 대한 몇 가지 예시를 살펴보겠습니다.
1) 피해야 하는 방식:
We found a significant relationship between dietary fiber intake and systolic blood pressure (p < .05).
(식이 섬유 섭취와 수축기 혈압 사이에 유의한 관계(p < .05)를 확인하였습니다.)
독자들은 이 관계가 우연 때문일 가능성이 낮다는 것을 알 수 있지만, 이 관계의 강도나 방향을 알 수 없습니다(식이 섬유 섭취가 높은 참가자들이 수축기 혈압이 낮은지 또는 높은지).
해결: 위 문장 끝의 괄호 안에 "r=-.78"을 추가하면, 독자는 이를 강한 역관계라는 것을 이해할 수 있습니다. 독자들이 실제 발견 내용에 대해 더 정확한 이해를 할 수 있게 됩니다.
2) 피해야 하는 방식:
We found a significant difference in mean HbA1c levels between the smoker and non-smoker groups (P < .05).
(흡연자와 비흡연자 모집단 간의 평균 HbA1c 수준에서 상당한 차이(P < .05)가 있음을 발견했습니다.
독자는 실제로 이 차이가 얼마나 큰지 인지할 필요가 있습니다. 가령, 0.1 미만의 평균 HbA1c 차이는 흡연 상태가 HbA1c 수준의 유의한 차이를 설명하지 않음을 의미합니다. 또한, 독자들은 어떤 통계 검정 방법을 사용하여, 이 차이를 계산하였는지 알 수 없습니다.
해결: 두 모집단에 대한 실제 평균 HbA1c 수준을 제공하고, 검정 통계량(t, F 등)을 포함합니다.
위의 예시에서 보실 수 있듯이, 실제로 유용하지 않더라도, 통계적으로 유의할 수 있습니다. "통계적 유의성"은 반드시 결과가 임상적으로 유의미하거나 실용적 관점에서 중요하다는 것을 의미하지는 않습니다. p값은 독자에게 연구 결과에 대해 약간의 정보를 제공하지만, 양질의 증거가 포함된 영향력 있는 연구 논문을 작성하시려면, p 값 이상의 증거를 보고하셔야 합니다.
더 읽을 거리
Submitted by