티스토리 뷰
p-value 개념
p-value는 관측된 결과가 우연의 결과일 가능성을 결정하는 데 사용되는 통계적 측도입니다. 통계학에서 p-value은 귀무 가설이 정확하다고 가정할 때 관측된 통계 가설 검정 결과만큼이라도 극단적인 결과를 얻을 확률입니다. p-value은 귀무 가설이 기각되는 가장 작은 수준의 유의성을 제공하기 위해 기각점에 대한 대안의 역할을 합니다. p-value이 작을수록 대안 가설에 찬성하는 더 강력한 증거가 있음을 의미합니다. p-value은 귀무 가설이 참이라고 가정할 때 관측된 결과를 얻을 확률을 측정합니다. p-value이 작으면 관측된 차이의 통계적 유의성이 크다는 것을 알 수 있으며, p-value이 0.05 이하이면 일반적으로 통계적 유의성이 있는 것으로 간주됩니다. p-value은 가설 검정을 위해 사전에 선택된 신뢰 수준에 대한 대안으로 사용되거나 추가로 사용될 수 있습니다.
가설 검정에 대한 p-value 접근법
가설 검정에 대한 p-VALUE 접근법은 귀무 가설을 기각할 증거가 있는지 여부를 결정하기 위해 계산된 확률을 사용합니다. 귀무 가설은 추측으로도 알려져 있으며 모집단에 대한 초기 주장입니다. 대안 가설은 모집단 모수가 추측에 명시된 모집단 모수의 값과 다른지 여부를 나타냅니다. p-value을 사용하여 검정 가설의 두 가지 다른 결과를 비교하려면, 하나는 p-value이 0.04이고 다른 하나는 p-value이 0.06인 검정 결과가 두 개 있다고 가정합니다. 당연히 p-value이 0.04인 결과는 p-value이 0.06인 것보다 통계적으로 유의한 것으로 간주됩니다. 이 단순화된 예제를 넘어서 0.04의 p-value을 0.001의 p-value과 비교할 수 있습니다. 둘 다 통계적으로 유의하지만 0.001 예제는 0.04보다 귀무 가설에 대해 더 강력한 경우를 제공합니다.
p-value 장단점
먼저 장점에 대한 것입니다. 첫째, 의사결정 지원에 도움을 줍니다. 다양한 주장이나 실험자료에 대한 가설검정을 통한 증거기반 의사결정은 P값이 중요하며 주어진 시나리오와 관련된 증거에 접근하고자 하는 것입니다. 둘째, 가설 검정면에서 P-value는 가설 검정을 사용하여 주장의 타당성을 판단하고 유의성을 결정합니다. 가설에 고전적인 통계치가 포함되어 있지 않기 때문에 귀무 가설이 참일 확률에 의존하지 않습니다. 셋째, 유의성 탐지 측면입니다. P 값을 사용하면 유형 1의 오류가 증가하지만 숫자의 유의성을 탐지할 수 있는 더 많은 권한을 얻을 수 있습니다. 넷째, 데이터 비호환성 표시한다는 점입니다. 데이터가 특정 통계 모델과 어떻게 비호환되는지 보여줍니다. 데이터 집합 간의 모든 비호환성을 요약합니다. 다섯째, 일관성 측정이 가능합니다. p값은 시행을 통해 얻은 결과와 순수한 우연 사이의 일관성을 측정할 수 있을 뿐만 아니라 결과에 대한 자세한 설명을 제공할 수 있습니다. 여섯째, P값은 실험증거와 추론적 결론 사이에 명확한 구별을 보여줍니다. 또한 선행증거와 현재증거를 결합할 수 있는 틀을 제공합니다. 일곱째, 보고의 투명성을 높여줍니다. 연구자들이 적절한 추론을 얻기 위해서는 조사된 가설의 수, 자료 수집 결정, 수행된 통계 분석에 대한 전체 보고가 필요합니다. 여덟째, P값은 특히 귀무가설 유의성 검정에서 다양한 연구 분야의 통계 분석에 널리 사용됩니다. 이 분야에는 경제학, 금융학, 심리학, 사회학, 범죄학 등이 포함됩니다. 반면, 단점으로는 다음이 있습니다. 첫째, 데이터의 정확도 측면입니다. P값은 무작위 오류만 고려할 뿐 추정된 데이터의 정확도에 영향을 미치는 체계적인 오류는 고려하지 않습니다. 둘째, 상대적 위험이 있습니다. 연관성의 크기와 표본 크기에 따라 p-value이 결정됩니다. 표본 크기가 크면 연관성의 크기를 상쇄하여 통계적으로 유의한 결과를 얻을 수 있습니다. 셋쨰, 제한된 정보 측면입니다. P 값은 제공되는 정보의 제한으로 인해 모형이나 가설에 대한 좋은 증거 척도를 제공할 수 없으며, 가설을 검정하는 이유를 보여줄 수 없고 검정을 뒷받침하는 증거의 크기에 대한 정보가 없습니다. 넷쨰, 목적 방법일 뿐입니다. p-value을 사용하여 통계적 유의성을 결정하는 것은 귀무가설이 기각되어야 하는지 여부를 결정하는 목적 기법입니다. 다섯째, 값을 정량화합니다. p-value은 특정 정량화에서 임의성이 제거되었음을 보여주며 데이터 분석이 p-value을 계산하는 것으로 끝나면 안 됩니다. 여섯째, 결과의 중요성을 나타내는 것은 아닙니다. P값이 작든 크든 결과의 중요성이 없는지 또는 효과의 크기를 측정합니다. 표본 크기가 높으면 작은 효과가 작은 값을 생성할 수 있고 반대의 경우도 마찬가지입니다. 일곱째, 추론을 지원하지 않습니다. P값은 가설의 확률에 대한 추론 능력이 없습니다. 귀무 가설을 기각할지 여부를 결정하는 도구로만 사용됩니다. 마지막으로, 크기를 나타내지 않습니다. p-value은 관측된 효과의 크기 또는 중요도를 나타내지 않으므로 0.001보다 작은 p-value은 두 변수 간의 관계의 강도를 측정하지 않습니다.
'데이터 분석' 카테고리의 다른 글
PCA의 개념과 사용 목적, 제한 사항 및 주의점 (0) | 2023.11.09 |
---|---|
상관분석과 선형회귀의 공통점과 차이점 (2) | 2023.11.09 |
베이지안 머신러닝 개념, 추론 시 주의 사항, 적용 방법 (1) | 2023.11.08 |
지도 학습과 비지도 학습의 개념, 차이점 (0) | 2023.11.08 |
기술통계 정의, 주요 목적, 주의점 (0) | 2023.11.07 |