심슨의 역설과 데이터 분석의 함정
2025.05.14
1. 심슨의 역설
심슨의 역설은 데이터 분석에서 발생하는 모순적인 현상으로, 여러 그룹의 자료를 종합할 때와 각 그룹을 개별적으로 살펴볼 때의 결과가 상충하는 경우를 가리킵니다. 작은 그룹들의 특성이 큰 그룹의 결과에 영향을 미치는 상황에서 발생합니다. 이로 인해 각 그룹을 개별적으로 판단할 때와 전체 그룹을 합쳐서 판단할 때의 결과가 서로 다르게 나타납니다.
2. 심슨의 역설 발생 원인
심슨의 역설은 크게 두 가지 주요 요인에서 비롯됩니다. 첫 번째는 데이터 간의 상관 관계입니다. 작은 그룹들 간의 상관 관계가 다르게 작용하면 전...
2025.05.14