개요
이번에 새로 추가한 기능에 대한 결과가 어땟어? 와 같은 내용을 증명하려면 인과추론에 대한 지식이 있어야한다.
상관관계와 인과관계
상관관계
두 변수가 얼마나 상호 의존적인지 파악하는 것을 의미 한 변수가 증가하면 다른 변수도 따라서 증가 혹은 감소하는가?
역인과관계의 오류
평소 특정 원인과 결과에서 관계가 존재한다 혹은 존재하지 않는다로만 판단하여, 의사결정하는 경우가 많음. 대표적으로 상관관계만으로 잘못된 판단한 사례중 1940년대 보건 전문가의 소아마비와 아이스크림 섭취간의 연구결과가 있음
당시 보건 전문가는 소아마비와 아이스크림 섭취량에 상관관계가 있음을 발견하고 소아마비 예방을 위해 아이스크림 섭취량을 줄일 것을 권고함
하지만 소아마비는 여름에 많이 발병하고 아이스크림 또한 여름에 판매량이 급증하여 아무런 관계가 없다는 것이 밝혀짐
인과관계
하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미, 원인과 결과가 명확한 것을 인과 관계라고 함 수많은 상관관계 속에 하나의 명확한 인과관계가 존재함
Ladder of Causality
Association, Prediction (연관성)
- 서로 연관성이 높은 현상들을 찾음
- 현상들 간의 연관성과 추세를 바탕으로 예측
Invention
- 어떤 행동을 취했을 때, 그 영향과 결과를 예측
Imaging, Counterfactual
- 시나리오 형태로 상황을 가정하여 서술
인과관계 추정 방법
A/B 테스트를 적용하기 어려울때는 어떻게 인과관계를 추정할까. 좋은 실험 설계를 바탕으로 A/B test 를 진행할때, 이벤트로 인한 효과를 가장 정확하게 측정할 수 있다. (이벤트로 파생된 다른 외부 변수가 존재하지 않을 경우에)
A/B 테스트를 진행할 수 없는 경우
- A는 실험군, B는 대조군일 때 실험군의 행동이 대조군에게까지 영향을 미치는 구조이기 때문에 명확한 인과관계를 파악하기 어려움
- A 피드에만 어떤 실험이 적용되어서 상품을 구매했다 했을때 B와 A가 팔로우 관계일 경우 B도 A가 클릭한 상품이 피드에 노출되어서 구매할 경우
Quasi-experiment: A/B test 를 할 수 없을 때의 대안들
Quasi 실험은 준-실험 또는 유사 실험이라고 부름
'기타' 카테고리의 다른 글
[API 명세 포멧을 이용한 API 디자인] (0) | 2024.02.21 |
---|---|
[IntelliJ] - 단축키 (0) | 2024.02.21 |
[UGC moderation] (0) | 2024.02.08 |
[Service Discovery] (0) | 2024.02.01 |
[IAC] (0) | 2024.01.27 |