본문 바로가기

데이터 사이언스/데이터 분석

변수 선택(Feature Selection)

인과관계를 기준으로 종속변수에 유의미한 영향을 미칠 것으로 생각되는 독립변수를 선택하는 과정

 

<상관관계 vs. 인과관계>

상관관계

  • 두 가지 사건에 연관성이 존재하는 상태
  • X가 증감할 때 Y가 증감하는 정도를 나타내는 관계

인과관계

  • 특정한 사건이 다른 사건에 직접 영향을 미치는 상태
  • X가 먼저 발생하였을 때, Y가 어떻게 변하는지에 따라 Y에 영향을 주는 X를 설명하는 관계

<독립변수 vs. 종속변수>

독립변수(Independent Variable)

  • 다른 변수에 영향을 받지 않고 종속변수에 영향을 주는 변수
  • 측정되거나 의도적인 변화가 가능한 입력 변수
  • X의 값으로 사용되는 변수

종속변수(Dependent Variable)

  • 독립변수의 영향을 받아 변화하는 종속적인 변수
  • 인과관계 등으로 도출된 결과값 또는 예측값
  • Y의 값으로 사용하는 변수