[이론 정리] 데이터 불균형

2023. 5. 10. 14:55AI/이론 정리

데이터의 불균형

 

데이터의 불균형으로 인해 과적합이 생길 수도 있다.

데이터의 불균형을 해결할 수 있는 방법

 

1. Under Sampling

Under Sampling은 데이터의 균형을 맞출 때 더 많은 개수의 데이터를 줄이는 방식이다.

2. Over Sampling

Over Sampling은 데이터의 균형을 맞출 때 더 적은 개수의 데이터를 높이는 방식이다.