본문 바로가기
Data Science/Pandas, Numpy

DataFrame 열(Columns) 비교하기 (train,test 피처 차이 비교)

by Queen2 2022. 10. 12.
728x90
반응형

train 과 test 데이터에 동일한 데이터 피처가 주어졌는지 비교하는 법을 알아보겠습니다.

 

1. Set 빼기 이용

set(train.columns) - set(test.columns)

파이썬 set 의 특징을 이용해서 train 에는 있지만 test에는 없는 열을 뽑아낼 수 있습니다.

 

2. Set difference 이용

set(train).difference(set(test))

1번을 조금 변형한 형태입니다.

 

 

🧐 Train, Test간 데이터 동일 여부 비교

DataFrame.equals(Df) ==> True, False 반환

 

이 방법은 2개의 데이터 프레임이 동일한 값을 가지고 있는지를 쉽게 알수 있는 법입니다

>>> df = pd.DataFrame({1: [10], 2: [20]})
>>> df
    1   2
0  10  20

>>> exactly_equal = pd.DataFrame({1: [10], 2: [20]})
>>> exactly_equal
    1   2
0  10  20

>>> df.equals(exactly_equal)
True

(Source: Geeksforgeeks)
728x90
반응형

댓글