728x90
반응형
train 과 test 데이터에 동일한 데이터 피처가 주어졌는지 비교하는 법을 알아보겠습니다.
1. Set 빼기 이용
set(train.columns) - set(test.columns)
파이썬 set 의 특징을 이용해서 train 에는 있지만 test에는 없는 열을 뽑아낼 수 있습니다.
2. Set difference 이용
set(train).difference(set(test))
1번을 조금 변형한 형태입니다.
🧐 Train, Test간 데이터 동일 여부 비교
DataFrame.equals(Df) ==> True, False 반환
이 방법은 2개의 데이터 프레임이 동일한 값을 가지고 있는지를 쉽게 알수 있는 법입니다
>>> df = pd.DataFrame({1: [10], 2: [20]})
>>> df
1 2
0 10 20
>>> exactly_equal = pd.DataFrame({1: [10], 2: [20]})
>>> exactly_equal
1 2
0 10 20
>>> df.equals(exactly_equal)
True
(Source: Geeksforgeeks)
728x90
반응형
'Data Science > Pandas, Numpy' 카테고리의 다른 글
matplotlib 가로형 boxplot 그리는 법 (0) | 2022.10.12 |
---|---|
막대그래프에 레이블 달기 (plt.text) (0) | 2022.10.12 |
[ Pandas ] DataFrame, Series 함수 요약 정리 👀 (0) | 2022.10.06 |
[ Pandas ] DataFrame 컬럼 추가 / 삭제 방법 (1) | 2022.10.04 |
[ Pandas ] Filter 함수 적용하기 (0) | 2022.10.04 |
댓글