728x90
    
    
  train 과 test 데이터에 동일한 데이터 피처가 주어졌는지 비교하는 법을 알아보겠습니다.
1. Set 빼기 이용
set(train.columns) - set(test.columns)파이썬 set 의 특징을 이용해서 train 에는 있지만 test에는 없는 열을 뽑아낼 수 있습니다.
2. Set difference 이용
set(train).difference(set(test))1번을 조금 변형한 형태입니다.
🧐 Train, Test간 데이터 동일 여부 비교
DataFrame.equals(Df) ==> True, False 반환
이 방법은 2개의 데이터 프레임이 동일한 값을 가지고 있는지를 쉽게 알수 있는 법입니다
>>> df = pd.DataFrame({1: [10], 2: [20]})
>>> df
    1   2
0  10  20
>>> exactly_equal = pd.DataFrame({1: [10], 2: [20]})
>>> exactly_equal
    1   2
0  10  20
>>> df.equals(exactly_equal)
True
(Source: Geeksforgeeks)728x90
    
    
  반응형
    
    
    
  'Data Science > Pandas, Numpy' 카테고리의 다른 글
| matplotlib 가로형 boxplot 그리는 법 (0) | 2022.10.12 | 
|---|---|
| 막대그래프에 레이블 달기 (plt.text) (0) | 2022.10.12 | 
| [ Pandas ] DataFrame, Series 함수 요약 정리 👀 (0) | 2022.10.06 | 
| [ Pandas ] DataFrame 컬럼 추가 / 삭제 방법 (1) | 2022.10.04 | 
| [ Pandas ] Filter 함수 적용하기 (0) | 2022.10.04 | 
 
										
									 
										
									
댓글