본문 바로가기
Data Science

데이터 타입별 컬럼 구분하기 ✔

by Queen2 2022. 10. 12.
728x90
반응형

1. Dict 형태 + group by

type_summary = {str(i):list(j) for i,j in train.groupby(train.dtypes,axis=1)}
{'int64': ['bd',  'bh'],
 'float64': ['mss', 'rvd'],
 'object': ['id','dayweek']}

 

groupby를 통해서 쉽게 분류를 할 수도 있지만 반환값이 가독성이 별로 좋지 않다는 단점이 있습니다.

 

2. 조건식 만들기 (dtype)

filtered = df.dtypes[df.dtypes == np.object]
list_cols = list(filtered.index)

 

만약 활용도를 높이고 싶다면 for 문을 통해서 전체 데이터 타입별 해당하는 column을 뽑을 수 있을 것 같습니다

 

3. select_dtypes

이건 제가 이번에 찾은 방법인데 아예 조건에 맞는 데이터 프레임을 만드는 법입니다

 

int_col = train.select_dtypes(include=['int64'])
float_col = train.select_dtypes(include=['float64'])
object_col = train.select_dtypes(include=['object'])

이런식으로 각 데이터타입별 데이터프레임을 만들면 columns를 통해 열을 뽑을 수도 있고,

분석이 좀 더 간편해져서 좋은 것 같습니다.

 

 

728x90
반응형

댓글