데이터 타입별 컬럼 구분하기 ✔

728x90

1. Dict 형태 + group by

type_summary = {str(i):list(j) for i,j in train.groupby(train.dtypes,axis=1)}

{'int64': ['bd',  'bh'],
 'float64': ['mss', 'rvd'],
 'object': ['id','dayweek']}

groupby를 통해서 쉽게 분류를 할 수도 있지만 반환값이 가독성이 별로 좋지 않다는 단점이 있습니다.

2. 조건식 만들기 (dtype)

filtered = df.dtypes[df.dtypes == np.object]
list_cols = list(filtered.index)

만약 활용도를 높이고 싶다면 for 문을 통해서 전체 데이터 타입별 해당하는 column을 뽑을 수 있을 것 같습니다

3. select_dtypes

이건 제가 이번에 찾은 방법인데 아예 조건에 맞는 데이터 프레임을 만드는 법입니다

int_col = train.select_dtypes(include=['int64'])
float_col = train.select_dtypes(include=['float64'])
object_col = train.select_dtypes(include=['object'])

이런식으로 각 데이터타입별 데이터프레임을 만들면 columns를 통해 열을 뽑을 수도 있고,

분석이 좀 더 간편해져서 좋은 것 같습니다.

728x90

'Data Science' 카테고리의 다른 글

30초만에 예술작품을 만드는 AI (MidJourney) (0)	2022.12.29
ChatGPT 이용 상세 리뷰 😮 (0)	2022.12.26
[ 데이터 시각화 ] matplotlib 기본 개념 \| 그래프 정리 (0)	2022.10.11
[ Scikit-learn] Preprocessing.PolynomialFeatures 정리 (0)	2022.10.01
[Scikit-learn] Impute.SimpleImputer (0)	2022.09.22

Data Speaks in Silence

데이터 타입별 컬럼 구분하기 ✔

1. Dict 형태 + group by

2. 조건식 만들기 (dtype)

3. select_dtypes

'Data Science' 카테고리의 다른 글

댓글

티스토리툴바

데이터 타입별 컬럼 구분하기 ✔

1. Dict 형태 + group by

2. 조건식 만들기 (dtype)

3. select_dtypes

'Data Science' 카테고리의 다른 글

관련글

댓글

티스토리툴바