728x90
반응형
1. Dict 형태 + group by
type_summary = {str(i):list(j) for i,j in train.groupby(train.dtypes,axis=1)}
{'int64': ['bd', 'bh'],
'float64': ['mss', 'rvd'],
'object': ['id','dayweek']}
groupby를 통해서 쉽게 분류를 할 수도 있지만 반환값이 가독성이 별로 좋지 않다는 단점이 있습니다.
2. 조건식 만들기 (dtype)
filtered = df.dtypes[df.dtypes == np.object]
list_cols = list(filtered.index)
만약 활용도를 높이고 싶다면 for 문을 통해서 전체 데이터 타입별 해당하는 column을 뽑을 수 있을 것 같습니다
3. select_dtypes
이건 제가 이번에 찾은 방법인데 아예 조건에 맞는 데이터 프레임을 만드는 법입니다
int_col = train.select_dtypes(include=['int64'])
float_col = train.select_dtypes(include=['float64'])
object_col = train.select_dtypes(include=['object'])
이런식으로 각 데이터타입별 데이터프레임을 만들면 columns를 통해 열을 뽑을 수도 있고,
분석이 좀 더 간편해져서 좋은 것 같습니다.
728x90
반응형
'Data Science' 카테고리의 다른 글
30초만에 예술작품을 만드는 AI (MidJourney) (0) | 2022.12.29 |
---|---|
ChatGPT 이용 상세 리뷰 😮 (0) | 2022.12.26 |
[ 데이터 시각화 ] matplotlib 기본 개념 | 그래프 정리 (0) | 2022.10.11 |
[ Scikit-learn] Preprocessing.PolynomialFeatures 정리 (0) | 2022.10.01 |
[Scikit-learn] Impute.SimpleImputer (0) | 2022.09.22 |
댓글