728x90 반응형 Data Science/Pandas, Numpy19 [Pandas] DataFrame 개념 및 생성/조회 방법 🧐 DataFrame 이란? Pandas에서는 DataFrame을 여러 다른 타입의 컬럼을 가진 2차원의 데이터 구조로 정의하고 있습니다 처음에 저도 DataFrame이라는 개념을 들었을 때 잘 이해가 안 갔는데요 간단히 생각하면 엑셀의 피벗테이블, 일반 표 등 말그대로 Data를 담은 Frame이다! 정도로 이해가능 할 것 같습니다 여기서 반드시 짚고 넘어가야 하는 부분은 DataFrame과 관련된 기본 용어인데요 DataFrame은 반드시 가장 왼쪽에 index label 이 있고 열이름이 위쪽에 위치해 있습니다 일반적으로 행은 axis = 0, 열은 axis =1로 표현합니다 여기서 데이터프레임의 한 줄, 즉 열 데이터는 Series로 지칭되니 꼭 기억하시길 바래요! ✨ DataFrame 만들기 1.. 2022. 9. 30. [Numpy] Flatten 기능 및 사용법 정리 numpy.ndarray.flatten 이 기능은 주어진 array를 1차원, 즉 쉽게 생각하면 한줄로 쭉 늘어놓는 함수인데요 ndarray.flatten(order='C') 세부 파라미터 order 중 가장 유용한 'C', 'F' 옵션에 대해서 더 알아보겠습니다 'C' => 행단위로 추출 'F' => 열단위로 추출 즉, 아래와 같은 array a를 flatten할 때 default인 'C' 행 기준으로 나열할 수도 있고 'F' 열 단위로 나열할 수도 있습니다 a = np.array([[1,2], [3,4]]) a.flatten() array([1, 2, 3, 4]) a.flatten('F') array([1, 3, 2, 4]) Source: https://numpy.org/doc/stable/refer.. 2022. 9. 29. [Numpy] 열 Column간 순서, 위치 바꾸기 가끔 이렇게 열간 순서를 바꿔야 할 때가 있는데요 이 때 할 수 있는 가장 간단한 방법은 인덱싱을 적용한 Swap을 사용하는건데요 import numpy as np my_array[:, [2, 0]] = my_array[:, [0, 2]] 이런식으로 첫번째 열과 3번째 열을 Swap 해주겠다!고 명시만 하면 간단하게 할 수 있습니다 Reference: https://www.geeksforgeeks.org/how-to-swap-columns-of-a-given-numpy-array/ 2022. 9. 29. [Numpy] 넘파이 범용/유틸리티 함수 정리 데이터 분석 시, 유용하게 사용가능한 대표적인 범용함수(universal function)를 정리해보려 합니다 ▷ 항이 1개인 범용함수 함수 이름 기능 abs 절대값 반환 around 0.5기준 올림/내림 round n소수점 자리수까지 반올림 실행 rint 가장 가까운 정수로 올림/내림 ceil 크거나 같은 가장 작은 정수 반환 floor 작거나 같은 가장 큰 정수 반환 trunc 소수점 버림 reciprocal 역수 처리 (2 -> 1/2) sqrt 제곱근 파이썬과 유사한 점이 많은데 rint와 reciprocal은 처음 보는거 같네요 사용하는 방법은 간단합니다. import numpy as np np.abs(array) np.around(array) np.ceil(array) ... ▷ 항이 2개인 .. 2022. 9. 28. [Numpy] 넘파이 개념 및 필수 함수 정리 √ Numpy 란? 다차원배열(ndarray)의 효과적 처리를 도와주는 라이브러리 [[ ]] 대괄호 2개는 2차원, [[[ 3개는 3차원으로 차원 벡터와 행렬 선형대수 계산에 주로 사용 차원의 수(ndim), 차원의 모양은 shape 기능이용 벡터 연산이 가능해서 연산속도가 매우 빠름 √ Numpy 특징 numpy 의 배열은 반드시 동일한 데이터 타입으로 자동 변환/저장된다. x = [1,2,'K'] a = np. array(x) print(a) >>> ['1' '2' 'K'] #전체 데이터 타입을 string으로 자동으로 통일시킴 √ Numpy 필수 함수 1차원 배열 형성 x = np.array(리스트 or 튜플) --------------- 차원의 크기 = x.ndim 총 요소 갯수 = x.size .. 2022. 9. 27. [Pandas] Groupby / Count / Value_counts 차이점 정리 √ DataFrame.groupby 데이터프레임의 그룹핑은 groupby를 통해 비교적 간단하게 실행이 가능한데요 DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=_NoDefault.no_default, squeeze=_NoDefault.no_default, observed=False, dropna=True) 더보기 Pandas 공식 웹사이트에서 세부기능 참조 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html "어떤 데이터프레임을 by 무엇으로 axis 행/열을 기준으로 묶겠다" 를 생각하면서 작성하면 좀 수월한 것 같습.. 2022. 9. 22. 이전 1 2 3 4 다음 728x90 반응형