DataFrame 객체 [1]

기본 2차원 pandas 데이터 구조.

  • 2차원, 크기 변경 가능, potentially heterogeneous tabular data (테이블 형식 데이터).
    • potentially heterogeneous → 여러 다른 종류들(heterogeneous)로 이루어질 수 있는(가능성있는, potentially)
  • 데이터 구조에는 레이블이 지정된 축(행 및 열)도 포함된다..
  • 산술 연산은 행 레이블과 열 레이블 모두에 정렬된다.
  • Series 객체를 위한 dict-like 컨테이너로 생각할 수 있다.

매개변수

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)


DataFrame Method

DataFrame.head() [2]

처음부터 n개 까지의 행을 반환한다.

매개변수

DataFrame.head(n)

n : int, default 5

반환 값

처음부터 n개 까지의 행을 반환.

DataFrame.info() [3]

DataFrame의 간략한 요약을 출력한다.

DataFrame.value_counts() [4]

DataFrame의 고유한 행 수를 포함하는 Series를 반환합니다.

Nan 값을 제외한(매게변수 설정으로 Nan값 포함 가능) 카테고리의 개수를 출력한다.

DataFrame.describe() [5]

숫자형 특성의 요약정보를 보여준다.

Series의 인덱스는 count, mean, std, min, max, select_dtypes, 25%, 50%, 75% 를 표시한다.


참고문언

1. DataFrame, pandas API reference, ver 1.4.0, https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html

2. DataFrame.head(), pandas API reference, ver 1.4.0, https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.head.html

3. DataFrame.info(), pandas API reference, ver 1.4.0, https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.info.html

4. DataFrame.value_counts(), pandas API reference, ver 1.4.0 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.value_counts.html

5. DataFrame.describe(), pandas API reference, ver 1.4.0 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.describe.html