Pandas는 언제 그리고 왜 쓰일까

When working with tabular data, such as data stored in spreadsheets or databases, pandas is the right tool for you. pandas will help you to explore, clean, and process your data. In pandas, a data table is called a DataFrame.[1]

스프레드시트나 데이터베이스에 저장된 데이터와 같은 표 형식의 데이터로 작업할 때 판다는 사용자에게 적합한 도구입니다. 판다들은 여러분이 데이터를 탐색하고, 청소하고, 처리할 수 있도록 도와줄 것입니다. 판다에서는 데이터 테이블을 데이터 프레임이라고 합니다.

인공지능 분야에서 판다스를 필수적으로 쓰는 이유는 수만 수십만개의 데이터를 다루기 편하기 때문이다.


Pandas Data Objects

pandas data object

출처 : dandyrilla[2]

Pandas는 크게 1차원 배열Series , 2차원 배열DataFrame 을 저장하는 객체가 있다.

잘 사용은 안하지만 3차원Panel , 4차원Panel4D , 5차원PanelND 까지도 사용된다.

TensorFlow에서도 1차원부터 5차원까지의 표현이 존재하니 참고하자.[Link]


참고문헌

1. pandas documentation, pandas, Date: Feb 12, 2022 Version: 1.4.1, https://pandas.pydata.org/docs/pandas.pdf

2. 판다스(pandas) 기본 사용법 익히기, dandyrilla, 2017.08.12 작성, 2022.02.13 방문, https://dandyrilla.github.io/2017-08-12/pandas-10min/