Pandas 데이터 공부

[03. 판다스입문] 데이터 집합 불러오기

투자 Lv.1 2020. 2. 19. 21:57

이전 시간에 파이썬 패키지 관리자를 사용해 봤습니다. 

오늘은 실제 데이터를 불러오며 타입 등 속성 및 메서드를 사용해 보도록 하겠습니다.

 

 


2020/02/17 - [IT/pandas] - [01. 판다스입문] 아나콘다, 주피터 노트북 설치하기

 

[01. 판다스입문] 아나콘다, 주피터 노트북 설치하기

오늘 부터 판다스 공부하기로 마음 먹은 호다다입니다. 일단, 판다스를 공부하기 전 환경 세팅 부터 시작 하겠습니다. https://www.anaconda.com/ Anaconda | The World's Most Popular Data Science Platform Ana..

hodada.tistory.com

2020/02/17 - [IT/python] - [02. 판다스입문] 파이썬 패키지 관리자

 

[02. 판다스입문] 파이썬 패키지 관리자

pip 라는 프로그램 소개하겠습니다. 그 전에 아나콘다, 주피터 노트북 설치하실 분들은 이전 포스팅 참고 바랍니다. 2020/02/17 - [IT/python] - [01. 판다스입문] 아나콘다, 주피터 노트북 설치하기 [01. 판다스..

hodada.tistory.com


 

 

 


데이터 불러오기

 

 

# 판다스 라이브러리 불러오기

import pandas as pd

 

# read_csv 메서드를 이용하여 데이터 집합 불러옵니다

# 데이터 집합(갭마인더)는 탭으로 구분 되어 있기에 sep 속성 값을 \t 로 지정합니다
df = pd.read_csv('../data/gapminder.tsv', sep='\t')

 

 

 

 


시리즈와 데이터프레임

 

 

# 데이터 프레임 : 엑셀 시트 동일한 개념 (파이썬의 딕셔너리와 유사하다 생각하시면 됩니다.)
# 시리즈 : 시트의 열 1개 의미

 

두 가지 개념은 실습하면서 의미를 더 공부하도록 합시다!

 

 

 


불러온 데이터 집합 살펴보기

 

 

# head() method

  : 가장 앞에 있는 5개의 행을 출력합니다.

# type method

  : 자료형 출력 (파이썬 내장함수) **(중요)**

# shape attribute

  : 데이터의 행과 열의 크기에 대한 정보 저장 

   ( 메서드와 속성 형태가 다르다)

# columns attribute

  : 데이터 프레임의 열 이름 확인 가능

 

 

 

 

 

 

 

 


자료형 확인하기

 

 

두 종류 요소로 데이터 프레임 구성하는 값의 자료형 확인 가능

# dtypes attribute

# info method

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

다음 포스팅에선 데이터 추출해 보도록 하겠습니다.


2020/02/26 - [IT/pandas] - [04. 판다스입문] 열데이터 추출하기

 

[04. 판다스입문] 열데이터 추출하기

이전 시간에 데이터 집합 불러왔습니다. 오늘은 불러온 데이터를 다양한 방법으로 추출해 보도록 하겠습니다. 2020/02/19 - [IT/pandas] - [03. 판다스입문] 데이터 집합 불러오기 [03. 판다스입문] 데이터 집합..

hodada.tistory.com