DataFrame 5

Group by

👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)의 Group by 함수가 있다. df.groupby( )함수는 SQL의 group by와 유사하다. df.groupby( ) 함수는 원하는 컬럼을 그룹별로 묶어서 해당 컬럼과 연관된 컬럼의 연산된 값을 데이터 프레임으로 반환한다. df.groupby( )함수의 기본 구조는 아래와 같다. df.groupby('컬럼명1')['컬럼명2'].그룹함수() 컬럼명1의 유일한 값 (Unique)값을 추출 후, 컬럼명1의 해당하는 컬럼명2의 값을 그룹함수로 연산한 값을 하나의 데이터 프레임으로 반환한다. 표로 설명하자면 아래와 같다. 👉new_df = df.groupby('부서')['급여'].sum( ) 우선 '부서별'로 유일한 값을 추출하면 '영업',..

Back-End/Pandas 2022.12.19

추가, 삽입, 삭제

👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)에서 행(Row) 또는 열(Column)을 추가하거나, 삽입하거나, 삭제를 할 수 있다. 행과 열의 따라 각각의 추가, 삽입, 삭제에 대하여 세 가지로 나누어 알아보자 ! 추가 Column 컬럼을 추가하는 문법은 세 가지가 있다. df['컬럼명'] = 값 df.assign('컬럼명' = 리스트|함수) pd.concat([df, df2], axis=1) 개인적으로 선호하는 함수는 df['컬럼명']= 과 pd.concat( ) 함수를 선호한다. df['컬럼명'] 함수는 매우 간단하여 사용하기가 쉽고, pd.concat( ) 함수는 열 추가와 같이 사용할 수 있다. 👉df['컬럼명'] = 값 import pandas as pd import num..

Back-End/Pandas 2022.12.15

Subset

👨🏻‍💻Subset의 뜻은 '부분 집합'이다. 즉, 판다스(Pandas)의 데이터 프레임(Data Frame)에서 일정 부분을 반환하는 함수를 알아 볼 것이다. 데이터 프레임(Data Frame)에서 열(Column)만 반환하는 함수 데이터 프레임(Data Frame)에서 행(Row)만 반환하는 함수 데이터 프레임(Data Frame)에서 특정 (행(Row), 열(Column))을 반환하는 함수 filter 함수 위 4개의 함수를 순차적으로 알아보자 ! 😤데이터 프레임(Data Frame)에서 열(Column)만 반환하는 함수를 먼저 알아보자 ! 데이터 프레임에서 컬럼을 조회할 때 두 개의 경우가 있다. 1. 하나의 컬럼만 조회할 경우 (단일컬럼) 2. 두 개 이상의 컬럼을 조회할 경우 (다중컬럼) 단일..

Back-End/Pandas 2022.12.14

Data Frame

Data Frame란 무엇일까? 데이터 프레임(Data Frame)은 판다스에서 사용하는 행과 열로 이루어진 자료 구조이다. 데이터프레임은 SQL의 Data table, 엑셀의 sheet와 유사하다. 다만, 차이점은 있다. 판다스의 데이터 프레임(Data Frame)은 생성되는 순간 각 행 마다 고유의 인덱스(Index)라는 위치 값을 가지게 된다. 인덱스를 이용하여 위치 출력 및 각 행에 이름을 지정할 수가 있다. 또한, 데이터 프레임은 컬럼(column)별로 분리가 가능하다. 한 개의 열을 'Series'라고 부른다. Data Frame은 두 개 이상의 Series의 집합이라고 보면 된다. 판다스의 모듈을 아래와 같이 임포트하여 사용한다. import pandas as pd pandas를 pd로 에일..

Back-End/Pandas 2022.12.13