numpy 15

label, axis, ticks, legend, grid

📊데이터 시각화에 있어서 차트의 부가 설정은 필수이다. 시각화에서 가장 중요한 것은 한 눈에 차트가 이해가 되어야 한다는 점이다. 각 축이 의미하는 값, 각 선이 의미하는 값, 데이터의 중요한 부분을 돋보이게 할 수 있게 눈금이나 그리드 등을 설정해주어 차트의 이해도를 높여야 한다. 그렇기 때문에 각 축의 이름 설정이나 눈금의 값을 지정하는 등 부가적인 설정은 매우 중요하다. 부가적인 설정을 하는 함수에 대하여 설명할 내용은 아래와 같다. 차트 타이틀 설정 : plt.title('타이틀 명') 축 이름 설정 : plt.xlabel( ), plt.ylabel ( ) 축 범위 지정 : plt.axis( ) 축 눈금 표시 지정 : plt.xticks( ), plt.yticks( ) 범례 지정 : plt.leg..

Back-End/Matplotlib 2022.12.21

Figure, Axes

👨🏻‍💻Figure, Axes 두 가지 요소는 맷플롯립의 가장 기본적이면서 가장 중요하다. 📃Figure는 그림을 그리기 위한 캔버스의 역할을 한다고 생각하면 된다. 캔버스의 크기를 조절, 색상 등의 설정값을 지정할 수 있다. ✏️Axes는 실제 그림을 그리는 메소드를 가진다. 그래서 대부분의 시각화를 수행하는 메소드는 Axes에서 호출된다. X, Y축, 타이틀, 범례 등의 속성을 설정하는데도 이용된다. 📈plt.show() 함수는 작성한 코드를 차트로 출력 해주는 함수이다. 해당 함수를 필수적으로 기입해주어야 한다. 👉plt.figure( ) import matplotlib.pyplot as plt plt.figure() plt.show() # 출력값 # plt.figure( )함수만 기입하고 출력하였..

Back-End/Matplotlib 2022.12.21

Matplotlib ?

📈Matplotlib(맷플롯립)은 파이썬 언어를 기반으로 한 대표적인 시각화 라이브러리이다. 파이썬 기반의 시각화 라이브러리는 Matplotlib(맷플롯립)과 Seaborn(시본)이 있다. Matplotlib(맷플롯립)은 파이썬에서 가장 많이 사용되는 시각화 라이브러리로서 다른 시각화 라이브러리에 많은 영향을 미쳤다. 하지만 단점으로는 직관적이지 못하여 해당 라이브러리가 익숙해지는 데 많은 시간이 필요하며, 차트의 축, 타이틀, 범례 등 부가적인 속성도 직접 코딩으로 작성하여 기입해주어야 하는 불편함이 있다. Matplotlib(맷플롯립)의 단점이 보완된 시각화 라이브러리가 Seaborn(시본)이다. Seaborn(시본)은 Matplotlib(맷플롯립)보다 코딩 구현이 쉽고, 판다스와 연동이 편리하다. ..

Back-End/Matplotlib 2022.12.20

Group by

👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)의 Group by 함수가 있다. df.groupby( )함수는 SQL의 group by와 유사하다. df.groupby( ) 함수는 원하는 컬럼을 그룹별로 묶어서 해당 컬럼과 연관된 컬럼의 연산된 값을 데이터 프레임으로 반환한다. df.groupby( )함수의 기본 구조는 아래와 같다. df.groupby('컬럼명1')['컬럼명2'].그룹함수() 컬럼명1의 유일한 값 (Unique)값을 추출 후, 컬럼명1의 해당하는 컬럼명2의 값을 그룹함수로 연산한 값을 하나의 데이터 프레임으로 반환한다. 표로 설명하자면 아래와 같다. 👉new_df = df.groupby('부서')['급여'].sum( ) 우선 '부서별'로 유일한 값을 추출하면 '영업',..

Back-End/Pandas 2022.12.19

merge

😤판다스(Pandas)에서 데이터 프레임(Data Frame)을 병합할 때 사용하는 함수는 merge가 있다. pd.merge( ) 함수는 SQL의 JOIN과 유사하다. pd.merge( ) 함수는 크게 세 가지로 나누어 사용할 수 있다. Column과 Column의 병합 Column과 Index의 병합 Index와 Index의 병합 하나씩 순서대로 알아보자 ! 1. Column과 Column의 병합 pd.merge( )함수의 특징은 Inner Join, Outer Join 두 개로 나눌 수 있다. Inner Join : 공통되는 값의 행만 병합하여 하나의 데이터 프레임으로 출력 Outer Join : 공통되는 값의 행과 공통되지 않는 값의 행까지 병합하여 하나의 데이터 프레임으로 출력 글로는 설명이 어..

Back-End/Pandas 2022.12.18

sort

모든 프로그램 언어에서 정렬은 두 가지 종류가 있다. 그것은 '오름차순'과 '내림차순'이다. 모든 프로그램 언어의 기본은 '오름차순'으로 설정되어 있다. 😤판다스의 데이터프레임에서도 정렬을 할 수 있는 함수가 두 가지 있다. 데이터 프레임의 Series의 정렬을 도와주는 함수 df.sort_values( )함수 데이터 프레임의 컬럼 명(Column Label) 또는 열의 인덱스(Index)의 정렬을 도와주는 함수 df.sort_index( )함수 순차적으로 하나씩 알아보자 ! 데이터 프레임(Data Frame)에서 시리즈(Series)의 정렬을 위해서는 sort_values( )함수를 이용한다. 위 함수는 SQL의 order by와 유사하다. Sort_values( ) 함수의 주요 파라미터는 아래와 같다..

Back-End/Pandas 2022.12.16

"Null"

Null 이란 '없음' 을 뜻한다. 프로그래밍에서도 Null 은 '값이 없음'을 의미한다. 이 게시글을 작성할 때도 Null 로 제목을 할 경우, 제목이 없음으로 되기 때문에 게시가 불가하다. 👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)에서도 Null 값을 처리하는 것은 중요하다. Null 값이 존재할 경우 결과값에 영향을 미칠 수 있기 때문이다. 그러므로, Null 값을 평균값 또는 중앙값으로 변경 처리 하거나, 삭제 처리를 해주어야 한다. 이번에는 Null 조회 및 변경, 삭제하는 방법에 대해서 알아보려고 한다. *Pandas의 Data Frame 에서 Null 값은 None 또는 np.nan으로 표현된다. 조회 Null값을 조회하는 방법은 두가지가 있다. Pandas 함수를 이..

Back-End/Pandas 2022.12.16

추가, 삽입, 삭제

👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)에서 행(Row) 또는 열(Column)을 추가하거나, 삽입하거나, 삭제를 할 수 있다. 행과 열의 따라 각각의 추가, 삽입, 삭제에 대하여 세 가지로 나누어 알아보자 ! 추가 Column 컬럼을 추가하는 문법은 세 가지가 있다. df['컬럼명'] = 값 df.assign('컬럼명' = 리스트|함수) pd.concat([df, df2], axis=1) 개인적으로 선호하는 함수는 df['컬럼명']= 과 pd.concat( ) 함수를 선호한다. df['컬럼명'] 함수는 매우 간단하여 사용하기가 쉽고, pd.concat( ) 함수는 열 추가와 같이 사용할 수 있다. 👉df['컬럼명'] = 값 import pandas as pd import num..

Back-End/Pandas 2022.12.15

Subset

👨🏻‍💻Subset의 뜻은 '부분 집합'이다. 즉, 판다스(Pandas)의 데이터 프레임(Data Frame)에서 일정 부분을 반환하는 함수를 알아 볼 것이다. 데이터 프레임(Data Frame)에서 열(Column)만 반환하는 함수 데이터 프레임(Data Frame)에서 행(Row)만 반환하는 함수 데이터 프레임(Data Frame)에서 특정 (행(Row), 열(Column))을 반환하는 함수 filter 함수 위 4개의 함수를 순차적으로 알아보자 ! 😤데이터 프레임(Data Frame)에서 열(Column)만 반환하는 함수를 먼저 알아보자 ! 데이터 프레임에서 컬럼을 조회할 때 두 개의 경우가 있다. 1. 하나의 컬럼만 조회할 경우 (단일컬럼) 2. 두 개 이상의 컬럼을 조회할 경우 (다중컬럼) 단일..

Back-End/Pandas 2022.12.14

Data Frame

Data Frame란 무엇일까? 데이터 프레임(Data Frame)은 판다스에서 사용하는 행과 열로 이루어진 자료 구조이다. 데이터프레임은 SQL의 Data table, 엑셀의 sheet와 유사하다. 다만, 차이점은 있다. 판다스의 데이터 프레임(Data Frame)은 생성되는 순간 각 행 마다 고유의 인덱스(Index)라는 위치 값을 가지게 된다. 인덱스를 이용하여 위치 출력 및 각 행에 이름을 지정할 수가 있다. 또한, 데이터 프레임은 컬럼(column)별로 분리가 가능하다. 한 개의 열을 'Series'라고 부른다. Data Frame은 두 개 이상의 Series의 집합이라고 보면 된다. 판다스의 모듈을 아래와 같이 임포트하여 사용한다. import pandas as pd pandas를 pd로 에일..

Back-End/Pandas 2022.12.13