PYTHON 29

label, axis, ticks, legend, grid

📊데이터 시각화에 있어서 차트의 부가 설정은 필수이다. 시각화에서 가장 중요한 것은 한 눈에 차트가 이해가 되어야 한다는 점이다. 각 축이 의미하는 값, 각 선이 의미하는 값, 데이터의 중요한 부분을 돋보이게 할 수 있게 눈금이나 그리드 등을 설정해주어 차트의 이해도를 높여야 한다. 그렇기 때문에 각 축의 이름 설정이나 눈금의 값을 지정하는 등 부가적인 설정은 매우 중요하다. 부가적인 설정을 하는 함수에 대하여 설명할 내용은 아래와 같다. 차트 타이틀 설정 : plt.title('타이틀 명') 축 이름 설정 : plt.xlabel( ), plt.ylabel ( ) 축 범위 지정 : plt.axis( ) 축 눈금 표시 지정 : plt.xticks( ), plt.yticks( ) 범례 지정 : plt.leg..

Back-End/Matplotlib 2022.12.21

PyAutoGUI

🤖이번에는 PyAutoGUI라는 모듈에 대해 설명하고자 한다. PyAutoGUI는 마우스, 키보드를 제어할 수 있으며 메세지 상자를 송출하거나 스크린샷을 찍을 수 있도록 지원해주는 자동화 모듈이다. 자세한 설명은 PyAutoGUI 홈페이지에 자세하게 설명되어있다. https://pyautogui.readthedocs.io/en/latest/index.html Welcome to PyAutoGUI’s documentation! — PyAutoGUI documentation Welcome to PyAutoGUI’s documentation! PyAutoGUI lets your Python scripts control the mouse and keyboard to automate interactions wit..

Back-End/Python 2022.12.21

Figure, Axes

👨🏻‍💻Figure, Axes 두 가지 요소는 맷플롯립의 가장 기본적이면서 가장 중요하다. 📃Figure는 그림을 그리기 위한 캔버스의 역할을 한다고 생각하면 된다. 캔버스의 크기를 조절, 색상 등의 설정값을 지정할 수 있다. ✏️Axes는 실제 그림을 그리는 메소드를 가진다. 그래서 대부분의 시각화를 수행하는 메소드는 Axes에서 호출된다. X, Y축, 타이틀, 범례 등의 속성을 설정하는데도 이용된다. 📈plt.show() 함수는 작성한 코드를 차트로 출력 해주는 함수이다. 해당 함수를 필수적으로 기입해주어야 한다. 👉plt.figure( ) import matplotlib.pyplot as plt plt.figure() plt.show() # 출력값 # plt.figure( )함수만 기입하고 출력하였..

Back-End/Matplotlib 2022.12.21

Matplotlib ?

📈Matplotlib(맷플롯립)은 파이썬 언어를 기반으로 한 대표적인 시각화 라이브러리이다. 파이썬 기반의 시각화 라이브러리는 Matplotlib(맷플롯립)과 Seaborn(시본)이 있다. Matplotlib(맷플롯립)은 파이썬에서 가장 많이 사용되는 시각화 라이브러리로서 다른 시각화 라이브러리에 많은 영향을 미쳤다. 하지만 단점으로는 직관적이지 못하여 해당 라이브러리가 익숙해지는 데 많은 시간이 필요하며, 차트의 축, 타이틀, 범례 등 부가적인 속성도 직접 코딩으로 작성하여 기입해주어야 하는 불편함이 있다. Matplotlib(맷플롯립)의 단점이 보완된 시각화 라이브러리가 Seaborn(시본)이다. Seaborn(시본)은 Matplotlib(맷플롯립)보다 코딩 구현이 쉽고, 판다스와 연동이 편리하다. ..

Back-End/Matplotlib 2022.12.20

Group by

👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)의 Group by 함수가 있다. df.groupby( )함수는 SQL의 group by와 유사하다. df.groupby( ) 함수는 원하는 컬럼을 그룹별로 묶어서 해당 컬럼과 연관된 컬럼의 연산된 값을 데이터 프레임으로 반환한다. df.groupby( )함수의 기본 구조는 아래와 같다. df.groupby('컬럼명1')['컬럼명2'].그룹함수() 컬럼명1의 유일한 값 (Unique)값을 추출 후, 컬럼명1의 해당하는 컬럼명2의 값을 그룹함수로 연산한 값을 하나의 데이터 프레임으로 반환한다. 표로 설명하자면 아래와 같다. 👉new_df = df.groupby('부서')['급여'].sum( ) 우선 '부서별'로 유일한 값을 추출하면 '영업',..

Back-End/Pandas 2022.12.19

merge

😤판다스(Pandas)에서 데이터 프레임(Data Frame)을 병합할 때 사용하는 함수는 merge가 있다. pd.merge( ) 함수는 SQL의 JOIN과 유사하다. pd.merge( ) 함수는 크게 세 가지로 나누어 사용할 수 있다. Column과 Column의 병합 Column과 Index의 병합 Index와 Index의 병합 하나씩 순서대로 알아보자 ! 1. Column과 Column의 병합 pd.merge( )함수의 특징은 Inner Join, Outer Join 두 개로 나눌 수 있다. Inner Join : 공통되는 값의 행만 병합하여 하나의 데이터 프레임으로 출력 Outer Join : 공통되는 값의 행과 공통되지 않는 값의 행까지 병합하여 하나의 데이터 프레임으로 출력 글로는 설명이 어..

Back-End/Pandas 2022.12.18

sort

모든 프로그램 언어에서 정렬은 두 가지 종류가 있다. 그것은 '오름차순'과 '내림차순'이다. 모든 프로그램 언어의 기본은 '오름차순'으로 설정되어 있다. 😤판다스의 데이터프레임에서도 정렬을 할 수 있는 함수가 두 가지 있다. 데이터 프레임의 Series의 정렬을 도와주는 함수 df.sort_values( )함수 데이터 프레임의 컬럼 명(Column Label) 또는 열의 인덱스(Index)의 정렬을 도와주는 함수 df.sort_index( )함수 순차적으로 하나씩 알아보자 ! 데이터 프레임(Data Frame)에서 시리즈(Series)의 정렬을 위해서는 sort_values( )함수를 이용한다. 위 함수는 SQL의 order by와 유사하다. Sort_values( ) 함수의 주요 파라미터는 아래와 같다..

Back-End/Pandas 2022.12.16

"Null"

Null 이란 '없음' 을 뜻한다. 프로그래밍에서도 Null 은 '값이 없음'을 의미한다. 이 게시글을 작성할 때도 Null 로 제목을 할 경우, 제목이 없음으로 되기 때문에 게시가 불가하다. 👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)에서도 Null 값을 처리하는 것은 중요하다. Null 값이 존재할 경우 결과값에 영향을 미칠 수 있기 때문이다. 그러므로, Null 값을 평균값 또는 중앙값으로 변경 처리 하거나, 삭제 처리를 해주어야 한다. 이번에는 Null 조회 및 변경, 삭제하는 방법에 대해서 알아보려고 한다. *Pandas의 Data Frame 에서 Null 값은 None 또는 np.nan으로 표현된다. 조회 Null값을 조회하는 방법은 두가지가 있다. Pandas 함수를 이..

Back-End/Pandas 2022.12.16

추가, 삽입, 삭제

👨🏻‍💻판다스(Pandas)의 데이터 프레임(Data Frame)에서 행(Row) 또는 열(Column)을 추가하거나, 삽입하거나, 삭제를 할 수 있다. 행과 열의 따라 각각의 추가, 삽입, 삭제에 대하여 세 가지로 나누어 알아보자 ! 추가 Column 컬럼을 추가하는 문법은 세 가지가 있다. df['컬럼명'] = 값 df.assign('컬럼명' = 리스트|함수) pd.concat([df, df2], axis=1) 개인적으로 선호하는 함수는 df['컬럼명']= 과 pd.concat( ) 함수를 선호한다. df['컬럼명'] 함수는 매우 간단하여 사용하기가 쉽고, pd.concat( ) 함수는 열 추가와 같이 사용할 수 있다. 👉df['컬럼명'] = 값 import pandas as pd import num..

Back-End/Pandas 2022.12.15

Subset

👨🏻‍💻Subset의 뜻은 '부분 집합'이다. 즉, 판다스(Pandas)의 데이터 프레임(Data Frame)에서 일정 부분을 반환하는 함수를 알아 볼 것이다. 데이터 프레임(Data Frame)에서 열(Column)만 반환하는 함수 데이터 프레임(Data Frame)에서 행(Row)만 반환하는 함수 데이터 프레임(Data Frame)에서 특정 (행(Row), 열(Column))을 반환하는 함수 filter 함수 위 4개의 함수를 순차적으로 알아보자 ! 😤데이터 프레임(Data Frame)에서 열(Column)만 반환하는 함수를 먼저 알아보자 ! 데이터 프레임에서 컬럼을 조회할 때 두 개의 경우가 있다. 1. 하나의 컬럼만 조회할 경우 (단일컬럼) 2. 두 개 이상의 컬럼을 조회할 경우 (다중컬럼) 단일..

Back-End/Pandas 2022.12.14