scatter = 해당하는 데이터 포인트의 x축 좌표를 전달하고 두번째 매개변수에 y 축 좌표를 전달합니다.
scatter() 함수를 호출하고 다음에 show()함수를 호출하면 그래프를 출력합니다.
쉽게 말해, 점찍기 !
import pandas as pd
import matplotlib.pyplot as plt
plt.scatter([1,2,3,4], [1,2,3,4])
plt.show()
이렇게 x 좌표(첫번째 매개변수)에 1,2,3,4를 넣고 y축(두번째 매개변수)에 1,2,3,4를 넣으면
이런식으로 산점도가 그려집니다. (산점도란? 데이터를 화면에 뿌리듯 그리는 그래프.)
만약 데이터표를 가지고 있을때 "번호" 라는 컬럼과 "대출건수" 라는 컬럼이 있을때 산점도를 뽑아보겠습니다.
import padnas as pd
import matplotlib.pyplot as plt
ns_book7 = pd.read_csv('ns_book7.csv', low_memory = False)
plt.scatter(ns_book7['번호']), ns_book['대출건수'])
plt.show()
# low_memory는 컬럼값에 NaN이나 여러 type의 데이터가 섞여있으면 오류가 나기 때문에
# 경고 메세지를 출력되지 않게 하기위해 써놓는 것입니다.
# 종류 = dtype option으로 타입을 명시해주거나 low_memory = False로 지정해주어야 한다.
이렇게 수 많은 데이터가 표에 찍히게 됩니다.
alpha = 0~1사이의 값으로 투명도 지정
import padnas as pd
import matplotlib.pyplot as plt
ns_book7 = pd.read_csv('ns_book7.csv', low_memory = False)
plt.scatter(ns_book7['번호']), ns_book['대출건수'], alpha = 0.1)
plt.show()
# low_memory는 컬럼값에 NaN이나 여러 type의 데이터가 섞여있으면 오류가 나기 때문에
# 경고 메세지를 출력되지 않게 하기위해 써놓는 것입니다.
# 종류 = dtype option으로 타입을 명시해주거나 low_memory = False로 지정해주어야 한다.
히스토그램 그리기
히스토그램이란? 도수분포표를 그래프로 나타낸 것으로서, 가로축은 계급, 세로축은 도수 (횟수나 개수 등)를 나타냅니다
plt.hist([0,2,5,5,7,7,7,9,11,11], bin = 15)
plt.show()
'한국경제신문(toss bank)' 카테고리의 다른 글
MySQL 정규 표현식 Regular Expression (0) | 2024.07.09 |
---|---|
통계 (0) | 2024.07.05 |
2024-07-03 (0) | 2024.07.03 |
Numpy, Pandas, Series : DataFrame, iloc : loc (0) | 2024.07.01 |
Docstring (함수 문서화) (0) | 2024.06.28 |