한국경제신문(toss bank) 21

통계

통계에 대해서모집단 = 관심 대상이 되는 전체 데이터모수검정 = 모집단에 대한 파라미터를 추정하는 방법우라나라 청소년의 몸무게 평균을 구할때 모집단 = 대한민국 전체 청소년현실적으로 어려워서, 지역이나 연령별로 일부 청소년의 몸무게를 조사하고 전체 청소년의 몸무게를 추정 ==> 모수검정모집단에서 선택한 일부 샘플을 " 표본 " 이라고 부릅니다데이터가 정규분포를 따른다고 가정하고, 각 값이 평균에서 얼마나 떨어져있는지 표준편차를 사용해서변환한 점수를 " 표준점수 " 또는 " z 점수 " 라고 합니다. 숫자 7에 대한 z 점수 구하는 방법 =import numpy as npx = [0, 3, 5, 7, 10]s = np.std(x) # 표준편차m = np.mean(x) #평균z = (7-m) / sprint..

pandas, matplotlib 데이터 시각화

scatter = 해당하는 데이터 포인트의 x축 좌표를 전달하고 두번째 매개변수에 y 축 좌표를 전달합니다.scatter() 함수를 호출하고 다음에 show()함수를 호출하면 그래프를 출력합니다.쉽게 말해, 점찍기 !import pandas as pdimport matplotlib.pyplot as pltplt.scatter([1,2,3,4], [1,2,3,4])plt.show()이렇게 x 좌표(첫번째 매개변수)에 1,2,3,4를 넣고 y축(두번째 매개변수)에 1,2,3,4를 넣으면 이런식으로 산점도가 그려집니다. (산점도란? 데이터를 화면에 뿌리듯 그리는 그래프.)만약 데이터표를 가지고 있을때 "번호" 라는 컬럼과 "대출건수" 라는 컬럼이 있을때 산점도를 뽑아보겠습니다.import padnas as p..

2024-07-03

python 변수의 종류==> 변수의 종류는 크게 범주형 변수와 수치형 변수로 구분        - 각 변수의 종류에 따라 분석하는 방법도 다릅니다. Count 데이터들의 표apply 함수란?pandas의 apply 함수는 DataFrame이나 Series에 대해서 특정 함수를 일괄적으로 적용할수 있게 해주는 메소드입니다.이 함수는 데이터 전처리, 변환, 계산 등의 작업을 간단하게 수행할 수 있도록 해줍니다.적용 대상 ==>1. DataFrame 과 Series 모두 사용가능2. 각 행(row)이나 열(column)에 대해 함수 적용 가능축(axis) 지정 ==>1. axis = 0 : 각 열(column)에 함수를 적용 (기본값)2. axis = 1 : 각 행(row)에 함수를 적용 lambda 함수P..

Numpy, Pandas, Series : DataFrame, iloc : loc

Numpy(Numerical Python)numpy란 Python에서 과학 컴퓨팅을 위한 기본적인 패키지입니다.대규모 다 차원 배열 뿐만 아니라 수치 계산을 쉽고 효율적으로 처리할 수 있도록 지원하는 파이썬의 라이브러리Numpy는 명시적 인덱스 없이 묵시적으로 '0'부터 차례로 중서형 인덱스를 사용하여 접근. PandasPandas(Python Data Analysis Library)란 Python을 활용해 데이터 분석을 하기 위해서 사용하는 패키지입니다.R의 DataFrame을 따라서 Python에서 사용할수 있는 형태의 DataFrame을 제공해줍니다.Pandas DataFrame을 활용하면 데이터를 표(Table)형태로 처리할 수 있어서 수집된 데이터의 전처리등 각종 데이터 핸들링을 쉽고 편하게 할..

Docstring (함수 문서화)

Docstring은 "documentation string"의 줄임말로Python 프로그래밍에서 함수, 클래스, 모듈 등의 정의에 대한 설명을 포함하는 문자열을 말합니다. def add(a, b): """ Print the sum of two numbers. Parameters: a (int, float): The first number to be added. b (int, float): The second number to be added. Returns: None Example: >>> add(1, 2) 3 >>> add(1.5, 2.5) 4.0 """ return print(a + b)def sub(a, b): """ ..

Python while(반복문) 함수(def)

while 반복문while반복문은 python에서의 for문과 살짝 다르게 실행됩니다.while ( 조건식):     출력문ex)이렇게 작성하면 i 가 0부터 10부터 작을때 i번째 숫자를 출력하는 문장입니다.break문break문은 반복문이 돌아갈때 어떤 순간 반복문을 빠져나오고 싶을때 사용하는 구문입니다.이 반복문에서는 numbers 리스트를 돌다가 number가 10을 넘으면 반복문을 빠져나오는 코드 입니다.이 코드는 리스트를 순회하다가 위에서는 15를 가지고 break을 통해 빠져나갔지만 이 코드에서는 15를 우선 출력하고, 그 다음에 number > 10인 if문을 만나고 break을 통해서 빠져나가기 때문에 15까지 출력된것 입니다.함수(def)함수는  과정은 똑같지만 매개변수를 통해서 다른 ..

Python if문, datetime라이브러리, for 반복문

if문~~ 조건을 만족한다 ==> True + 그러면 물건을 살수있다.~~ 조건을 만족하지 못한다 ==> False + 그러면 물건을 사지 못한다.if  조건문:      print("~~~")else:      print("~~~")(매우 간단한 내용이라 넘어감)날짜/시간 활용하기datetime(파이썬 기본 라이브러리)      + https://docs.python.org/3/library/datetime.html datetime — Basic date and time typesSource code: Lib/datetime.py The datetime module supplies classes for manipulating dates and times. While date and time arithm..

Python list method, dictionary

Scala 자료형과 Sequence 자료형이 무엇인지와 차이Scalar 자료형의 정의 : 단일 값을 가지는 자료형ex) 정수(int 42), 실수(float 3.19), 불린(bool True, False)문자열(str Hello) 문자열 자체는 시퀀스지만 단일 문자열 변수는 스칼라로 간주될수 있다.Sequence 자료형의 정의 : 여러 개의 값을 순서대로 나열한 자료형. 각 값은 인덱스로 접근가능ex) 리스트[ 1,2,3 ], 튜플(1,2,3), 문자열 "hello" (인덱스로 접근가능), Scalar와 Sequence의 차이점구조 - Scalar는 단일값, Sequence는 여러값을 순서대로 저장접근방식 - Scalar는 단일값을 직접 사용, Sequence는 인덱스를 통해 각 요소에 접근사용 예- ..

python 가상환경, source venv/Scripts/activate

파이썬 예제 파일을 받아서 처음 해야할 일은 소스코드를 받아서 실행시켜보는것이 중요하다고 들었습니다.이런식으로 받은 예제파일이 pythonSource라는 파일이라면 sourceCode파일에서source venv/Scripts/activate 명령어를 사용해서 가상환경으로 들어가서 pythonSource 파일에 들어가야됩니다.그리고 ~~?.py 파일에 내용을 작성해서 저장 후(매우 중요) 실행시킬려면 터미널에 python ~~?.py 라고 입력하면 실행이 됩니다. Python에서 class의 뜻 -> 설명서입니다.어떠한 식별자( 함수, 변수)들이 어떠한 의미를 가지는지 기능을 가지는지 안내해주는 스타일 가이드입니다.먼저 자료형에 대해서는 많이들 알고 있을거라 생각하고 만약 본인이 입력한 내용이 무슨형인지 ..

2024-06-26 교육 2일차 git, python 환경설정

오전에는 git에 대해서 학습하였습니다.간단한 repository를 만든 다음이 url을 복사하고 원하는 디렉토리에서 git clone 복사한url  이라는 명령어를 입력하면 클론이 됩니다.그리고 해당 폴더로 이동해서 cat > hello.txt 파일을 만들었습니다.그 후, 변경 된 내용을 스테이징 영역으로 옮기는 방법은 여러가지가 있습니다.git add    --> 파일이나 디렉토리 변경내용의 일부분만 옮기려면 파일이나 디렉토리 경로를 넘긴다.git add .    --> 현재 디렉토리의 모든 변경 사항을 스테이징 영역으로 옮길땐 . 을 인자로 넘긴다.git add -A  --> 작업 디렉토리 내의 모든 변경 내용을 몽땅 스테이징 영역으로 넘기고 싶을 때는, -A 옵션을 사용합니다.그리고 git com..