1. 이동 평균 

- 사용하는 경우 : 2019년 3월에서 5월까지의 서울 일별 평균 기온. 봄에서 이른 여름까지 기온이 변화한 내용을 파악하고 싶을 때 이동평균 사용

%amtplotlib inline #jupiter computer 시작하기 
import matplotlib.pyplot as plt #pyplot을 plt로 불러오기
import pandas as pd #pandas를 pd로 불러오기
import numpy as np #numpy를 np로 불러오기

dat = pd.read_csv('temperature.csv', encoding='UTF-8') #csv 데이터 불러오기
n = len(dat) #데이터의 수를 세어라
x = range(1, n+1) #x축값 (1 ~ 데이터 수)

y = dat['평균기온'] #y축 값(평균기온)
plt.plot(x,y) #그래프를 그려라

 

 

 

2. 회귀직선

- 사용하는 경우 : 기온이 27도를 넘으면 아이스크림이 잘 팔린다, 운동하는 습관이 없는 사람은 비만인 경향이 있다 등과 같이 과거에 나타난 통계 데이터를 다루면서 미래를 예측하는 경우 

 

1) 기온과 주스의 판매량

기온(x) 23 24 28 24 27 21 18 25 28 20
주스의
판매량(y)
37 22 62 32 74 16 10 69 83 7

 

>>> import numpy as np #numpy를 np로 불러오겠음
>>> mean_x = np.mean(x) #x의 평균값을 구하라 
>>> mean_y = np.mean(y) #y의 평균값을 구하라
>>> cov = np.mean((x-mean_x)*(y-mean_y)) #x와 y의 공분산을 구하라 

>>> var_x  = np.var(x) #x의 분산 지정

>>> a = cov/var_x #기울기:x와y의 공분산 / x의 분산
>>> b = mean_y - (a * mean_x) #절편 : y의 평균 - (기울기 x x의 평균)

① %matplotlib inline 

    import matplotlib.pyplot as plt ←pyplot을 plt로 불러오겠음

    import numpy as np ← numpy를 np로 불러오겠음

 

② x = np.array([23, 24, 28, 24, 27, 21, 18, 25, 28, 20]) #x축 배열 : 기온

    y = np.array([37, 22, 62, 32, 74, 16, 10, 69, 83, 7]) #y축 배열 : 주스의 판매량

 

③ a, b = np.polyfit(x, y, 1) # 회귀직선 그리기 

    y2 = a * x + b #직선의 방정식

    print('기울기: {0}, 절편: {1}'.format(a,b)) #기울기와 절편을 표시 

    

④ plt.scatter(x,y) #산포도 나타내기

    plt.plot(x, y2) #회귀직선을 그려라 

    plt.show()

 

 

+ Recent posts