1. 이동 평균
- 사용하는 경우 : 2019년 3월에서 5월까지의 서울 일별 평균 기온. 봄에서 이른 여름까지 기온이 변화한 내용을 파악하고 싶을 때 이동평균 사용
%amtplotlib inline #jupiter computer 시작하기
import matplotlib.pyplot as plt #pyplot을 plt로 불러오기
import pandas as pd #pandas를 pd로 불러오기
import numpy as np #numpy를 np로 불러오기
dat = pd.read_csv('temperature.csv', encoding='UTF-8') #csv 데이터 불러오기
n = len(dat) #데이터의 수를 세어라
x = range(1, n+1) #x축값 (1 ~ 데이터 수)
y = dat['평균기온'] #y축 값(평균기온)
plt.plot(x,y) #그래프를 그려라
2. 회귀직선
- 사용하는 경우 : 기온이 27도를 넘으면 아이스크림이 잘 팔린다, 운동하는 습관이 없는 사람은 비만인 경향이 있다 등과 같이 과거에 나타난 통계 데이터를 다루면서 미래를 예측하는 경우
1) 기온과 주스의 판매량
| 기온(x) | 23 | 24 | 28 | 24 | 27 | 21 | 18 | 25 | 28 | 20 |
| 주스의 판매량(y) |
37 | 22 | 62 | 32 | 74 | 16 | 10 | 69 | 83 | 7 |
>>> import numpy as np #numpy를 np로 불러오겠음
>>> mean_x = np.mean(x) #x의 평균값을 구하라
>>> mean_y = np.mean(y) #y의 평균값을 구하라
>>> cov = np.mean((x-mean_x)*(y-mean_y)) #x와 y의 공분산을 구하라
>>> var_x = np.var(x) #x의 분산 지정
>>> a = cov/var_x #기울기:x와y의 공분산 / x의 분산
>>> b = mean_y - (a * mean_x) #절편 : y의 평균 - (기울기 x x의 평균)

① %matplotlib inline
import matplotlib.pyplot as plt ←pyplot을 plt로 불러오겠음
import numpy as np ← numpy를 np로 불러오겠음
② x = np.array([23, 24, 28, 24, 27, 21, 18, 25, 28, 20]) #x축 배열 : 기온
y = np.array([37, 22, 62, 32, 74, 16, 10, 69, 83, 7]) #y축 배열 : 주스의 판매량
③ a, b = np.polyfit(x, y, 1) # 회귀직선 그리기
y2 = a * x + b #직선의 방정식
print('기울기: {0}, 절편: {1}'.format(a,b)) #기울기와 절편을 표시
④ plt.scatter(x,y) #산포도 나타내기
plt.plot(x, y2) #회귀직선을 그려라
plt.show()
'파이썬으로 다시 배우는 핵심고등수학 (python) > 07장 : 통계와 난수' 카테고리의 다른 글
| 7-5. 무작위로 값 선택하기 (0) | 2021.02.19 |
|---|---|
| 7-3. 관계 조사하기 (0) | 2021.02.19 |
| 7-2. 데이터가 흩어진 정도 조사하기 (0) | 2021.02.19 |
| 7-1. 통계란? (0) | 2021.02.18 |