2. Linear Regession의 개념
<중간 정리>
- supervised learning : training data set 이용, 학습
1) regression : 예측하려는 최종 목표가0~100 등인 범위 내에서 예측하는 것
2) binary classification
3) multi-label classification
- Linear Regression
: 어떤 데이터 셋의 결과가 linear 한 선의 형태를 띄는 것
- Linear Hypothesis
: 어떠한 데이터에 잘 맞는 linear 한 선을 찾는 것
: H(x)가설, W 와b 의 값에 따라 선의 모양이 달라질 것
: 가장 적합한 W 와 b 의 값을 찾아내는 것이 목표
ex> 파란선: H(x) = 1 * x + 0
- 어떠한 모델(선, 가설)이 실제 데이터와 거리가 가까울 수록 좋음
그 거리를 측정하는 것이
-> Cost function (Loss function)
가장 기본적인 방식은 차를 구하는 것
H(x) - y
: 좋은 방법은 아님 -> 음수, 양수 둘다 나올 수 있기 때문에
따라서
(H(x) -y )^2
: 제곱을 해서 사용
-> 일정하게 양수로만 표현됨
-> 차이가 작을 때보다 클 때 패널티를 더 많이 줄 수 있음
: 이것을 cost function 이라고 함
좀 더 formal 하게 정리,
H(x) = Wx+b 에 대한 가설의 cost function
: 여기서 cost 의 최소값을 가지게 하는 W 와 b 를 구하는 것이 Linear regression 의 학습이자 목표
출처 : 모두의 딥러닝 https://hunkim.github.io/ml/
'AI & Deep Learning > 이론' 카테고리의 다른 글
Logistic Classification (Binary) (0) | 2019.04.01 |
---|---|
Multi variable linear regression (0) | 2019.04.01 |
Linear Regression cost 함수 최소화 (0) | 2019.04.01 |
tensorflow 의 기본 (0) | 2019.04.01 |
머신 러닝의 개념 (0) | 2019.03.31 |