AI & Deep Learning/이론 (8) 썸네일형 리스트형 multinomial logistic regression - Softmax 7. Softmax regression - multinomial logistic regression : 여러 개의 클래스가 있을 때 예측, 그 중에서도 가장 많이 사용되는 softmax - 지난 포스트 정리 : binary classificaion : z 가 아주 커지거나 아주 작아지더라도 g(z) 가 0과1 사이의 값을 갖도록 연구, 그래서 나온 것이 sigmoid 함수 : sigmoid함수를 이용해서 0-1 사이로 압축 : 최종 hypothesis 는 이렇게 나타남 그림으로 정리, : 입력 값 x 를 WX 라는 수식에 넣고, 나온 값인 z를 sigmoid 함수에 넣어 값을 도출 : Y 는 실제 데이터, Y 햇은 예측 데이터(H(x)) ex> 공부 시간, 출석 횟수에 따른 등급data set : A, .. Logistic Classification Cost 함수 6. Logistic Classification Cost 함수 소개 - cost function : linear 와는 다르게 classification 의 cost 함수에서는 어느 지점에서 시작하느냐에 따라 도착지점이 달라지게 됨 : 이 부분부분의 최소점을 Local minimum, 최종적인 전체에서의 최소점을 Global minimum 이라고 함 : 학습이 local에서 멈춰버리면 나쁜 prediction 이 됨 -> 따라서 cost 함수를 바꾸어야 함 - binary classification 이므로, y=0/y=1 일 때의 경우를 나누어 cost 함수를 적용 : 실제로 에서 (지수함수) 의 곡선의 형태를 상쇄시켜주는 것이 로그함수, 따라서 실제 값 0 or 1에 따라 다른 로그 함수를 적용 1) y.. Logistic Classification (Binary) 5. Logistic(Regression) Classification : classification 알고리즘 중 정확도가 굉장히 높음 : 실제 문제에도 바로 적용이 가능 : 뉴럴 네트워킹, 딥 러닝을 잘 이해하는 것이 목표인 이 수업에서 중요 - 이전의 regression 은 어떤 숫자를 그냥 예측하는 것이라면, binary classification 은 둘 중 하나를 고르는 것 ex> spam detection : spam(1) or Ham(0) ex> Finance(주식시장)에서 SELL or BUY ex> 공부 시간으로 따진 pass(1) or fail(0) Q. linear regression 으로도 가능해보임? A. 그러나 만일 어떤 친구가 50시간 공부했다면, linear 에 따라 많이 위로 .. Multi variable linear regression 4. Multi variable linear regression : 여러 개 입력(feature)의 Linear regression - 하나의 input variable Hypothesis : H(x) = Wx+b : W와b 를 학습 Cost function Gradient descent algorithm - 여러 개의 input ex> 시험을 보는데 시험1,2,3 의 결과를 가지고 final 시험 점수를 예측(input 3개) : H(x1,x2,x3) = w1x1 + w2x2 + w3x3 + b //예측 //예측 값과 실제 값의 차이의 제곱의 평균 - n개가 된다면, : w1x1 + w2x2 + w3x3 + ... +wnxn : 복잡해지고 길어지므로, Matrix(행렬) 사용 - Matrix multi.. Linear Regression cost 함수 최소화 3. Linear Regression cost 함수 최소화 가 최소값을 가지도록 하는 W,b 를 구하는 것이 목표! 설명을 위해 Simplified hypothesis 를 예시로 듦 H(x) = Wx (b=0 으로 봄) data set : : W=1, cost(W) =0 : W=0, cost(W) =4.67 : W=2, cost(W) =4.67 ... -> 함수를 그려보면, : 목표는 cost 가 0이 되는 점을 기계적으로 찾아내는 것 -> cost function 을 minimize하는데 많이 용되는 알고리즘이 Gradient descent algorithm : 머신러닝, 또는 이외의 minimization problems 에 사용 : cost값이 하나가 아니라 W1,W2,W3..일 경우에도 사용 Q... Linear Regression 의 개념 2. Linear Regession의 개념 - supervised learning : training data set 이용, 학습 1) regression : 예측하려는 최종 목표가0~100 등인 범위 내에서 예측하는 것 2) binary classification 3) multi-label classification - Linear Regression : 어떤 데이터 셋의 결과가 linear 한 선의 형태를 띄는 것 - Linear Hypothesis : 어떠한 데이터에 잘 맞는 linear 한 선을 찾는 것 : H(x)가설, W 와b 의 값에 따라 선의 모양이 달라질 것 : 가장 적합한 W 와 b 의 값을 찾아내는 것이 목표 ex> 파란선: H(x) = 1 * x + 0 - 어떠한 모델(선, 가설)이.. tensorflow 의 기본 1-1. 텐서플로우의 기본 - 텐서플로우: 기본적으로 구글에서 만든 머신 지능을 위한 오픈 소스 라이브러리 Q. 많고 많은 머신 알고리즘 라이브러리 중 왜 텐서플로우냐? A. 많은 사람들이 사용하기 때문에 자료가 많고 미리 구현해 둔 소스코드도 많아서 라이브러리 공부에 텐서플로우가 적합 - 텐서플로우 : 데이터 플로우 그래프를 사용해서 뉴메리컬한 계산을 할 수 있는 라이브러리 : 파이썬이라는 언어를 사용하여 텐서플로우 프로그래밍을 함 - 데이터 플로우 그래프 (Data flow graphs) : 노드와 노드간을 연결하는 엣지로 구성된 것 : 노드 하나가 오퍼레이션(연산자), 엣지가 데이터(텐서, tersors) 이런 것들을 거치면서 연산을 하고 내가 원하는 결과를 얻거나 작업을 하는 것이 데이터 플로우 .. 머신 러닝의 개념 머신러닝이란: 일종의sw. 어떠한 입력을 기반으로 결과를 보여주는 것이 explicit 프로그램, 그런데 정확하게 나타내기 어려운 경우가 있다 -> ex.스팸 메일 자동 필터링 같은 경우 -> ex. 구글의 자율 운전 자동차 1959년, 아더가 어떠한 현상에서 자동적으로 배워내게 만들면 어떨까 하는 생각에서 나타난 것이 머신 러닝 -> 프로그램인데 개발자가 일일이 정하는 것이 아니라 프로그램 자체가 어떤 데이터를 보고 학습해서 어떤 것을 배우는 명령을 같는 프로그램 학습을 하기 위해 어떤 데이터가 주어져야 하는데 학습 방법에 따라2가지로 나뉨 1. supervised : 감독관, label, 정해져 있는 데이터(training set) 을 가지고 학습을 하는 것 : ex 1. image labeling .. 이전 1 다음