인공지능(AI) 25

강화학습, GAN

RL(reinforce learning)강화학습 액션 : agent가 각 state 에서 취할 수 있는 action(동작) 의 옵션들 특정 state에 있을 때, 특정 actiondㅡㄹ 취하면 얻을 수 있는 reward가 있음 정책 : 특정 상태에서 어떤 행동을 취할 지 정해 놓은 것 value function 을 찾아내는 것이 목표 optimal policy : 목표를 달성하기 위해 모든 state에서 취해야할 적절한 action(행동)이 계산되어 있는 상태 => 강화학습 목표 예) cart-pole balancing, 게임 대부분 강화학습에 적용, 자율주행,지능형 로봇, 주식 거래(대규모지분 매각 시점 찾는데 탁웡ㄹ 투자자 손실을 최소화 및 최적의 이익을 취할 수 있는 가격대) GAN(Generati..

인공지능(AI) 2020.11.03

RNN(Recurrent Neural network), LSTM

딥러닝 모델은 연속적인 데이터가 아닌 현재의 snap shot만을 분석 - 데이터의 순서에 따른 정보를 효과적으로 분석 못함 RNN은 기존 딥러닝 모델에 시간적인 측면을 가미 ( 데이터 순서에 따른 영향도 효과적으로 분석) RNN은 연속적인 데이터를 분석하느데 최적화 된 모델 사용예) 자연어 처리, 문장 처리 주가, 부동산 데이터 처리 이전과거데이터가 지속적으로 있는경우 RNN특징 RNN은 다른 모델과 다르게 은닉층의 출력이 같은 은닉층의 입력으로 들어감 순환되는 RNN 구조를 시간 순서대로 펼친 구조 A(hidden layer)는 동일하며 시간에 따라 새로운input과 output이 생성 RNN을 이용한 모델링 유형 기본구조를 변형하여 다양한 유형의 문제에 적용 one to many -사진->단어들 m..

인공지능(AI) 2020.11.03

Deep Learning (딥러닝)

AI(인공지능) : 학습, 문제 해결, 패턴 인식 등을 인지 문제를 해결하는 융합된 공학분야 1943년에 처음 나옴. Deep Mind : 12명 인공지능 전문가로 구성된 회사를 2014년 1월 구글에서 인수 * 심볼릭 AI(rule based AI) -1950년 ~ 1980년 - 프로그래머에 의해 명시적인 규칙만으로 문제를 해결 하는 접근 방식 - 잘 정의된 논리적인 문제 해결에 적합 (규칙, 데이터)-> 심볼릭AI -> 정답 - 한계 : 문제 더 복잡하고 불분명, 무한대의 규칙 등 쟁점 :컴퓨터가 스스로 처리 가능? 컴퓨터 스스로 데이터를 보고 규칙을 학습가능한가? * 머신러닝(Machine Learning) : 수많은 데이터로부터 기계가 배운다.(1959) 컴퓨터가 명시적인 프로그램이나 규칙 없이도..

인공지능(AI) 2020.11.03

classifier model- 앙상블

* diceision tree 문제점 - overfitting - 학습데이터에만 최적화 - max_depth : 깊이를 조절 - gini : 불순도, (불순도 0이 될 때까지 계속 분기) - gini 계수, 엔트로피 - 컬럼이 많아지면 속도 느려짐 - max_features : 피쳐 갯수를 조절 * 앙상블 모델 - voting : 동일한 데이터셋으로 서로 다른 알고리즘 결합, 다수결로 'a'일 것이다 - bagging : sampling을 통해 여러개의 데이터셋 추출 (bootstrapping 분할 방식) 디시젼 트리를 반복결합 sampling 중복 허용해서 뽑음 예측 후 다수결로 'a'일 것이다라고 뽑음. - boosting : 여러개의 디시젼 트리모델을 춘차적으로 학습 진행 앞서 학습한 모델이 틀리게..

인공지능(AI) 2020.11.03

epochs, batch size, iteration

I. epochs - 한번의 epoch는 인공신경망을 전체 데이터셋에 데해 forward pass/backward pass 과정을 거친 상태, 즉, 전체 데이터 셋에 대해 한 번 학습을 완료한 상태를 말한다. - backpropagation : 입력부터 출력까지 각 계층의 weight를 계산하는 과정을 거치는 forward pass를 반대로 거슬러 가면서 다시 한 번 계산 과정을 거처 기존의 weight를 수정하는 backward pass로 나뉜다. 전체 데이터 셋에 (forward + backward pass)과정이 완료 되면 한번의 epoch가 진행 되었다고 볼 수 있다. - epoch =40 이면 전체 데이터 학습을 40번 거친 것으로 보면 된다. - 적절한 epoch값을 설정해야 underfitt..

인공지능(AI) 2020.10.20

Supervised - Random Forest

* Random Forest - Decision Tree의 확장판 - Tree를 여러개를 사용하면 더 성능이 좋아짐 - 다수의 의사결정나무(Decision Tree)를 사용하여 서로 다른 모델을 조합하여 새로운 모델을 만듬 - 앙상블(Ensemble) : 여러가지 모델을 사용하여 정확도를 개선 - 다양성(diverse)과 임의성(random)을 부여 - Overfitting(과적합) 발생 가능성을 줄 일 수 있다. - 예측은 증가하고, 잘못된 예측은 상쇄 역할 * bagging(bootstrap + aggregating) - 기존 데이터를 사용하여 여러개의 train data를 생성 - 서로 다른 train data를 decision tree를 만듬 - Bootstrap 데이터는 기존 데이터에서 단순 복..

인공지능(AI) 2020.10.20

Supervised - Descision Tree

* Supervised Learning(지도 학습) Decision Tree(의사결정 나무) - 2가지 이진 질의의 분류 규칙으로 root node의 질의 결과에 따라 가지를 타고 뻗어 이동하여 leaf까지 도달함. I. 2가지 다 적용 가능함. a. 범주형 자료 : Classification Tree b. 수치형 자료 : Regression Tree II. Rule 기반 의사 결정 Root node : 최상위 노드 Splitting (Branch) : 하위노드로 분리 Decision Node (Parent Node): 2개의 하위 노드로 분리 Leaf(Child Node): 더이상 분리되지 않는 최하위 노드 장점 규칙기반으로 직관적으로 이해 쉽고 설명력이 좋음 - 불순도 기반한 최적 분류 - 분리 과정..

인공지능(AI) 2020.10.19

Supervised - Logistic Regression and Validation

One-Hot Encoding 하나의 값만 True(1), 나머지 값은 False(0) 'bird' -> [1,0,0] 'dog' -> [0,1,0] 'cat' -> [0,0,1] 문자형 변수를 숫자형으로 변환 Scaling(범위) - 다른 변수와의 범위를 비슷하게 맞추기 위한 목적 - ex) X0: 1에서10사이 스케일, X1:1000에서 100만사이 스케일 Nomalization(정규화) - 변수 스케일을 0~10사이 범위로 맞추는것 - X = (X-min(X)) /(max(X)-min(X)) Standardization(표준화) - 변수의 평균을 0, 표준편차를 1로 만들어 정규분포의 특증을 만듬 - 표준화는 가중치(w) 학습으 더 쉽게함. X_stand = (X-mean(X))/std(X) Con..

인공지능(AI) 2020.10.19

Supervised - Logistic Regression - Cross Entropy Error (CEE)

classification 의 validation I. Information Theory(정보이론) - Information Gain(정보 이득량) 자주발생 하지 않는 사건> 자주발생하는 사건 (크다는 것은 정보량이 많다.) I(x) = -log(P(x)) P(x) : 예측값 Entropy(불확실성의 척도) : 불확실성이 클 수록 정보량이 많다.(Error율이 높다) (ex: 해는 항상 뜨지만(자주발생하는 사건), 만약에 해가 안뜬다면(자주발생하지 않는 사건) 거기에서 오는 충격(error율)은 크다) 확률 변수의 평균 정보량(기댓값) a. Engropy = E(-log(p(x))) b. -sum(p(x)*log(p(x))) c. 놀람의 평균 정도 d. 불확실성(entropy)가 낮으면 분류 정확도가 높..

인공지능(AI) 2020.10.19