본문 바로가기

강화학습

강화학습(Reinforcement learning) 상/벌의 반복을 통해 학습 지도학습 : 배움 = 강화학습 : 경험 * 게임 실력자가 되는 과정 관찰의 결과에 따라서 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고 더 적은 벌을 받을 수 있는지를 알게 됨 = 판단력이 강화된 것 판단에 따라서 행동을 하게 되고 그 행동은 게임에 변화를 주게 됨 → 이 과정을 반복하면 판단력이 점점 강화됨 * 강화학습 과정 게임 = 환경(environment) 게이머 = 에이전트(agent) 상태 = state 상/벌 = 보상(reward) 판단 = 정책(policy) 행동 = action 강화학습의 목적 : 상태에 따라서 더 많은 보상을 받을 수 있는 행동을 에이전트가 할 수 있도록 하는 정책을 만드는 것 강화학습 사례 : http://bit.ly/ml1-regress.. 더보기
머신러닝의 분류 (지도학습, 비지도학습, 강화학습) 지도학습(Supervised learning) 정답이 있는 문제를 해결하는 것 기계를 가르친다는 의미 문제집을 푸는 것과 비슷함 (문제를 풀고, 정답을 비교하고 맞추다 보면, 문제를 푸는 것에 익숙해짐 → 이후에는 비슷한 문제를 만나면 오답에 빠질 확률이 점점 낮아짐) 데이터를 컴퓨터를 학습시켜서 모델을 만드는 방식 역사적 : 과거의 원인과 결과를 바탕으로 결과를 모르는 원인이 발생했을 때 어떠한 결과를 초래할 것인가 추측하는 것이 목적 독립변수와 종속변수가 꼭 필요함 분류(Classification), 회귀(Regression) 비지도학습(Unsupervised learning) 무엇인가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것 지도학습에 포함되지 않는 방법 기계에게 데이터에 대한 통찰력을.. 더보기