<figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/1.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/2.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/3.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/4.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/5.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/6.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/7.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/8.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/9.jpeg"></figure><figure class="image image_resized" style="width:100%;"><img src="https://yozm.wishket.com/media/news/2123/10.jpeg"></figure><hr><p style="text-align:justify;">이번 편에서는 머신러닝의 강화학습에 대해 살펴보고자 합니다. 강화학습은 경험을 축적하는 것을 말합니다. 이는 사람이 무언가를 배우는 것과 비슷한데요. 경험을 통해 실력을 키워가는 과정이기 때문입니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">강화학습의 핵심은 일단 시도해 보고, 결과에 점수를 매기는 것인데요. 행동의 결과가 자신에게 유리했다면 보상을 받고, 불리했다면 벌을 받습니다. 이를 계속 반복하면서 더 나은 점수(보상)를 받기 위한 방향으로 학습하는 것이죠. 게임을 예시로 한번 생각해 보겠습니다. 플레이어는 게임에서 보다 높은 점수를 얻기 위해 장애물을 더 잘 피하는 방법이나, 함정의 위치 등을 학습하고 그에 맞는 대응을 할 것입니다. 즉, 판단력이 강화되어 게임을 더 잘하게 됩니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">강화학습은 이러한 과정을 모방하여 기계를 학습시킵니다. 2016년 이세돌 9단과의 바둑 경기로 유명해진 ‘알파고’ 역시 강화학습을 통해 바둑 게임 전체를 읽는 능력을 길렀다고 합니다. 스스로 훈련을 통해 더 좋은 선택을 배우는 강화학습은 어찌 보면 인간의 통찰력과도 닮아있다고 볼 수 있습니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"><strong>[쉽게 배우는 AI] 시리즈 보러 가기</strong></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/1985/">1. 머신러닝이란?</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/1997/">2. 머신러닝 모델이란?</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2004/">3. 데이터 산업과 직업</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2017/">4. 표와 데이터 셋</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2031/">5. 독립변수와 종속변수란?</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2043/">6. 상관관계와 인과관계</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2052/">7. 머신러닝의 분류</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2061/">8. 지도학습이란?</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2073/">9. 회귀 vs 분류</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2086/">10. 비지도 학습의 군집화</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2098/">11. 연관 규칙 학습이란?</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2111/">12. 비지도 학습의 목적</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2123/">13. 강화학습이란?</a></p><p style="text-align:justify;"><a href="https://yozm.wishket.com/magazine/detail/2139/">14. 머신러닝 수업을 마치며</a></p><p style="text-align:justify;"> </p><p style="text-align:justify;"><원문></p><p style="text-align:justify;"><a href="https://comicstack.io/classroom/471e035be8f4aed9b659c0be60ba621f"><u>비전공자를 위한 AI 클래스 13화. 강화학습이란?</u></a></p><p style="text-align:justify;"> </p><p style="text-align:center;"><span style="color:#999999;">©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.</span></p>