요즘IT
위시켓
최근 검색어
전체 삭제
최근 검색어가 없습니다.

이번 편에서는 머신러닝의 강화학습에 대해 살펴보고자 합니다. 강화학습은 경험을 축적하는 것을 말합니다. 이는 사람이 무언가를 배우는 것과 비슷한데요. 경험을 통해 실력을 키워가는 과정이기 때문입니다.

회원가입을 하면 원하는 문장을
저장할 수 있어요!

다음

회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!

확인

개발

[쉽게 배우는 AI] 13. 강화학습이란?

년차,
어떤 스킬
,
어떤 직무
독자들이 봤을까요?
어떤 독자들이 봤는지 궁금하다면?
로그인

이번 편에서는 머신러닝의 강화학습에 대해 살펴보고자 합니다. 강화학습은 경험을 축적하는 것을 말합니다. 이는 사람이 무언가를 배우는 것과 비슷한데요. 경험을 통해 실력을 키워가는 과정이기 때문입니다.

 

강화학습의 핵심은 일단 시도해 보고, 결과에 점수를 매기는 것인데요. 행동의 결과가 자신에게 유리했다면 보상을 받고, 불리했다면 벌을 받습니다. 이를 계속 반복하면서 더 나은 점수(보상)를 받기 위한 방향으로 학습하는 것이죠. 게임을 예시로 한번 생각해 보겠습니다. 플레이어는 게임에서 보다 높은 점수를 얻기 위해 장애물을 더 잘 피하는 방법이나, 함정의 위치 등을 학습하고 그에 맞는 대응을 할 것입니다. 즉, 판단력이 강화되어 게임을 더 잘하게 됩니다.

 

강화학습은 이러한 과정을 모방하여 기계를 학습시킵니다. 2016년 이세돌 9단과의 바둑 경기로 유명해진 ‘알파고’ 역시 강화학습을 통해 바둑 게임 전체를 읽는 능력을 길렀다고 합니다. 스스로 훈련을 통해 더 좋은 선택을 배우는 강화학습은 어찌 보면 인간의 통찰력과도 닮아있다고 볼 수 있습니다.

 

[쉽게 배우는 AI] 시리즈 보러 가기

1. 머신러닝이란?

2. 머신러닝 모델이란?

3. 데이터 산업과 직업

4. 표와 데이터 셋

5. 독립변수와 종속변수란?

6. 상관관계와 인과관계

7. 머신러닝의 분류

8. 지도학습이란?

9. 회귀 vs 분류

10. 비지도 학습의 군집화

11. 연관 규칙 학습이란?

12. 비지도 학습의 목적

13. 강화학습이란?

14. 머신러닝 수업을 마치며

 

<원문>

비전공자를 위한 AI 클래스 13화. 강화학습이란?

 

요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.

좋아요

댓글

공유

공유

댓글 0
18
명 알림 받는 중

작가 홈

18
명 알림 받는 중
코믹스택(comicstack.io)은 개인의 성장을 위해서는 노출되는 환경이 중요하다고 믿고, 웹툰을 통해 누구나 쉽게 개발지식을 배울 수 있는 기회를 제공하는 개발툰 서비스입니다.
코믹스택은 개발을 좋아하는 분들께 즐거운 경험과 유익한 에피소드를 제공합니다.

좋아요

댓글

스크랩

공유

공유

요즘IT가 PICK한 뉴스레터를 매주 목요일에 만나보세요

요즘IT가 PICK한 뉴스레터를
매주 목요일에 만나보세요

뉴스레터를 구독하려면 동의가 필요합니다.
https://auth.wishket.com/login