요즘IT
위시켓
새로 나온
인기요즘 작가들컬렉션
물어봐
새로 나온
인기
요즘 작가들
컬렉션
물어봐
개발
AI
IT서비스
기획
디자인
비즈니스
프로덕트
커리어
트렌드
스타트업
서비스 전체보기
위시켓요즘IT
고객 문의
02-6925-4867
10:00-18:00주말·공휴일 제외
[email protected]
요즘IT
요즘IT 소개작가 지원
기타 문의
콘텐츠 제안하기광고 상품 보기
요즘IT 슬랙봇크롬 확장 프로그램
이용약관
개인정보 처리방침
청소년보호정책
㈜위시켓
대표이사 : 박우범
서울특별시 강남구 테헤란로 211 3층 ㈜위시켓
사업자등록번호 : 209-81-57303
통신판매업신고 : 제2018-서울강남-02337 호
직업정보제공사업 신고번호 : J1200020180019
제호 : 요즘IT
발행인 : 박우범
편집인 : 노희선
청소년보호책임자 : 박우범
인터넷신문등록번호 : 서울,아54129
등록일 : 2022년 01월 23일
발행일 : 2021년 01월 10일
© 2013 Wishket Corp.
로그인
요즘IT 소개
콘텐츠 제안하기
광고 상품 보기
개발

[쉽게 배우는 AI] 13. 강화학습이란?

코믹스택
2분
2023.07.14.
4.9K

이번 편에서는 머신러닝의 강화학습에 대해 살펴보고자 합니다. 강화학습은 경험을 축적하는 것을 말합니다. 이는 사람이 무언가를 배우는 것과 비슷한데요. 경험을 통해 실력을 키워가는 과정이기 때문입니다.

 

강화학습의 핵심은 일단 시도해 보고, 결과에 점수를 매기는 것인데요. 행동의 결과가 자신에게 유리했다면 보상을 받고, 불리했다면 벌을 받습니다. 이를 계속 반복하면서 더 나은 점수(보상)를 받기 위한 방향으로 학습하는 것이죠. 게임을 예시로 한번 생각해 보겠습니다. 플레이어는 게임에서 보다 높은 점수를 얻기 위해 장애물을 더 잘 피하는 방법이나, 함정의 위치 등을 학습하고 그에 맞는 대응을 할 것입니다. 즉, 판단력이 강화되어 게임을 더 잘하게 됩니다.

 

강화학습은 이러한 과정을 모방하여 기계를 학습시킵니다. 2016년 이세돌 9단과의 바둑 경기로 유명해진 ‘알파고’ 역시 강화학습을 통해 바둑 게임 전체를 읽는 능력을 길렀다고 합니다. 스스로 훈련을 통해 더 좋은 선택을 배우는 강화학습은 어찌 보면 인간의 통찰력과도 닮아있다고 볼 수 있습니다.

 

[쉽게 배우는 AI] 시리즈 보러 가기

1. 머신러닝이란?

2. 머신러닝 모델이란?

3. 데이터 산업과 직업

4. 표와 데이터 셋

5. 독립변수와 종속변수란?

6. 상관관계와 인과관계

7. 머신러닝의 분류

8. 지도학습이란?

9. 회귀 vs 분류

10. 비지도 학습의 군집화

11. 연관 규칙 학습이란?

12. 비지도 학습의 목적

13. 강화학습이란?

14. 머신러닝 수업을 마치며

 

<원문>

비전공자를 위한 AI 클래스 13화. 강화학습이란?

 

©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.

에디터가 직접 고른 실무 인사이트 매주 목요일에 만나요.
newsletter_profile0명 뉴스레터 구독 중