요즘IT
위시켓
새로 나온
인기요즘 작가들컬렉션
물어봐
새로 나온
인기
요즘 작가들
컬렉션
물어봐
개발
AI
IT서비스
기획
디자인
비즈니스
프로덕트
커리어
트렌드
스타트업
서비스 전체보기
위시켓요즘IT
고객 문의
02-6925-4867
10:00-18:00주말·공휴일 제외
[email protected]
요즘IT
요즘IT 소개작가 지원
기타 문의
콘텐츠 제안하기광고 상품 보기
요즘IT 슬랙봇크롬 확장 프로그램
이용약관
개인정보 처리방침
청소년보호정책
㈜위시켓
대표이사 : 박우범
서울특별시 강남구 테헤란로 211 3층 ㈜위시켓
사업자등록번호 : 209-81-57303
통신판매업신고 : 제2018-서울강남-02337 호
직업정보제공사업 신고번호 : J1200020180019
제호 : 요즘IT
발행인 : 박우범
편집인 : 노희선
청소년보호책임자 : 박우범
인터넷신문등록번호 : 서울,아54129
등록일 : 2022년 01월 23일
발행일 : 2021년 01월 10일
© 2013 Wishket Corp.
로그인
요즘IT 소개
콘텐츠 제안하기
광고 상품 보기
IT서비스

휴머노이드 로봇은 왜, 그리고 어떻게 만드는 걸까?

먀.ai
10분
4시간 전
1.4K

테크콘 2025 로봇 콘퍼런스 리포트

 

테크콘 2025 <출처: 작가>

 

지난 6월 11일, ‘테크콘2025’에서 진행하는 로봇 콘퍼런스에 다녀왔습니다. <지능형 로봇과 인간 공존의 새로운 패러다임>이라는 주제로, 로봇의 미래를 더욱 기대하게 만드는 자리였는데요.

 

그날 콘퍼런스에서 참가자들이 가장 많이 언급한 키워드는 바로 ‘피지컬 AI(Physical AI)’였습니다. 현장에서는 특히 사람의 모습을 닮은 휴머노이드(humanoid) 로봇이 우리 삶에 얼마나 빠르게 다가오고 있는지 피부로 느낄 수 있었습니다.

 

테크콘2025, 한재권 교수 세션 <출처: 작가>

 

가장 흥미로웠던 세션은 한국 로봇공학 연구를 이끌고 있는 한양대 로봇공학과 한재권 교수의 발표였습니다. 휴머노이드 로봇 개발 기업인 ‘에이로봇’을 창업하며 이론뿐만 아니라 실무 경험까지 두루 갖춘 로봇 분야 전문가입니다.

 

이날 진행한 세션 <Physical AI와 Humanoid Robot의 최신 동향과 산업화>에서 그는 휴머노이드 로봇이 2030년 전에 상용화될 거라고 예상했습니다. 발표의 내용을 따라가며 여러 궁금증이 생겼습니다. 과연 우리는 왜 사람을 닮은 로봇을 만드는 걸까요? 휴머노이드를 개발하기 위해서는 어떤 기술이 필요할까요? 또 요즘 주목받고 있는 엔비디아의 ‘코스모스(Cosmos)’는 로봇 개발에 어떤 역할을 할까요? 발표 내용에 새로 조사한 내용을 더해 지금부터 함께 알아보겠습니다.

 

세계는 지금 ‘휴머노이드 로봇’

지난 4월 19일, 베이징에서 세계 최초로 휴머노이드(인간형) 로봇 마라톤이 열렸습니다. 그뿐만 아니라 테슬라(Tesla)는 올해 초, 휴머노이드 로봇 ‘옵티머스(Optimus)’ 제작 목표를 최대 10,000대로 잡고 있다고 밝혔습니다. 또한 BMW에 휴머노이드 로봇을 공급하기로 한 스타트업 피규어AI(Figure AI)는 연간 최대 12,000대를 생산할 수 있는 제조 시설을 구축했지요.

 

본격적인 휴머노이드 로봇 경쟁이 이미 시작된 것입니다.

 

베이징휴머노이드로봇혁신센터와 유비테크의 '톈궁 울트라'가 1위로 들어오는 모습 <출처: 로이터>

 

그런데 우리는 왜 굳이 ‘휴머노이드’ 로봇을 만들려고 하는 걸까요? 왜 로봇은 꼭 사람과 닮아야 할까요?

 

한재권 교수는 “휴머노이드 로봇의 본질은 사람과 닮은 외형 자체가 아니라, 그 형태 덕분에 얻을 수 있는 ‘범용성’”이라고 이야기했습니다. 다시 말해, 로봇도 인간과 비슷한 모습이어야 이미 사람에게 맞춰진 환경에 별도 변화 없이 적용할 수 있다는 것입니다. 예를 들어, 바퀴 달린 로봇은 오르기 힘든 계단이나 좁은 공간도 두 발로 걷는 휴머노이드라면 수월하게 다닐 수 있습니다.

 

우리나라는 출산율이 낮아지면서 노동력 역시 감소 중인데요. 이런 특성으로 휴머노이드 로봇은 집안일을 돕는 것부터 공장의 조립 작업, 혹은 위험한 산업 현장의 업무까지 다양한 분야에서 멀티플레이어급 활약을 기대할 수 있습니다.

 

특히 생성형 AI는 휴머노이드 로봇의 가치와 발전 속도를 더욱 앞당기고 있습니다. GPT 같은 거대 언어 모델(LLM)의 등장은 로봇의 ‘뇌’에 해당하는 소프트웨어의 지능을 완전히 다른 수준으로 발전시켰습니다. 이를테면 예전에는 상황에 따라 일일이 세세하게 로봇의 움직임을 프로그래밍해야만 했습니다. 하지만 지금은 LLM 기반의 AI가 방대한 지식을 바탕으로 스스로 맥락을 이해하고 판단할 수 있게 되었지요. 사람과 비슷하게 생긴 로봇에, 사람처럼 언어를 이해하고 문제를 해결하는 AI가 결합된다면 어떨까요? 간단한 지시나 질문만으로도 다양한 업무를 수행할 수 있게 될 것입니다.

 

즉, 우리가 휴머노이드를 만드는 진짜 이유는 단지 ‘인간을 닮은 존재를 만들기 위해서’가 아니라, ‘인간을 가장 잘 도와줄 수 있는 존재’를 만들기 위해서라고 볼 수 있습니다.

 

 

왜 바로 투입하지 않을까?

현재 공개된 휴머노이드 로봇, 테슬라의 ‘옵티머스’나 피규어AI의 ‘피규어02’의 시뮬레이션을 보면, 이들은 이미 여러 업무를 꽤 능숙하게 해내는 것처럼 보입니다.

 

소포 방향을 정렬하는 피규어AI의 휴머노이드, 피규어02. <출처: 피규어AI>

 

하지만 로봇이 실제 현장에 바로 투입되는 경우는 드뭅니다. 휴머노이드 로봇을 이렇게 잘 만들어 놓고도 바로 쓸 수 없는 이유는 무엇일까요? 상용화를 위해 남은 과제들을 하나씩 살펴보겠습니다.

 

배터리

휴머노이드 로봇은 균형을 맞추어 걷거나 팔을 움직이는 등 다양한 동작을 하는데요. 이런 동작은 에너지 소모가 큰 편입니다. 그래서 로봇의 체력이라 볼 수 있는 배터리가 든든하게 뒷받침되어야 합니다. 하지만 아직은 배터리의 에너지 밀도, 즉, 무게 대비 에너지 용량이 충분하지 않습니다. 결국 로봇의 활동 시간이 제한될 수밖에 없지요. 현재 대부분의 휴머노이드 로봇은 완전충전 후 평균 1~2시간 정도밖에 작동하지 못한다고 합니다. (물론 이 문제를 해결하기 위한 연구가 꾸준히 진행되고 있고, 실제로 최근 리튬이온 배터리의 에너지 밀도는 매년 약 5~8%씩 꾸준히 높아지는 추세입니다.)

 

고성능/저전력 AI 칩

휴머노이드 로봇이 정말 ‘똑똑한 로봇’으로 활약하려면, 눈으로 사물을 인지하고 언어를 이해하며 자율적으로 움직이는 작업들을 빠르게 처리할 강력한 두뇌 역할의 칩셋이 필요합니다.

 

액추에이터(actuator)

로봇이 사람처럼 자연스럽게 움직이려면 관절과 같은 기능을 하는 액추에이터 기술이 아주 중요합니다. 마치 사람의 근육처럼 강력하면서도 미세하게 움직임을 조절할 수 있는 모터와 감속기 기술이 필요한 것이죠. 또 로봇이 너무 무거우면 움직이기 어렵기 때문에, 가벼우면서도 힘이 좋은 액추에이터는 로봇의 성능을 좌우합니다.

 

상용화를 위한 핵심 기술 <내용: 한재권. 사진 출처: 작가>

 

그럼에도 한재권 교수는 이런 제약들이 굉장히 빠르게 해결되고 있는 만큼, 실제 현장에 투입되는 휴머노이드 로봇을 2020년대 안에 볼 수 있을 것으로 전망했습니다. 오픈AI의 샘 올트먼과 엔비디아의 젠슨 황이 “2027년에는 휴머노이드 로봇의 상용화가 가능할 것”으로 예측한 것과 유사합니다.

 

 

로봇을 학습시키는 법: 따라 하고, 상상하라!

휴머노이드 같은 범용 로봇이 실제로 우리에게 도움을 주려면, 튼튼한 몸과 뛰어난 두뇌 칩만큼 중요한 것이 또 있습니다. 바로 ‘학습’입니다. 아무리 근사한 로봇이 있어도 정작 할 줄 아는 게 없다면 고철 덩어리에 불과하겠죠.

 

기존의 산업용 로봇은 미리 정해진 똑같은 작업만 반복하도록 프로그래밍 되어 왔습니다. 그러나 휴머노이드와 같은 범용 로봇은 새로운 상황에도 스스로 적응할 수 있어야 합니다. 그래서 현재 로봇 연구자들은 ‘모방 학습(imitation learning)’이나 ‘강화 학습(reinforcement learning)’ 같은 AI 학습 기법을 적극 활용하고 있습니다.

 

그중에서도 ‘모방 학습’이란, 단어 그대로 사람의 시범을 모방하며 배우는 방식인데요. 예를 들어, 사람이 어떤 물체를 집어 옮기는 모습을 여러 번 보여주면 로봇은 그 데이터를 보고 행동을 학습하는 것입니다. 이런 시범 데이터는 사람의 움직임을 캡처하거나, VR 기기를 사용해 로봇을 조종한 데이터를 모으는 등 여러 방법으로 구축할 수 있습니다. 이렇게 배우면 비슷한 상황을 만났을 때 로봇은 마치 사람처럼 자연스럽게 행동할 수 있습니다. 마치 아기 사자가 어미를 보며 사냥하는 법을 배우듯 로봇도 사람의 모습을 보고 따라 하면서 지식을 습득하는 것이죠.

 

인간이 원격 제어로 로봇에게 행동을 학습시키는 모습 <출처: 논문 <RoboCopilot: Human-in-the-loop Interactive Imitation Learning for Robot Manipulation>>

 

다만 이 방법에도 한계는 있습니다. 사람이 모든 행동을 일일이 보여주기에는 시간이 오래 걸리고 그 범위도 제한된다는 것입니다. 모든 동작에 대해 시범을 보이기란 사실 불가능에 가깝습니다.

 

로봇 시뮬레이터, 아이작심(Isaac Sim)이란 무엇일까?

이 문제를 해결할 수 있는 핵심 비결은 ‘시뮬레이션’입니다. 특히 ‘아이작심(Isaac Sim)’ 같은 로봇 시뮬레이터를 이용하면, 가상환경에서 거의 무제한에 가까운 행동 데이터를 만들어낼 수 있습니다.

 

아이작심(Isaac Sim)은 엔비디아가 개발한 로봇 시뮬레이션 플랫폼입니다. 물리 기반의 3D 가상 환경에서 다양한 로봇을 시뮬레이션하고 학습시킬 수 있는 도구인데요. 시각적으로 정교할 뿐 아니라, 매우 현실적인 물리 환경에서 다양한 시뮬레이션을 수행할 수 있습니다.

 

아이작심 사용자 화면. 물건을 인지하고 집는 시뮬레이션 중이다. <출처: 엔비디아>

 

사용자는 이 가상 환경 안에서 로봇 모델과 센서, 작업 환경 등을 설정할 수 있습니다. 그런 다음 로봇의 행동을 수천~수만 번 반복하며 강화 학습이나 모방 학습에 필요한 데이터를 빠르게 축적할 수 있습니다. 물리 엔진과 3D 그래픽으로 현실과 유사한 가상 세계를 만들어 놓고, 그 속에서 로봇 수천 대를 동시에 돌리며 훈련시키는 방식입니다. 대량의 합성 데이터를 로봇의 머리에 채워 넣는다고 볼 수 있죠.

 

이렇게 하면 실제 로봇을 사용하지 않고도 다양한 환경과 작업 조건으로 로봇을 교육할 수 있습니다. 실제 로봇 한 대로는 하루 종일 움직여도 겨우 몇 시간 분량의 데이터밖에 못 모으지만, 아이작심의 가상 세계에서는 시간과 로봇 숫자를 수백~수만 배로 늘릴 수 있습니다. 엔비디아 연구원 짐 팬(Jim Fan)에 의하면, 휴머노이드 로봇은 아이작심으로 1년 치 움직임 학습을 1시간 만에 완료한 사례도 있다고 합니다. 마치 영화 속 닥터 스트레인지처럼 시간을 조절하면서 로봇에게 막대한 양의 훈련을 시킬 수 있는 것입니다.

 

시뮬레이션의 또 다른 장점은 안전과 경제성에 있습니다. 실제 로봇으로 학습하면 시행착오 과정에서 부딪히고 넘어지면서 망가질 위험이 큽니다. 하지만 가상 환경에서는 아무리 부서져도 리셋하면 그만입니다. 게다가 현실에서는 재현하기가 위험하고 어려운 화재 현장 또는 우주와 같은 환경도 디지털 세계에서는 무한히 생성하며 로봇을 단련시킬 수 있습니다.

 

아이작심 사용자 화면. 철로에 떨어진 물건을 인지하는 시뮬레이션 중이다. <출처: 엔비디아>

 

이렇게 시뮬레이터에서 훈련된 정책 모델을 실제 로봇에 이식하면 어떨까요? 처음 접한 현실에도 당황하지 않고 침착하게 대응할 수 있을 것입니다. (물론 가상 환경과 현실 사이 차이(sim-to-real gap)를 극복하기 위한 기술이 필요합니다.)

 

코스모스: 세계 모델(World Model)의 등장

아이작심(Isaac Sim)이 로봇이 다양한 상황에 잘 대처할 수 있도록 가상 데이터를 만들어내는 시뮬레이션 플랫폼이라면, 이렇게 만들어진 데이터를 학습해 로봇이 실제 세상을 이해하고 미래를 예측할 수 있게 도와주는 AI도 필요합니다. 최근 주목 받는 AI는 역시 엔비디아가 만든 ‘코스모스(Cosmos)’입니다. 엔비디아 CEO 젠슨 황이 로봇 상용화에 유독 자신감을 보이는 이유가 여기 있죠.

 

코스모스는 시각 정보와 언어, 그리고 로봇의 동작을 모두 입력받아 앞으로 일어날 상황을 예측한 영상을 생성하는 멀티모달 AI 모델입니다. 카메라에 비친 현재 장면과 텍스트 형태의 지시를 함께 입력하면, 로봇이 그 지시에 따라 행동할 때 어떤 일이 벌어질지를 시뮬레이션 영상으로 미리 생성해 주는 것입니다.

 

코스모스 시뮬레이션에서 로봇이 인식하는 세계의 모습 <출처: 엔비디아>

 

엔비디아는 코스모스를 ‘월드 파운데이션 모델(World Foundation Model)’이라고 부르며, AI가 현실 세계를 이해하도록 돕는 가상 물리 세계 엔진으로 설명합니다.

 

이 모델은 무려 2,000만 시간 분량의 비디오 데이터로 학습했다고 합니다. 하루 24시간 내내 쉬지 않고 본다고 해도 2,283년이 걸릴 정도의 데이터죠. 코스모스는 이 데이터에서 물체의 움직임과 상호작용, 그에 따른 결과로부터 중력, 마찰, 충돌 같은 물리 법칙들을 내재화했습니다. 예를 들어, 공이 굴러가는 영상을 수백만 시간 보면서 중력과 마찰의 효과를 익히고, 자동차가 달리는 영상을 수천만 시간 보면서 교통 상황의 패턴을 파악하는 방식입니다.

 

그렇게 코스모스는 단순히 픽셀을 흉내 내는 것이 아니라 현실의 규칙을 이해하고 표현하는 수준까지 도달했습니다. 실제 코스모스로 만든 영상은 물체의 무게나 움직임, 충돌 후의 상황까지도 실제 물리 법칙에 부합하도록 표현할 수 있습니다. 즉, 사람이 시나리오를 일일이 설계할 필요 없이 AI가 학습 시나리오를 만들고 로봇이 그것을 보면서 배우는 시대가 열린 셈입니다.

 

 

마치며

국제로봇연맹(IFR)에 따르면, 우리나라는 제조업 분야에서 노동자 1만 명당 산업용 로봇 1,012대를 사용하는 나라로 이 분야 세계 1위를 기록했습니다. 2위인 싱가포르(730대)와도 꽤 큰 격차입니다. (2022년 기준)

 

제조업 로봇 사용량 순위 <출처: IFR(International Federation of Robotics)>

 

이처럼 전자, 자동차, 조선 등 다양한 분야에서 쌓은 정밀한 생산라인과 자동화 기술에 바탕해 우리나라는 로봇을 활용하는 데 이미 익숙한 나라입니다. 특히 이번 ‘테크콘2025’에서는 대한민국의 로봇 기반 물류, 제조, 자율주행, 그리고 휴머노이드 기술들을 접할 수 있었는데요. 수많은 연구자가 보이지 않는 곳에서 얼마나 치열하게 기술 개발에 몰두하는지 새삼 느낄 수 있었습니다.

 

물론 지금 당장은 엔비디아를 비롯해 미국과 중국이 조금 더 앞서 있다고 할 수 있겠지만, 사실 로봇 산업은 이제 막 출발선을 지났다고 봐도 좋습니다. 무엇보다 로봇 산업의 최종 승자는 단순히 더 많은 로봇을 보유한 것이 아닌, 누가 더 빨리 로봇에게 똑똑한 두뇌를 장착하느냐에 따라 결정될 것입니다. 국내 로봇 산업의 발전을 응원하며 지켜보겠습니다.

 

©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.

에디터가 직접 고른 실무 인사이트 매주 목요일에 만나요.
newsletter_profile0명 뉴스레터 구독 중