회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 이용 중이라면 월 최대 15% 할인받으세요
웹이 인간의 방식으로 사고할 수 있을 정도로 진화한다면, 웹은 그 엄청난 정보처리 능력을 바탕으로 신적인 존재가 될 수도 있을 것입니다. 그렇게 되면 웹에 의해 꿈같은 세상이 펼쳐질지, 아니면 웹이라는 초월적 존재가 인간을 지배하는 일이 생길지 누구도 알 수 없습니다. 그렇지만 웹이 탄생한 지 얼마 되지 않아, ‘팀 버너스 리’는 또 다른 웹의 비전을 제시하였습니다.
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
웹이 인간의 방식으로 사고할 수 있을 정도로 진화한다면, 웹은 그 엄청난 정보처리 능력을 바탕으로 신적인 존재가 될 수도 있을 것입니다. 그렇게 되면 웹에 의해 꿈같은 세상이 펼쳐질지, 아니면 웹이라는 초월적 존재가 인간을 지배하는 일이 생길지 누구도 알 수 없습니다. 그렇지만 웹이 탄생한 지 얼마 되지 않아, ‘팀 버너스 리’는 또 다른 웹의 비전을 제시하였습니다.
1991년 유럽입자 물리연구소에서 하이퍼텍스트 기술이 구현된 월드와이드웹을 만든 ‘팀 버너스 리’는 1998년, “사람이 이해하는 정보의 의미를 컴퓨터도 이해하고, 그러한 이해를 바탕으로 정보를 처리하는 웹”이라는 다소 생소한 ‘시맨틱 웹(semantic web)’ 개념을 제안했습니다. 인터넷의 아버지 팀 버너스 리는 거미줄과 같이 얽혀 있는, 자신이 만든 웹을 좀 더 똑똑한 것으로 만들고 싶었습니다. 웹이 처음 나왔을 때 인간의 두뇌를 닮아 있다는 통찰을 느끼게 했던 것을 실제로 구현하고 싶었던 것인데요. 팀 버너스 리 자신은 시맨틱 웹이 훨씬 더 겸허하고 단계적인 표현이라고 하지만, 일반인이나 IT 관련 종사자들은 여기서 더 높아진 웹의 모델을 상상할 수 있었습니다.
시맨틱스(semantics)의 어원은 의미 혹은 의미론을 뜻합니다. 따라서 시맨틱 웹(semanticweb)을 쉽게 설명하면 의미를 이해하는 웹입니다. ‘웹이 인간의 두뇌를 닮은 것이 되기 위해서는 정보를 단지 축적하거나 연결하는 것만이 아닌, 그 의미까지 이해할 수 있어야 한다.’라는 것이 바로 다음 버전의 웹, 의미체계 웹이라고 하는 시맨틱 웹의 목표점입니다.
여기서 의미를 이해한다는 것은 2가지 방식으로 이해할 수 있습니다. 첫 번째는 웹이 인간이 준 데이터를 스스로 이해한다는 의미입니다. 두 번째는 인간이, 컴퓨터와 웹이 의미를 이해할 수 있도록 데이터를 전달하여 웹이 좀 더 효율적으로 정보를 처리한다는 것입니다. 어떤 경우든 마치 인간이 지식과 정보를 이해하는 것처럼 웹이 데이터를 다룰 수 있습니다. 전자는 강한 인공지능(인간과 같이 사고하고 행동하는 컴퓨터 프로그램)의 개념과 통하는데 이것은 아직은 요원한 일이며, 현재는 시맨틱 웹이 후자의 길을 먼저 밟고 있는 상황입니다.
팀 버너스 리가 처음 이야기 꺼냈을 때 많은 사람들은 시맨틱 웹을, 강한 인공지능의 개념으로 생각했기에 어려운 점이 많았습니다. 처음부터 목표가 너무 높았기에 상당한 혼돈의 과정을 거쳐야 했습니다. 하지만 이제는 점차 현실적인 기술들에 천착하며 자리를 잡아가고 있습니다.
이를 바탕으로 시맨틱 웹을 다시 한번 정의해 보겠습니다. 시맨틱 웹은 컴퓨터가 웹 정보의 의미를 스스로 이해, 검색, 추출, 해석, 가공하게 하는 인공 지능을 갖춘 웹입니다. 인터넷의 각종 리소스(웹 문서, 각종 파일, 서비스 등)에 대한 정보와 자원 사이의 관계를 의미 정보(Semanteme, 의미의 최소 단위)로 만들어 컴퓨터가 처리할 수 있는 온톨로지 형태로 표현하고, 이를 처리하도록 한 프레임워크 혹은 기술을 말합니다.
여기서 온톨로지(ontology, 개념 간의 연관 관계)는 무엇일까요? 그것은 시맨틱 웹의 핵심적인 기술로 이야기되고 있습니다. IT에서 온톨로지는 데이터에 대한 모든 의미를 컴퓨터가 이해하고 처리할 수 있는 방식으로 번역하는 기술, 지식, 수단의 총체를 의미합니다.
온톨로지에 대한 예를 하나 들면 컴퓨터에게 어떤 데이터의 관계, 속성을 알려주는 것입니다. 초등학교 선생님의 아래에는 제자들이 있고, 위에는 교장 선생님이 있습니다. 선생님은 남자 혹은 여자이며, 하나의 과정만 운영합니다. 선생님의 가장 대표적인 활동은 강의이며, 교실이라는 장소를 사용합니다. 이렇게 하나의 데이터 자원에 대하여 그와 연관된 관계, 제약사항 등과 같은 다양한 속성을 제공함으로써 의미를 부여하는 것입니다.
이와 같이 온톨로지는 시맨틱 웹=의미체계 웹이 가능하도록 컴퓨터에게 데이터의 관계, 한계라는 속성을 가르쳐 데이터의 의미를 알 수 있게 하고, 인간에게 더 유용한 방식으로 처리할 수 있도록 만드는 기술입니다.
어쩌면 인간이 한 대상에 대한 의미를 이해하는 것도 이와 같은 관계에 의한 방식일 것입니다. 불교의 경전에는 이것이 없으면 저것도 없다고 하여 만물이 서로에게 의존하여 존재하는 관계라고 설명하고 있습니다. 즉, 관계에 의해서만 존재가 가능하다는 것입니다.
불교 용어 중에는 인드라망이라는 것이 있는데, 인드라망은 제석천이라는 천신들의 왕이 머무는 궁전 위에 무한하게 펼쳐진 그물, 거미줄(web) 같이 얽힌 그물을 말합니다. 각 그물코에는 구슬이 달려 있는데, 한 구슬에는 모든 그물코의 구슬이 비칩니다. 그리고 모든 구슬의 영상이 담긴 구슬은 또다시 다른 구슬에 비칩니다. 이렇게 서로 무한하게 비치는 구슬의 형상이 인드라망입니다. 컴퓨터 역시 인드라망처럼 한 자원의 의미를 이해하기 위해서는 서로 관계하는 여타 자원들, 그리고 그 자원들과 관계하는 방식에 대한 값을 알아야 할 것입니다.
시맨틱 웹이 현실적으로 적용되고 있는 사례를 보면 아마존, 이베이, 넷플릭스 등에서 활용하고 있는 서비스 사용자의 매매 거래 데이터의 분석, 그리고 태그 등과 같은 메타 데이터가 중요합니다. 거래 데이터를 통한 사용자의 구매 패턴으로 사용자의 동선과 취향을 파악할 수 있고, 메타 데이터를 통해서 의미를 읽어낼 수 있습니다.
메타 데이터라는 것은 메타 인지와 비슷한 것입니다. 우리가 나 자신을 어떤 정보로 얼마나 알고 있는지, 어떤 생각을 하고 있는지에 대한 생각을 메타인지라고 하듯이 메타 데이터는 데이터가 무엇인지를 이야기하는 데이터를 말합니다.
<복학왕>이라는 만화 데이터가 있다면 그 데이터가 언제부터 언제까지 연재되었고, 그 작가가 누구이며, 그 데이터가 스릴러 물인지, 학원 물인지, 로맨스 물인지, 분류는 어떻게 되고, 나아가 그 데이터를 만든 작가의 다른 작품들은 어떻게 되는지 등에 관한 내용입니다. 또한, 매매 데이터를 통한 사용자의 동선 혹은 구매 패턴의 분석을 할 수 있습니다. 이렇게 데이터를 분석하는 것을 데이터 마이닝이라고 합니다.
이렇게 각종 거래 데이터를 비롯한 여러 가지 웹에서의 활동 내역을 취합한 데이터를 분석하는 데이터 마이닝과 메타 데이터를 통해 웹은 마치 데이터의 의미를 이해하는 것처럼 활동할 수 있습니다.
이에 따라 초기 단계의 시맨틱 웹은 나의 질문에 대해서 더 정확한 답변을 내줄 수 있고, 내가 말하는 것을 듣고, 내 기분을 생각해서 출근할 옷을 추천해 주거나, 어렸을 적에 듣던 노래를 틀어줄 수도 있을 것입니다. 웹이 친근한 가족, 친구, 혹은 연인처럼 움직이게 되는 것입니다.
이러한 시맨틱 웹의 최근 변화 양상은 빅데이터와 연결 지어 생각할 수 있습니다. 웹에서의 활동이 인간의 보편적인 생활양식으로 자리 잡은 이후 지구촌에서는 천문학적인 데이터가 축적되고 있습니다. 페이스북에서만 하루에 수십억 개의 콘텐츠가 공유되고, 페이스북 서버에서는 수백 테라바이트의 사용자 신규 데이터를 처리하고 있다고 합니다.
지금은 이러한 빅데이터를 데이터 마이닝을 해서 가치 있는 데이터와 가치 없는 데이터를 분류하고, 데이터의 의미와 패턴을 밝혀서 정제된 스마트 데이트를 추출해 내고 있습니다. 스마트 데이터는 분석이 가능한, 정확하고 빠르고 실효성이 있는 데이터입니다. 기업들이 빅데이터를 활용하면서 산업 전 분야에서 많은 비용 절감이 이뤄지고 있고, 고객 자신조차 몰랐던 숨은 취향까지 밝혀내고 있습니다. 빅데이터는 이렇게 시맨틱 웹의 지향을 하나씩 실천하고 있는 중입니다.
단계별로 생각해 보면 시맨틱 웹의 3단계는 온톨로지(초기 시맨틱 웹), 빅데이터, 인공지능(이상적 시맨틱 웹)이 합쳐진 상태라고 말할 수 있습니다. 물론 이것은 편의상의 분류일 뿐, 시기를 떠나서 동시에 서로 영향을 주고받으면서 발전하는 것입니다.
그렇다면 빅데이터의 주역들은 누구일까요? 페이스북, 유튜브와 같은 SNS, 구글과 같은 검색 포털, 아마존과 같은 전자상거래 업체들 등등입니다.
구글의 창업자 래리 페이지는 유럽 지역 파트너와의 콘퍼런스에서 궁극적인 검색엔진은 세상에 대한 모든 것을 알고 있으며, 무엇이든지 물어보면 정확한 답변을 즉각적으로 제공하는 것이라고 이야기했습니다. 이것은 과거 우리가 상상하던 신에게서나 가능한 일이었습니다. 그는 IT 기술로 형상화된 신의 모습을 구글을 통해 찾았으며, 그것은 래리 페이지 이전에 팀 버너스 리가 먼저 이야기했던 시맨틱 웹의 이상이기도 합니다.
또한, 많은 IT 전문가들은 구글이 현재 개발하고 있는 인공지능이 시맨틱 웹을 바탕으로 인간의 좋은 친구나 비서, 에이전트 역할을 할 것으로 낙관적인 전망을 내놓았습니다. 우리가 휴가지를 결정하면 거기에 필요한 비행기 티켓에서부터 모든 것을 알아서 처리하고, 계절이 바뀌면 우리의 취향에 맞는 옷을 추천하고, 산책을 나갔을 때 근처에 어떤 친구가 있는지도 알려줍니다. 어린 시절 만화책에서나 봤던 일들이 현실로 일어난다는 것입니다.
만약 구글의 꿈이 실현된다면 우리는 모든 문제에 대한 답을 구글을 통해서 찾고 모든 의사결정을 구글을 통해서 하게 될 것입니다. 구글 시맨틱 웹이 개발된다면 이러한 생활양식은 더욱 분명하게 우리를 지배할 것입니다. 시간이 좀 더 흐르면 우리는 이런 질문을 할 수도 있을 것입니다.
“과연 우리는 이 새로운 신으로부터 자유로워질 수 있을까?”
정리하자면 시맨틱 웹은 차세대 웹으로 빅 데이터와, 딥러닝과 같은 학습 능력을 갖춘 인공지능의 다양한 기술들과 결합하여 인간에게 편의를 주는 다양한 일을 수행할 수 있을 것으로 전망됩니다. 또한 좀 더 나아가자면 인공지능의 핵심 두뇌 역할을 할 수도 있을 것입니다. 결국 시맨틱 웹의 이상은 인간의 두뇌와 똑같은 작용을 할 수 있는 강력한 능력을 가진 미래형 웹이라고 할 수 있습니다.
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.