요즘IT
위시켓
새로 나온
인기요즘 작가들컬렉션
물어봐
새로 나온
인기
요즘 작가들
컬렉션
물어봐
개발
AI
IT서비스
기획
디자인
비즈니스
프로덕트
커리어
트렌드
스타트업
서비스 전체보기
위시켓요즘IT
고객 문의
02-6925-4867
10:00-18:00주말·공휴일 제외
yozm_help@wishket.com
요즘IT
요즘IT 소개작가 지원
기타 문의
콘텐츠 제안하기광고 상품 보기
요즘IT 슬랙봇크롬 확장 프로그램
이용약관
개인정보 처리방침
청소년보호정책
㈜위시켓
대표이사 : 박우범
서울특별시 강남구 테헤란로 211 3층 ㈜위시켓
사업자등록번호 : 209-81-57303
통신판매업신고 : 제2018-서울강남-02337 호
직업정보제공사업 신고번호 : J1200020180019
제호 : 요즘IT
발행인 : 박우범
편집인 : 노희선
청소년보호책임자 : 박우범
인터넷신문등록번호 : 서울,아54129
등록일 : 2022년 01월 23일
발행일 : 2021년 01월 10일
© 2013 Wishket Corp.
로그인
요즘IT 소개
콘텐츠 제안하기
광고 상품 보기
AI

AI 기업 탐구: 네오사피엔스, 타입캐스트로 유튜브를 사로잡다

이재훈
12분
5시간 전
217
에디터가 직접 고른 실무 인사이트 매주 목요일에 만나요.
newsletter_profile0명 뉴스레터 구독 중

AI 기술이 이미 생활 속 필수재로 자리 잡은 요즘, 그 기술 뒤에서 움직이는 기업들의 정체와 비전이 궁금하지 않으신가요? AI는 이제 단순한 기술 트렌드를 넘어 세상을 바꾸는 핵심 동력으로 떠올랐습니다.

 

〈AI 기업 탐구〉시리즈는 AI 산업의 대표적인 기업들을 하나씩 꼼꼼하게 살펴보며, 이들이 어떻게 탄생했고, 현재 어떤 전략과 비전으로 미래를 그려나가는지 구체적으로 조명하고자 합니다. AI를 이끄는 주인공들의 생생한 이야기를 지금부터 만나보세요.

 

Chapter. 0 왜 지금, 이 기업을 알아야 하는가?

<출처: 타입캐스트>

 

유튜브 쇼츠의 태동기였던 2021년과 2022년, 연달아 쇼츠 분야 1위를 차지한 채널이 있습니다. 바로 ‘1분요리 뚝딱이형’인데요. 활동 초기부터 폭발적인 관심을 받은 이 채널은 현재 구독자 수가 300만 명을 넘어서는 대형 채널로 성장했습니다.

 

이 채널의 주요 콘텐츠는 이름 그대로 1분 안에 요리 레시피를 알려주는 것입니다. 흔한 주제임에도 불구하고 빠르게 성장할 수 있었던 이유는 바로 목소리에 있습니다. 영상 속에서는 ‘삼촌(aka. 뚝딱이형)’이 요리를 설명하고, ‘조카(aka. 잼민이)’가 맛이나 방법에 대해 딴지를 걸며 대화를 이어가는데요. 두 사람의 티키타카와 재치 있는 드립 덕분에 단순한 요리 채널이 아니라, 마치 콩트 같은 재미를 주는 채널로 자리 잡게 되었습니다.

 

<출처: 유튜브>

 

이제는 레시피를 배우러 온다기보다, 두 인물의 티키타카를 즐기기 위해 찾는 시청자가 더 많을 정도입니다. 그런데 흥미로운 사실은, 이 삼촌과 조카는 실존 인물이 아니라는 점입니다. 두 사람의 목소리는 모두 AI 성우 서비스인 '타입캐스트(Typecast)'로 만들어졌으며, 그 서비스를 제공한 회사가 바로 오늘의 주인공 '네오사피엔스(Neosapience)'입니다.

 

많은 AI 스타트업이 뚜렷한 수익 모델 없이 투자금에 의존하다 사라지곤 하지만, 네오사피엔스는 다릅니다. ‘1분요리 뚝딱이형’ 채널처럼 실제 시장에서 검증된 서비스와 안정적인 비즈니스 모델을 기반으로 성장했고, 이제는 IPO를 앞둔 한국 대표 AI 스타트업으로 주목받고 있습니다. 오늘은 이들이 어떻게 이러한 성과를 만들어낼 수 있었는지 자세히 살펴보겠습니다.

 

 

Chapter. 1 탄생의 배경과 창립 철학

음성 기술 외길 인생

타입캐스트를 만든 김태수 네오사피엔스 대표는 연구자 출신입니다. 카이스트(KAIST)에서 음원 분리와 합성을 연구하며, 다양한 소리가 섞여 있는 환경에서 특정 목소리를 분리하는 알고리즘을 개발해 박사 학위를 받았는데요. 이 연구는 훗날 네이버 클로바 노트와 같이 여러 사람의 목소리를 화자별로 구분하는 기술의 기반이 되는 선구적인 시도로 평가받습니다.

 

박사 학위를 마친 뒤 입사한 LG전자에서는 통화 중 주변 소음을 제거하는 기술 개발에 매진했습니다. 이 과정에서 세계 최초로 휴대폰에 듀얼 마이크를 탑재해 음원을 분리하는 기술을 구현하기도 했습니다. 흥미로운 점은 그가 LG전자를 선택한 이유입니다. 당시만 해도 음성 분야는 지금처럼 핫한 영역이 아니었고, 국내에서 관련 연구를 지속할 수 있는 거의 유일한 팀이 LG전자에 있었기 때문입니다.

 

<출처: 김태수 대표 링크드인>

 

이후 그는 퀄컴으로 자리를 옮겨, 별도의 버튼을 누르지 않고 언제든 이름만 부르면 응답할 수 있는 ‘항상 켜져 있는 마이크’ 기술을 연구했습니다. 이 기술 역시 아마존 알렉사나 애플 시리와 같은 음성 비서 서비스가 별도의 조작 없이 사용자를 인식하는 기술의 기반이 됐습니다. 이러한 연구 과정에서 40건이 넘는 특허를 출원하며, 음성 분야에서 독보적인 성과를 쌓아 올린 엔지니어로 자리매김했습니다.

 

하지만 엔지니어로 승승장구하던 그는 2016년 뜻밖의 전환점을 맞습니다. 건강상의 문제가 생긴 건데요. 이는 지금까지 걸어온 길을 되돌아보는 계기가 되었고, 고민 끝에 “지금까지의 연구 성과를 토대로 세상을 바꿀 무언가를 직접 만들어보고 싶다”라는 결론에 이르렀습니다. 그렇게 해서 시작된 도전이 바로 네오사피엔스의 탄생이었습니다.

 

뚝심으로 만든 기회

네오사피엔스는 '새로운 현인'이라는 의미를 담아, 인간의 창의력을 AI로 확장하겠다는 포부를 녹여냈습니다. 그러나 시작은 쉽지 않았습니다. 앞서 이야기했던 것처럼 김태수 대표는 엔지니어로서는 경험이 풍부했지만, 사업은 또 다른 영역이었기 때문입니다.

 

<출처: 네오사피엔스>

 

그는 음성 기술을 기반으로 사람들이 진정 필요로 하고, 돈을 지불할 만한 제품과 서비스를 찾기 위해 1년 이상 매달렸습니다. 그 결과 유명인의 목소리를 합성해 더빙 영상을 만드는 실험에서 가능성을 발견했습니다. 당시만 해도 AI라 하면 제조업 자동화나 플랫폼 기술에 관심이 쏠리던 시기였기에, 콘텐츠 시장을 바라보는 시선은 회의적이었지만, 김태수 대표는 흔들리지 않았습니다.

 

“기술이 사람들의 일상을 바꾸는 거대한 파도를 직접 일으키고 싶다”라는 목표 아래 네오사피엔스는 좁은 음성합성 분야에 집중했습니다. 작은 시장이라도 세계 최고가 되겠다는 각오로 팀을 이끌며, 2019년 서비스를 정식 공개하기 전까지는 요란한 홍보보다 기술 완성도와 사용자 경험을 끌어올리는 데 주력했는데요. 이러한 뚝심은 결국 투자자들의 눈에 띄었습니다. 2018년경부터 잠재력을 눈여겨본 VC들이 나타나기 시작했고, 마침내 초기 투자 유치에도 성공했습니다.

 

 

Chapter. 2 대표 서비스와 기술 혁신

선택과 집중

앞서 다룬 '보이저엑스'는 AI 기술을 활용한 서비스라면 어떤 것이든 좋다는 큰 목표 아래, 다양한 아이디어를 빠르게 실험하며 시장성을 검증하는 전략을 취했습니다. 반면, 네오사피엔스는 정반대의 길을 걸었는데요. 방향성이 정해진 이후 오직 하나의 서비스, '타입캐스트'에 모든 역량을 집중했습니다.

 

<출처: 네오사피엔스>

 

이 같은 선택은 창업자 김태수 대표가 연구자 출신이라는 배경과 맞닿아 있습니다. 평생을 음성 관련 기술 하나에만 몰두해 온 만큼, 이 분야에서는 누구보다 깊은 전문성과 자신감을 갖고 있었죠. 실제로 네오사피엔스가 2018년 이후 발표한 12편의 연구 논문 가운데, 10편 이상이 모두 음성과 관련된 주제를 다루고 있다는 사실은 이러한 '한 우물 전략’을 잘 보여줍니다.

 

감정까지 표현하는 TTS

네오사피엔스의 대표 서비스 타입캐스트는 AI 성우·영상 생성 플랫폼으로 사용법은 단순합니다. 대본 텍스트를 입력하고 원하는 캐릭터를 선택하면, 불과 몇 분 만에 사람이 직접 읽는 듯한 음성이 생성됩니다. 이 서비스는 TTS(Text-to-Speech)를 기반으로 하는데요. 기존에도 TTS 기술을 활용한 서비스는 종종 있어 있었지만, 타입캐스트가 주목을 받은 가장 이유는 자연스러운 표현력에 있습니다.

 

<출처: 타입캐스트>

 

기존의 TTS가 기계적인 억양에 머물렀다면, 타입캐스트는 기쁨·화남·설렘 같은 감정까지 섬세하게 표현할 수 있습니다. 예컨대 "안녕하세요"라는 한 마디도 상황에 따라 밝게, 혹은 울먹이며 말할 수 있습니다. 이는 네오사피엔스가 수년간 축적한 음성 데이터와 자체 개발한 딥러닝 합성 엔진 덕분인데요. 이러한 기술력을 단순히 정해진 캐릭터를 활용하는 데 그치지 않고, 사용자가 자신만의 AI 보이스를 제작할 수 있는 단계로까지 발전했습니다.

 

성우에서 연기자로

이처럼 감정 표현이 정교해지자 자연스럽게 서비스의 확장 방향은 '성우'에서 '연기자'로 이어졌습니다. 단순히 목소리를 만들어내는 데서 그치지 않고, AI로 생성된 아바타 캐릭터가 선택한 목소리로, 입 모양을 맞추어 말하는 영상을 만들어주는 기능으로 확대된 것입니다.

 

<출처: 타입캐스트>

 

예컨대 뉴스 클립을 만든다면, AI 성우 목소리에 맞춰 뉴스 앵커 모습의 가상 인간이 등장해 자연스럽게 대본을 읽는 영상을 생성할 수 있습니다. 앞서 언급한 12편의 연구 논문 가운데, 음성과 직접적 관련이 없는 2편이 바로 이러한 비주얼 아바타 기술과 맞닿아 있습니다.

 

대체 불가한 캐릭터

아무리 타입캐스트의 기술이 좋더라도, 목소리 캐릭터 수가 적다면 한계가 뚜렷할 수밖에 없습니다. 동일한 목소리가 여러 콘텐츠에서 사용된다면, 후발 주자들이 차별화된 결과물을 만들기 어려워 사용을 꺼릴 가능성이 커지기 때문입니다.

 

<출처: 타입캐스트>

 

네오사피엔스는 이 문제를 정면으로 돌파했습니다. 2019년 서비스 초창기에는 몇십 종에 불과했지만, 현재는 600종 이상의 캐릭터를 보유하고 있습니다. 아동·청소년·청년·중년·장년 등 전 연령대 목소리는 물론, 산타클로스·앵커·왕·동물 캐릭터 같은 특수 목소리까지 확보하면서 애니메이션 더빙·오디오북·유튜브 브이로그·광고 영상 등 어떤 콘텐츠에도 적합한 목소리를 제공하는 콘텐츠 제작 인프라로 자리매김했습니다.

 

 

Chapter. 3 비즈니스 모델과 시장 성과

구독 기반의 수익 구조와 락인 효과

타입캐스트는 누구나 무료로 체험할 수 있지만, 본격적인 사용을 위해서는 유료 구독이 필수적입니다. 구독 등급에 따라 사용할 수 있는 음성 캐릭터 수, 음성 합성 시간, 영상 생성 기능이 달라지는데요. 이러한 구독 모델은 다른 서비스들에서도 흔히 볼 수 있지만, 타입캐스트의 구독 모델이 안정적인 수익을 창출할 수 있었던 핵심 이유는 강력한 락인 효과가 있었기 때문입니다.

 

크리에이터가 타입캐스트의 특정 캐릭터를 선택해 콘텐츠를 만들고 그 콘텐츠가 인기를 얻기 시작하면, 해당 캐릭터는 곧 채널의 정체성으로 자리 잡습니다. 이후 다른 목소리로 바꾸는 것은 팬들에게 이질감을 줄 수 있어 사실상 불가능합니다. 앞서 소개한 1분요리 뚝딱이형의 첫 영상에서의 목소리가 4년이 지난 지금까지 바뀌지 않았던 것도 같은 맥락에서 이해할 수 있습니다.

 

<출처: 사람인>

 

이 구조는 강력한 '전환 비용'을 만들어냅니다. 다른 AI 음성 서비스로 이동하려 해도 동일한 목소리와 감정을 재현하기 어렵고, 이미 축적된 콘텐츠 자산 때문에 다른 서비스로 이전하기 어렵습니다. 이처럼 콘텐츠 자산이 곧 브랜드가 되고, 브랜드가 다시 서비스 이용을 고착화하는 선순환이 형성된 것이 네오사피엔스의 주요 경쟁력이죠. 설립 이후 꾸준히 매출 성장세를 이어가고 있는 것도 바로 이 덕분입니다.

 

개인 크리에이터에서 글로벌 기업까지

초기 타입캐스트의 고객군은 대부분 개인 크리에이터였습니다. 유튜버, 팟캐스터, 강의 제작자가 그 주인공들이었는데요. 최근에는 음성합성의 기술력이 더욱 정교해지면서 신뢰도가 생겼고, 기업으로도 고객군이 확대되고 있습니다. 매일경제에서 김주하 MBN 앵커의 목소리를 학습해 오디오 뉴스 서비스로 제공하고 있는 것이 대표적인데요. 2024년에는 전년 대비 B2B 고객사 수가 42% 증가했습니다. 

 

<출처: 타입캐스트>

 

더 나아가 타입캐스트는 이제 글로벌 시장에서도 성과를 내고 있습니다. 현재 200만 명 이상의 개인 사용자와 1,000개 이상의 기업 고객을 확보했으며, 전체 트래픽의 60% 이상이 해외에서 발생할 정도로 글로벌 비중이 큰데요. 2024년 연말 결산에 따르면, 타입캐스트는 총 225개국에서 사용되고 있으며, 지원 언어도 계속해서 확대되어 2025년에는 33개 언어까지 늘어날 예정이라고 합니다.

 

사람의 마음을 움직이는 기술

특히 네오사피엔스의 기술은 단순히 상업적 효용성을 넘어, 사회적 가치와 감정적 파급력을 보여주는 사례로 주목받았습니다. 대표적인 예가 바로 MBC 다큐멘터리 “너를 만났다”입니다. 이 프로그램에서 네오사피엔스는 세상을 떠난 가족의 목소리를 AI로 복원해, 유족이 VR 공간에서 다시 만나는 장면을 구현했는데요. 해당 장면은 방송 직후 국내외에서 큰 반향을 일으켰고, AI 음성이 단순한 기능을 넘어 인간의 삶과 감정을 울리는 기술이 될 수 있음을 입증했습니다.

 

<출처: MBC 유튜브>

 

이 경험은 투자자들에게 중요한 메시지를 전달했습니다. 네오사피엔스가 가진 음성 합성 기술은 단순히 유튜브나 광고를 위한 도구가 아니라, 방송·엔터테인먼트·교육·치유 산업 등 훨씬 넓은 시장으로 확장 가능한 잠재력을 가진다는 점입니다. 또한 “사람들의 마음을 움직일 수 있는 기술”이라는 스토리는 투자 설득 과정에서 강력한 자산이 되었고, 이는 실제 시리즈 A·B 라운드에서 긍정적 효과를 가져왔습니다.

 

현재 네오사피엔스는 안정적인 매출 성장과 글로벌 고객 기반을 토대로 IPO(기업공개)를 본격적으로 준비하고 있습니다. 단순히 기술 스타트업이 아닌, 사람과 기술을 잇는 감성적 가치를 창출하는 기업이라는 이미지는 향후 상장 과정에서도 투자자와 시장 모두에게 강력한 신뢰 요인이 될 것으로 보입니다.

 

 

Chapter. 4 도전과 한계

한 우물 전략의 이면

AI 음성 합성 기술은 불과 몇 년 전만 해도 소수 연구소와 빅테크 기업만 구현할 수 있는 첨단 영역이었습니다. 그러나 최근 들어 대규모 언어 모델(LLM)과 오픈소스 음성 합성 엔진이 확산되면서 진입 장벽이 빠르게 낮아지고 있는데요. 이제는 누구나 공개된 모델을 활용해, 어렵지 않게 기본적인 음성 합성 기능을 구현할 수 있는 시대가 열렸습니다.

 

이 과정에서 기술 자체의 희소성이 줄어들며, 경쟁은 점점 치열해지고 있습니다. 구글, 아마존 같은 빅테크뿐 아니라, 수많은 스타트업이 TTS 기술을 내세워 시장에 뛰어들고 있는데요. 네오사피엔스가 오직 타입캐스트에 집중해 전문성을 쌓아온 것은 분명 강점이지만, 동시에 타입캐스트가 시장에서 매력을 잃거나 새로운 대체재가 등장할 경우, 회사 전체가 흔들릴 수 있는 위험 요소로 작용할 수도 있습니다.

 

AI와 인간의 공존

AI 연기자는 크리에이터들에게 더 많은 선택지를 제공하며 콘텐츠 제작 방식을 크게 확장시켰습니다. 그러나 동시에 기존에 그 일을 하던 사람들에게는 일자리를 위협하는 결과로 이어지고 있습니다. 특히 성우 업계와의 갈등이 불거질 수 있고, 목소리를 기반으로 생계를 이어가는 배우, 강사, 방송인 등 다양한 직업군이 잠재적인 영향을 받습니다. 나아가 강의실, 무대, 방송국 등 목소리 노동을 기반으로 한 산업 전반 역시 AI 기술의 확산으로 위협받을 수 있습니다.

 

How the voices for ChatGPT were chosen <출처: OpenAI X>

 

여기에 더해 목소리 저작권 문제는 갈수록 복잡해지고 있습니다. 대표적으로 2024년 OpenAI가 공개한 GPT 음성 인터페이스는 배우 스칼렛 요한슨의 목소리와 유사하다는 논란에 휩싸였고, 결국 서비스가 중단되었는데요. 이처럼 의도와 상관없이 특정 유명인의 목소리와 닮았다는 사실만으로도 해명과 대응이 쉽지 않다는 점이 드러났습니다.

 

더 나아가, 현재는 문제가 없더라도 언젠가 타입캐스트에서 제공하는 목소리와 유사한 실제 인물이 등장한다면, 저작권을 누구에게 인정해야 할지 같은 새로운 쟁점이 불거질 수 있습니다. 결국 유사 음색 충돌을 다루기 위한 윤리적 가이드라인과, 산업 전반이 공존할 수 있는 모델을 선제적으로 마련하는 것이 시급합니다.

 

악용 가능성과 규제 리스크

AI 음성 합성 기술은 긍정적인 가능성만큼이나 악용 위험도 큽니다. 이미 해외에서는 보이스피싱, 음성 사기, 가짜 뉴스 등에 합성 음성이 활용된 사례가 잇따라 보고되고 있습니다. 홍콩에서는 AI 딥페이크 음성을 이용해 기업에서 2,500만 달러 이상을 탈취당한 사건이 발생했고, 미국 롱아일랜드에서는 2023년 한 해 동안 3,000건이 넘는 AI 음성 사기가 접수됐고, 피해액은 1억 2,600만 달러에 달했습니다. 이러한 사례는 AI 음성이 단순한 편의 도구가 아니라, 심각한 사회적 범죄 수단이 될 수 있음을 보여줍니다.

 

특히 영상은 보고·듣고 판단할 수 있지만, 목소리는 오직 청각에만 의존해야 하기에 진위를 가리기가 훨씬 더 어렵습니다. 이 때문에 각국 정부는 관련 규제를 강화하는 추세이며, 한국에서도 AI 기반 범죄에 대한 처벌 강화를 논의 중입니다. 

 

결국 이 기술은 규제와 정책의 영향을 크게 받을 수밖에 없으며, 네오사피엔스가 시장에서 신뢰를 유지하려면 단순한 기능 제공을 넘어, 악용 방지 기술과 윤리적 안전장치를 선제적으로 마련해야 합니다.

 

 

Chapter. 5 결론과 전망

네오사피엔스는 단일 서비스인 타입캐스트를 기반으로 글로벌 시장에서 입지를 다져왔습니다. 감정 표현이 가능한 AI 성우에서 출발해, 이제는 영상까지 아우르는 AI 연기자로 확장하며 개인 크리에이터와 기업 모두에게 새로운 콘텐츠 제작 방식을 제시했습니다. 그러나 기술의 빠른 평준화, 성우·배우 등 직업군과의 공존 문제, 보이스피싱 같은 악용 리스크는 피할 수 없는 도전 과제입니다. 또한 서비스 의존도가 지나치게 높은 구조는 잠재적 약점으로 작용할 수 있죠.

 

그럼에도 불구하고 네오사피엔스는 원천 기술을 직접 보유하고 있다는 점에서 분명한 강점을 지니고 있습니다. 외부 API에 의존하는 기업들이 제공사의 정책 변화나 비용 문제로 쉽게 흔들릴 수 있는 반면, 네오사피엔스는 독립적인 기술 개발과 안정적인 서비스 운영이 가능합니다. 

 

이는 단순히 비용 절감 차원을 넘어, 특정 언어의 문화적 뉘앙스를 반영한 목소리를 구현하거나, 영상 아바타의 감정 표현을 정교하게 고도화하는 등 시장의 요구에 더욱 빠르고 깊이 있게 대응할 수 있는 핵심 경쟁력으로 이어집니다.

 

결국 네오사피엔스의 미래는 이러한 원천 기술을 어떻게 발전시키고, 시장과 사회의 기대에 맞게 조율하느냐에 달려 있습니다. 이 강점을 전략적으로 살려낸다면, 네오사피엔스는 단순한 서비스 제공자를 넘어 AI 콘텐츠 생태계를 선도할 수 있지 않을까요?


<AI 기업 탐구 시리즈 보러 가기>

  1. AI 기업 탐구: 오픈AI, 절대강자의 탄생
  2. AI 기업 탐구: 앤트로픽, 오픈AI를 위협하는 진짜 라이벌
  3. AI 기업 탐구: 글린, 오픈AI도 경계한 AI 검색의 강자
  4. AI 기업 탐구: 뤼튼, 한국인이 가장 많이 사용한 국내 AI 툴
  5. AI 기업 탐구: 업스테이지, 작고 빠른 SLM으로 '국민 AI'에 도전하다
  6. AI 기업 탐구: 트웰브랩스, 엔비디아·AWS가 선택한 영상 AI 강자
  7. AI 기업 탐구: 애니스피어, 커서(Cursor)로 바꾼 개발자 패러다임
  8. AI 기업 탐구: xAI, 일론 머스크가 만드는 AI 초격차
  9. AI 기업 탐구: 퓨리오사AI, 엔비디아에 맞서는 K-유니콘의 등장

 

©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.

  • AI 기업 탐구: 미스트랄 AI, 프랑스 소버린 AI의 핵심 주역
  • AI 기업 탐구: 퍼플렉시티 AI, 4년 만에 구글 노린 스타트업
  • AI 기업 탐구: 보이저엑스, '브루·브이플랫'이 증명한 돈 버는 AI