생성형 AI 기술의 발전과 함께 사용자들의 이목을 사로잡는 서비스가 연일 등장하고 있습니다. 이런 생성형 AI 서비스의 지향점을 바꾸는 결정적인 차이가 어디서 생기는지 아시나요? 그 중 하나는 바로 최종 고객이 일반 사용자(B2C)인지, 혹은 기관(B2B)인지 차이입니다. 엔터프라이즈용 생성형 AI 서비스를 설계하고 개발할 때에는 일반적인 B2C 생성형 AI 서비스와는 다른 관점으로 접근할 필요가 있습니다. 주로 B2B 서비스와 관련된 일을 하는 엔지니어인 제 경험을 살려 B2B 생성형 AI 서비스의 기술적인 특징을 알아보겠습니다.
최근 갤럭시 s24를 시작으로 서버나 클라우드에 연동할 필요 없이 스마트폰에서 직접 생성형 AI 기능을 활용할 수 있는 ‘AI 스마트폰’이 관심을 모으고 있습니다. 하지만 초거대언어모델(LLM)을 제대로 활용하려면 천문학적인 양의 연산을 처리하기 위한 병렬 처리 기술과 고성능 GPU로 무장한 서버/데이터 센터가 필수입니다. 그런데 여기서 의문이 생깁니다. 이 커다란 LLM 모델이 어떻게 그 작은 스마트폰 속으로 들어갈 수 있었을까요? 그 해답은 바로 ‘LLM 경량화 테크닉’에 있습니다.
빅테크 기업 치고는 유독 인공지능에 소극적이었던 애플의 행보가 최근 들어 심상치 않습니다. 애플은 지난 5월 앤트로픽의 클로드를 탑재한 iOS용 모바일 앱을 발표한 바 있는데요. 최근에는 자사 AI 플랫폼 ‘애플 인텔리전스’를 발표하며, 오픈AI의 최신 멀티모달 AI 모델 ‘GPT-4o’를 탑재할 계획을 밝히기도 했습니다. 사실 시리(Siri)는 그동안 스마트 어시스턴트라는 명칭이 무색하게 답답한 모습으로 악명이 높았습니다. 그렇다면 정해진 질문 몇 개만 간신히 대답할 수 있었던 시리는 생성형 AI를 만나 어떻게 똑똑해질 수 있을까요? 이번 글에서는 생성형 AI의 기본적인 작동 원리와 애플 인텔리전스의 아키텍처에 대해 살펴보겠습니다.
최근 openAI가 선보인 AI 모델 GPT-4o에 대한 관심이 뜨겁습니다. GPT-4o는 목소리 톤을 바꾸어 가며 감정을 담은 농담을 던지고, 주변 풍경을 정확히 인식하며 시각장애인을 위한 길 안내와 택시 잡기까지 대신해 줍니다. 마치 LLM이라는 두뇌에 눈과 귀가 달린 모양으로 혜성과 같이 등장했죠. GPT-4o의 진짜 정체는 무엇일까요? 이 모델은 최신 생성형 AI 트렌드인 멀티모달에 기반하고 있습니다. 이번 글에서는 원리와 사례를 위주로 멀티모달이란 무엇인지, 이 모델이 우리의 삶을 어떻게 바꾸어 나가고 있는지 소개하도록 하겠습니다.