
사용량 기반 과금이 바꾸는 SaaS의 미래
세일즈포스가 처음 SaaS라는 사업 모델을 들고나온 이후, 2000년대 후반과 2010년대 초반은 IT 업계 전반에 소프트웨어 판매 방식이 대대적인 변화를 맞이하던 시기였다. 기존의 영구 라이선스 모델을 벗어나, 인터넷을 통해 정기 구독료를 받는 SaaS 모델이 자리 잡았기 때문이다. 그런데 지금은 생성형 AI가 본격화되면서 15년 만에 또 다른 전환점이 오고 있다. 바로 '사용한 만큼 지불한다'라는 사용량 기반 과금 모델(Usage-Based Pricing)이 전례 없이 빠른 속도로 확산되고 있다.
소프트웨어 과금 모델이 어떻게 발전해 왔는지 살펴보면, 넷플릭스와 전기요금의 차이를 떠올리면 이해하기 쉽다. 넷플릭스는 한 달에 한 편만 봐도, 매일 몰아서 봐도 똑같은 월 구독료를 낸다. 하지만 전기요금은 에어컨을 틀면 오르고, 절약하면 줄어든다. 소프트웨어도 이제 넷플릭스 방식에서 전기요금 방식으로 바뀌고 있다.
과거 소프트웨어는 한 번 사면 거의 '제품'처럼 '내 것'이 되는 영구 라이선스 방식이었다. CD 패키지나 다운로드 파일을 사서 평생 소유하는 개념이다. 그다음 클라우드 인프라가 확대되면서, 정기 구독료를 내고 소프트웨어를 사용하는 SaaS 모델이 2010년대 전반에 걸쳐 빠르게 자리 잡았다. 기업은 반복 매출을 확보했고, 사용자 입장에서도 초기 비용 부담이 줄어드는 장점이 있었다.
그러나 이제 AI, 빅데이터 등 대규모 연산 자원이 필요한 서비스가 늘어나면서, "실제 사용량에 따라 과금"하는 사용량 기반 모델이 주목받고 있다. GPT-4나 AI 이미지 생성처럼 연산량이 많은 경우, 정액 요금제로는 기업이 손해를 감수해야 하는 상황이기 때문이다. 특히 인공지능 분야는 GPU나 TPU 등 거대한 인프라가 요구된다. 모델 추론 한 번에 들어가는 비용이 만만치 않아, 사용자가 늘어날수록 운영사가 부담해야 하는 비용도 기하급수적으로 뛸 수 있다.
이런 구조상 "얼마나 썼는지"를 정확히 측정하고 그에 따라 대금을 받지 않으면, 수익성이 크게 악화된다. 또 고객 입장에서도 "필요한 만큼만 지불한다"는 사용량 기반 과금이 훨씬 합리적이다. 이미 클라우드 서비스인 AWS나 Azure를 통해 "종량제" 모델에 익숙해진 터라, 불필요한 고정비를 내기보다는 사용량만큼 비용을 내는 방식을 선호하는 것이다. 즉, 생성형 AI 산업이 폭발적으로 성장하면서, 과금 모델도 함께 급격한 변화를 맞고 있다. 이것이 바로 소프트웨어 과금 모델의 '세 번째 물결'이라 불리는 이유다.
소프트웨어 기업이 손쉽게 사용량 기반 과금을 도입할 수 있는 툴과 서비스를 제공하는 스타트업 ‘메트로놈’의 CEO 스콧 우디는 드롭박스에서 일하던 시절을 회상한다. 그는 "좌석을 몇 개 샀는지"만으로는 서비스 가치를 제대로 반영하기 어렵고, 또 고객 입장에서도 불편함이 많다고 느꼈다고 한다.
단순히 구독료를 내고 쓰다가 나중에야 변경된 가격이나 과도한 사용량을 한 번에 청구받으면, "왜 이만큼 나왔지?" 하는 당혹감이 생기기 쉽기 때문이다. 우디는 이런 문제를 해결하고자, 사용할 때마다 실시간으로 비용이 반영되고, 고객도 그 과정을 투명하게 확인할 수 있는 새로운 시스템을 만들어야 한다고 결심하고 창업에 나섰다.
사용량 기반 과금법의 출발점은 "얼마나 많이 썼느냐"를 정확히 측정하고, 그에 비례해 대금을 지불한다는 단순한 발상에 있다. 이를 통해 기업은 고객의 실제 사용량에 따라 매출을 얻을 수 있고, 고객은 자신이 얻게 되는 가치에 맞춰 합리적으로 지출하게 된다. 얼마나 많은 API 호출을 했는지, 얼마나 많은 문서를 AI로 생성했는지 등에 따라 과금되는 것이다. 스콧 우디가 표현했듯, 전기회사 요금을 떠올리면 이해하기가 쉽다. 전기를 쓰면 쓸수록 요금이 늘어나지만, 그만큼 자신의 사용량이 곧 비용으로 이어진다는 것이 직관적이다.
메트로놈과 같은 기업의 등장은 클라우드와 AI 시대에 늘어난 '변동 비용'을 직접 매출로 회수해야 한다는 시장의 니즈와 궤를 함께한다. 예컨대, GPT-4나 앤트로픽의 클로드, 혹은 오픈AI의 챗GPT API를 운영하려면, GPU 클러스터 등을 돌리는 데 상당한 비용이 든다. 그 비용은 사용자가 늘어날수록 기하급수적으로 커진다.
만약 이것을 월 정액제 하나로 커버한다면, 소수의 '헤비유저'로 인해 서비스 제공사가 큰 손실을 볼 위험이 생긴다. 그래서 AI 분야에서는 자연스럽게 사용량 기반 과금과 월 구독료를 접목한 하이브리드 프라이싱이 빠르게 확산되고 있다.
메트로놈과 그레이하운드 캐피탈이 함께 수행한 2025년 설문조사에 따르면, 응답한 100개 SaaS 기업 중 85%가 이미 사용량 기반 과금을 도입했거나 도입을 검토하고 있는 것으로 나타났다. 단순 스타트업만의 흐름이 아니라, 규모가 큰 상장 소프트웨어 기업 중 77%도 어떤 형태로든 사용량 기반 과금 모델을 갖추고 있다는 점이 흥미롭다.
또한 빠르게 성장하는 AI 스타트업의 64%가 사용량 기반 과금을 채택했다는 점은, 이 모델이 초기와 중기 단계 기업에게도 중요한 성장 레버리지로 활용되고 있음을 보여준다.
이러한 변화를 주도하는 스타트업들은 크게 AI, 핀테크, 인프라 분야에 분포되어 있으며, 이는 고객 수요와 제품 소비가 매우 역동적일 수 있는 분야들이다. 이러한 스타트업들에게 사용량 기반 모델을 채택하는 것은 단순히 가격 책정에 관한 것이 아니라, 제품 주도 성장을 지원하고 장기적인 고객 관계를 조성하는 전략적 선택이란 점이 주목받고 있다.
오픈AI는 AI 업계에서 가장 주목받는 기업이면서 동시에 사용량 기반 요금을 가장 성공적으로 구현한 대표적인 사례로 꼽힌다. 특히 토큰 단위 과금이라는 독창적 모델을 통해, 고성능 AI 서비스가 갖는 막대한 인프라 비용을 투명하게 회수하는 동시에, 다양한 규모의 고객이 쉽게 접근할 수 있는 방안을 마련한 것으로 유명하다.
OpenAI는 "하드웨어 사용량" 같은 내부 지표 대신, "토큰"이라는 추상화 레이어를 과금 지표로 삼았다. 이는 사용자 입장에서는 "입력과 출력 텍스트 처리량"을 직관적으로 파악할 수 있고, OpenAI 입장에서는 실제 연산 비용과도 밀접하게 연결된다는 장점이 있다. GPT-4o 기준으로 입력 토큰 1백만 개당 2.50달러, 출력 토큰 1백만 개당 10.00달러 등 구간별과 기능별로 세밀하게 책정해, 사용자가 쓴 만큼 지불하도록 유도한다. 토큰이 늘어날수록 곧바로 요금이 상승하므로, 고객은 필요한 만큼만 호출을 최적화하거나, 혹은 적극 활용해도 예산 대비 가치를 명확히 계산할 수 있다.
OpenAI의 접근에서 주목할 점은, 토큰 단위가 사실상 사용자 체험과 시스템 리소스 사용량을 이어주는 매개 역할을 한다는 것이다. 이는 거대 LLM 운영에 따른 불확실한 비용을 상대적으로 예측 가능하게 바꿔주고, 고객도 자신의 요청이 어느 정도 비용을 초래할지 빠르게 가늠할 수 있게 한다.
AI 서비스는 초반에 사용자들이 자유롭게 시도해 보길 원하지만, 동시에 무제한 무료 접근을 허용하면 실질적인 재정 손실이 발생한다. 오픈AI는 이에 대해 "선불 크레딧 결제 + PayGo" 모델로 균형점을 찾았다.
고객이 처음 결제 수단을 등록하면, 5달러라는 비교적 낮은 금액으로 접근 장벽을 크게 낮춘다. 그래도 "완전히 공짜는 아니다"라는 진입 장벽을 두어, 무분별한 남용이나 악의적 사용을 억제한다. 사용자가 크레딧을 다 소진하면 API 호출이 자동으로 중단되도록 함으로써, "쓰면 반드시 비용이 발생한다"라는 구조를 명확히 고수한다. 또한 대규모 사용 고객은 연속 충전 또는 엔터프라이즈 전용 계약으로 전환해, 서비스 중단 없이 쓰도록 유도한다.
이 방식은 사용자들이 자유롭게 AI 기능을 탐색하되, 불필요한 과소비나 미납 사용을 막아 수익 손실 리스크를 최소화하는 데 크게 기여했다. 결국 마찰을 줄인 액세스와 재무적 안전장치가 절묘히 조합된 모델이라 할 수 있다.
사용량 기반 과금에서 가장 중요한 점 중 하나는 사용자가 자신의 사용량과 비용을 실시간으로 확인하고, 필요에 따라 제한이나 알람을 설정해 예산을 관리할 수 있도록 해주는 것이다. 오픈AI의 대시보드는 바로 이 부분을 중시했다. 사용자가 어느 프로젝트, 어느 기능을 얼마나 썼고, 그로 인해 얼마나 과금되었는지 일목요연하게 확인할 수 있다. 월별과 일별 사용 한도 설정, 임곗값에 근접했을 때 알람을 보내주는 시스템 등으로, "AI 사용이 예기치 못한 요금 폭탄으로 이어지지 않도록" 설계했다.
이를 통해 고객은 빌링이 뒷단의 영수증 발행에 머무는 것이 아니라 '실시간 사용자 경험'이라는 사실을 체감하게 된다. 빌링이 곧 제품이라는 철학은, 기존 SaaS에서는 다소 생소했지만, AI 시대에는 없어서는 안 될 요소로 자리 잡았다.
2025년에 접어들면서, 소프트웨어 과금 전략은 전례 없는 속도로 진화하고 있다. AI 도입이 가속화되면서 고객이 얻는 '결과'나 '사용량'에 기반한 과금이 사실상 필수처럼 여겨지고 있으며, 고객 기대치도 급변하고 있기 때문이다. 과거에는 "경쟁사도 비슷한 가격으로 판다"며 별다른 고민 없이 책정하는 경우가 많았지만, 이제 가격 자체가 제품 전략의 일부이자 경쟁 우위를 결정하는 요소가 됐다.
단순히 "정액제 vs 종량제"로 양분할 수 없는 하이브리드 요금제가 AI 시대에 더욱 일반화될 전망이다. 예를 들어, 일정 기본 사용량까지는 월정액으로 제공하고, 초과분을 종량제로 받는 방식이 확산되고 있다. 특히 AI 관련 기능이나 생성형 모델이 추가되는 SaaS에서, 특정 수준까지는 무료 혹은 저가로 사용하게 하고 더 깊이 쓰려면 AI 크레딧이나 페이월을 설정하는 사례가 늘어나고 있다.
성과에 직접 과금하는 완전 성공 기반 모델은 여전히 실무적으로 구현이 쉽지 않다. 대부분의 제품이 고객 성과를 전 과정에서 측정하고 입증하기 어렵기 때문이다. 그 대신, 토큰과 같은 "작업 단위"마다 비용을 매기는 형태가 늘어날 것으로 전망된다.
AI 제품은 인프라 비용이 만만치 않아, 단순한 무료 체험을 무제한 제공하기 어렵다. 그래서 일부 기업은 유료로 제한된 기간 테스트를 제공하여, 어느 정도 진지한 고객에게만 AI 리소스를 소모하게 하며, 동시에 가벼운 장벽을 둠으로써 악성 사용자나 부정 사용을 막고 있다. 이러한 "유료 체험"이 기존의 무료 체험을 대체하는 경우가 늘어날 것으로 보인다.
이러한 흐름 속에서, SaaS 기업들은 하이브리드 요금제, 사용량 기반 모델, 결과 기반 모델 등을 유연하게 운용해야 하며, 이를 뒷받침할 수 있는 빠른 과금 인프라와 부서 간 협업이 필수가 된다. 특히 AI가 접목된 영역일수록 인프라 비용의 변동 폭이 크고, 고객 가치 판단이 복잡해져, 가격 전략을 정교히 설계하지 않으면 경쟁에서 도태되는 시대가 된 것이다.
결국 2025년 이후 SaaS 프라이싱은 단순히 ‘한 달에 얼마’를 매기는 데 그치지 않고, 고객이 실제로 느끼는 가치와 비용을 어떻게 연동하느냐에 따라 성패가 갈릴 것이다. 기존 좌석 기반 구독에서 벗어나, 하이브리드와 사용량 기반, 결과 기반 등 다양한 모델이 주목받는 지금이야말로, SaaS 기업은 가격 전략을 재점검하고 SaaS 투자자는 기업 평가 모델을 업그레이드할 중요한 타이밍이라 할 수 있다.
©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.