
AI 개발 프로세스 6단계 총정리
스타트업, 중소기업의 AI 도입 사례 리포트를 소개한 글 “요즘 스타트업·중소기업이 AI 도입하는 방법”에 관심 가져주신 분들이 정말 많았습니다. AI 도입이 생존과 직결된 필수적인 문제로 인식되고 있는 만큼, AI 도입을 위해 참고할 만한 실질적인 자료가 필요한 분들이 많다는 뜻인 것 같습니다.
그런데 막상 도입을 하려고 하면 어디부터 시작해야 할지, 어떤 절차를 거쳐야 할지 막막한 분들이 많으시죠. 위시켓에서는 상반기에만 100억 원 의 AI 도입 프로젝트를 진행했는데요. 도입 상담을 하다 보면 많은 분들이 정확한 정보가 부족해 어려움을 겪고 계시다는 것을 알 수 있습니다. 특히 데이터 유출 위험이나 내부 직원 교육에 대한 현실적인 고민도 많이 하시죠.
이런 어려움을 덜어드리기 위해 AI 도입을 준비할 때 곁에 두고 참고할 수 있는 가이드 시리즈를 준비했습니다. 오늘은 그 첫 번째로, AI 개발 프로세스 6단계를 살펴보겠습니다. 준비 단계부터 실제 배포까지 어떤 과정을 거치는지 함께 확인하면서 AI 도입의 전체 그림을 그려보실 수 있을 것입니다.
AI 개발 프로세스는 보통 아래와 같은 6단계로 진행됩니다.
비즈니스 목표 설정 → 데이터 수집·정제 → 모델 설계 → 학습·검증 → 업무 환경 배포 → 운영·고도화
지금부터 도입 절차를 하나씩 살펴보겠습니다.
가장 먼저 AI로 ‘무엇을 해결할 것인지’를 명확히 하는 것이 중요합니다. 기술 환경이 빠르게 변화하는 요즘 시대에는 FOMO에 빠지기 십상인데요. 뒤쳐질 것같은 압박감에 떠밀려 ‘AI를 도입하는 것’ 자체를 목적으로 삼는 곳도 많습니다. 하지만 그렇게 되면 시간과 비용만 쓰고 정작 개발한 서비스를 제대로 활용하지 못 하는 상황이 벌어집니다.
이와 같은 상황을 예방하기 위해서는 아래 두 가지 질문에 답할 수 있어야 합니다.
그리고 이것을 구체적인 수치로 표현해두어야 합니다. 예를 들어 'AI 챗봇을 만든다'라는 추상적인 목표 보다는, '반복적인 고객 문의 대응 시간을 30% 단축한다'처럼 측정 가능한 목표가 필요합니다.
‘AI로 무엇을 할 수 있을까?’ 대신 ‘지금 무엇이 가장 불편하고, 시간·비용이 많이 드는가?’를 생각해보세요. 처음부터 기술을 떠올리기보다 현재 조직의 문제와 비효율을 먼저 찾아내는 것이 가장 중요합니다.
이와 같은 문제를 나열해 목록을 만든 뒤, 이러한 일들을 AI로 해결할 수 있는지 AI 전문가에게 자문을 받는 것을 추천합니다.
AI로 해결할 문제를 정의하는 것은 당사자인 기업만이 할 수 있는 일입니다. 해결하고 싶은 문제가 분명해야 더 효과적인 조언을 받을 수 있습니다. 다른 기업은 어떻게 하고 있는지, AI 도입 사례집 등을 통해 조사해보는 것도 좋은 방법입니다.
문제를 정의했다면, 그다음으로 데이터의 수집과 정제 과정이 필요합니다.
데이터는 AI가 제대로 작동하게 하는 핵심 자원입니다. AI는 두뇌 역할을, 데이터는 그 두뇌가 참고할 ‘지식’의 역할을 합니다. 두뇌인 AI는 명령을 이해하고, 자료를 가져와 명령에 따라 처리한 다음 답변을 내놓습니다. 그 두뇌가 아무리 뛰어나도 참고할 만한 좋은 지식이 없으면 올바른 답변을 내놓을 수 없습니다. 즉 데이터는 AI가 학습하고 판단하는 근거이자, 답변의 정확성과 깊이를 결정하는 아주 중요한 자원입니다.
그래서 우선 AI가 학습하거나 참고할 수 있는 데이터를 최대한 확보해야 합니다. 예를 들어 품질 검수 AI를 개발한다면, 각 제품을 식별할 수 있는 정보가 먼저 필요합니다. 그리고 어떤 제품을 '불량'으로 처리하고, 어떤 제품을 '정상'으로 처리할 것인지 기준과 사례들이 필요하죠.
하지만 단순히 많은 데이터를 모으는 것만으로는 충분하지 않습니다. 정확하고, 최신이며, 문제 해결에 직접적으로 관련 있는 데이터여야 합니다. 그렇기 때문에 수집한 데이터는 반드시 정제 과정을 거쳐야 합니다. 불필요한 정보나 중복 데이터 제거, 오탈자 수정, 포맷 통일, 결측치 보완, 개인정보 비식별화 등의 작업이 정제 과정에 포함됩니다.
그런데 데이터 수집, 정제가 필요 없는 경우도 많습니다. 예를 들어 많은 회사가 보편적으로 사용하는 기능은, 이미 잘 만들어진 AI 모델로 추가 학습 없이 구현할 수도 있습니다. 이미지 속 글자를 읽고 텍스트로 바꿔주는 OCR(광학 문자 인식) 기술 등이 대표적인 경우죠.
이처럼 AI 기술의 종류와 활용 방식에 따라 필요한 데이터의 형태와 양이 달라집니다. 따라서 도입할 AI 기술과 도입 방식을 확정하고, 전문가의 도움을 받아 데이터 수집 전략을 수립하는 것을 추천합니다.
데이터가 준비 됐다면, 이제 목적에 맞는 AI 모델을 설계해야 합니다. AI 모델을 개발하는 방식에는 크게 2가지가 있습니다. 이미 만들어진 모델을 활용할 수도 있고, 우리만의 모델을 만들 수도 있습니다.
이미지 분류나 자연어 처리처럼 복잡한 작업은, 방대한 데이터로 미리 학습된 모델들이 있습니다. 이 모델을 가져와서, 우리 목적에 맞게 조금 수정해 사용할 수 있습니다. 개발 속도도 빠르고 비용도 적게 들죠. 하지만 보안 리스크가 있고, 모델이 기존에 학습한 기능과 전혀 다른 복잡한 기능을 필요로 할 때는 적합하지 않을 수 있습니다.
학습시킬 데이터가 충분하고, 우리만의 특별한 기능이 필요할 때는 처음부터 직접 만드는 방법을 택할 수 있습니다. 직접 모델 구조를 만들고 처음부터 학습시키는 방식이죠. 개발 기간과 비용이 많이 필요하지만, 우리 기업의 케이스에 맞는 맞춤형 성능을 얻을 수 있습니다.
둘중 어떤 방식으로 진행할지는 비전문가가 판단하기 쉽지 않습니다. AI가 어떤 일을 얼마나 해줘야 하느냐, 학습시킬 데이터가 충분하냐에 따라서 AI 모델 개발 방식이 정해지기 때문입니다. 그래서 이 단계에서는 AI 전문가나 개발 업체와 상담해 설계 방식을 결정하는 것이 좋습니다. AI 모델 개발 방식에 대해서는 다음 편에서 좀 더 자세히 다뤄보겠습니다.
이제 설계한 AI 모델에 준비된 데이터를 학습시키고, 검증을 거쳐 성능을 평가하는 과정이 필요합니다. 이 단계에서 바로 전사에 적용하는 것을 목표로 하기보다는, 먼저 PoC(Proof of Concept, 개념 검증)를 진행하는 것이 안전합니다. PoC란 말 그대로 ‘이 모델이 실제로 우리 문제를 잘 해결할 수 있는지’ 작은 범위에서 시험해보는 과정입니다.
예를 들어 고객 문의 자동 분류 AI를 만든다면, 모든 카테고리를 다 적용하기 전에 일부 카테고리만 선택해 테스트하거나, 전체 데이터의 일부만 사용해 성능을 확인합니다. 이렇게 하면 초기 비용과 시간을 최소화하면서도, 모델의 기술적 타당성과 비즈니스 효과를 동시에 검증할 수 있습니다.
PoC 결과가 기대치에 미치지 못하면, 데이터 양을 늘리거나 정제 품질을 높이고, 모델 구조나 학습 방법을 바꿔 다시 시도합니다. 반대로 성능이 충분하다면, 이후 단계에서 데이터 범위를 확장하고 실제 서비스 환경에서 작동하도록 준비합니다. 결국 이 단계의 핵심은 '실제 도입해도 되는 수준인가?'를 명확히 판단하는 것입니다.
학습, 검증까지 완료되었다면 실제 업무 환경에 적용할 차례입니다. 주로 아래 세 가지를 고려하게 됩니다.
클라우드 방식, 사내 서버(온프레미스) 방식을 사용할 수 있습니다. 두 가지를 섞어 쓰는 하이브리드 방식도 있습니다. 하지만 현실적으로 모델을 항시 운영할 만큼 서버를 온프레미스로 운영 가능한 기업은 거의 없기 때문에, 최근에는 클라우드를 많이 이용하는 추세입니다.
예를 들어 AI 챗봇이라면 홈페이지나 앱의 채팅창에 연결하고, 이미지 검수 AI라면 품질 관리 프로그램 화면에 결과가 보이도록 합니다. 이 과정에서 응답 속도와 처리량이 충분한지도 함께 확인합니다.
데이터가 오가는 과정에서 외부로 새지 않도록 암호화하고, 접근할 수 있는 사람을 제한합니다. 또, 문제가 생겼을 때를 대비해 실시간 모니터링과 알림 시스템을 두고, 필요하면 예전 버전으로 되돌릴 수 있는 준비도 해둡니다.
AI 모델을 서비스에 배포했다고 해서 개발이 끝나는 건 아닙니다. 실제 운영 환경에서는 시간이 지남에 따라 데이터와 상황이 계속 변하고, 그에 따라 모델의 성능도 달라집니다. 따라서 운영 단계에서는 모델이 제대로 작동하는지 꾸준히 모니터링하는 과정이 필수적입니다.
예를 들어 고객 문의를 자동 분류하는 AI가 처음에는 90% 이상의 정확도를 보였다 해도, 새로운 상품이나 서비스가 출시되면 문의 유형이 달라져 성능이 떨어질 수 있습니다. 이런 변화를 놓치지 않으려면 모니터링 시스템이 필요합니다. 예측 결과와 실제 결과를 비교하거나, 오류율·응답 속도 같은 지표를 실시간으로 추적해 성능 저하나 이상 징후를 빠르게 파악할 수 있어야 합니다.
문제가 감지되면 새로운 데이터로 모델을 재학습하거나 알고리즘을 개선해 성능을 복원합니다. 더 나아가 운영 과정에서 축적된 데이터를 활용해 모델을 고도화할 수도 있습니다. 예컨대 텍스트만 처리하던 고객센터 AI에 음성 인식 기능을 추가하거나, 이미지 검수 AI의 적용 범위를 확장하는 식입니다. 필요하다면 다른 시스템과 연동해 통합 서비스로 발전시키는 것도 가능합니다.
지금까지 AI 개발 프로세스 6단계를 알아보았는데요, 실제로 이를 실행하기 위해서는 담당자가 있어야겠죠. 하지만 경험이 없다면 누가 어떤 업무를 진행해야 하는지 파악하기 어려울 수 있습니다. 이런 어려움을 겪지 않도록 각 프로세스별로 누가 어떤 업무를 진행하게 되는 것인지 하나씩 살펴보도록 하겠습니다.
각 단계별 실무를 실제로 수행하는 이들과 그들이 하는 일, 그리고 이 프로젝트 전반을 관리하는 ‘AI 개발 프로젝트 담당자’의 역할로 나눠 정리했습니다.
누가 수행 하나요 : 기획자, 데이터 사이언티스트, 기업 담당자, 보안 담당자
무슨 일을 하나요
AI 개발 프로젝트 담당자 역할
누가 수행 하나요 : 데이터 엔지니어, 데이터 사이언티스트 (+데이터 라벨러)
무슨 일을 하나요
AI 개발 프로젝트 담당자 역할
누가 수행 하나요 : 기획자, AI 엔지니어, 머신러닝 엔지니어, 데이터 사이언티스트
무슨 일을 하나요
AI 개발 프로젝트 담당자 역할
누가 수행 하나요 : AI/ML 엔지니어, 데이터 사이언티스트, QA 엔지니어
무슨 일을 하나요
AI 개발 프로젝트 담당자 역할
누가 수행 하나요 : MLOps 엔지니어, 백엔드 개발자, 보안 담당자, DevOps 엔지니어
무슨 일을 하나요
AI 개발 프로젝트 담당자 역할
누가 수행 하나요 : AI/ML 엔지니어, 데이터 사이언티스트, MLOps 엔지니어
무슨 일을 하나요
AI 개발 프로젝트 담당자 역할
이렇게 단계별로 주체와 역할을 나누면, AI 개발 프로젝트 담당자는 단순한 발주자가 아니라 프로젝트 의사결정과 품질 보증에 직접 관여하는 핵심 역할을 수행하게 됩니다.
지금까지 AI 개발 프로세스 6단계와 각 단계 별 역할 분담에 대해 알아봤습니다. 사실 IT, AI에 대한 전문성이 없는 기업이라면 데이터 준비, 모델 선택, 운영 환경 구축까지 모든 과정을 내부에서 해결하기란 쉽지 않습니다. 경험과 전문성을 갖춘 전문가와 함께하는 것이 AI 도입을 성공적으로 이뤄내는 지름길입니다.
국내 1위 IT 아웃소싱 플랫폼 위시켓에서는 2025년 상반기에만 약 100억 원의 AI 도입 프로젝트를 진행했습니다. 그만큼 AI 도입에 대한 관심이 정말 뜨거운 것을 알 수 있는데요. 위시켓은 AI 도입 프로젝트에서 아래와 같은 도움을 드리고 있습니다.
이런 과정을 거쳐 AI를 도입한 10개 기업의 실제 사례를 정리한 리포트를 이전 글에서 소개드렸습니다. 실제 프로젝트 10개를 바탕으로, 기업들이 자동화, 데이터 분석, 고객 응대, 공정 이상 감지 등 다양한 분야에서 어떤 문제를 안고 있었고, 어떤 AI 기술로 풀었는지, 결과는 어땠는지를 한눈에 살펴볼 수 있는 자료입니다.
이번 글에서 AI 개발 프로세스의 전체적인 그림을 이해하셨다면, 실제로 어떤 결과물이 만들어졌는지 리포트를 통해 확인해보시면서 AI 도입에 대한 이해를 더욱 높이실 수 있을 것입니다.
©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.