회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 월 서버 비용이 부담되시나요?
디자이너의 자리를 위협하다, 이미지 생성형 AI 툴 UX 분석 3편
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
디자이너의 자리를 위협하다, 이미지 생성형 AI 툴 UX 분석 3편
2023년 5월 22일, 미국 펜타곤(국방부) 인근에서 폭발이 발생했다는 보도가 전 세계로 빠르게 퍼졌다. 이로 인해 미국 증시의 스탠더드앤드푸어스(S&P) 500 지수가 0.3%가량 일시적으로 떨어지기도 했다. 다행히도 미 당국에서 “펜타곤 인근 사고는 없었다"라며 직접 진화에 나섰고, 해당 사진이 생성형 인공지능 AI를 통해 제작된 가짜 사진임이 드러났다.
이 사례는 다음 두 가지 측면에서 우리에게 경각심을 일깨워준다. 첫째로 세상은 우리가 생각하는 것보다 훨씬 빠르게 변화한다는 사실에 비해, 이미지 생성형 AI 기술에 대한 우리의 이해도와 경험은 아직 극초기 단계에 머물러 있다는 점이다. 더욱이 본인이 디자이너라면 이미지 생성형 AI 기술에 대한 이해와 이를 적용하려는 노력이 필요하다. 그렇지 않으면 얼마 지나지 않아 디자이너로서의 경쟁력을 잃을 수도 있다.
둘째로 이미지 생성 기술의 무분별한 활용은 예술 작품 등의 저작권 문제를 야기하며, 또한 범죄 행위에 악용될 가능성도 있다는 점이다. 따라서 이미지 생성형 AI 기술을 단순히 신기한 도구로만 사용하는 것이 아니라, 올바르게 활용하고 저작권 이슈, 범죄 활용 등에 대한 이슈에 대처할 방법을 함께 모색해야 하는 시점에 있다.
이번 글에서는 누구나 작가로 만들어 주는 이미지 생성형 AI 프로그램 달리2(DALL·E 2), 미드저니(Midjourney)의 UX 분석과 생성형 AI 기술 관련 이슈에 대해 살펴보고자 한다.
생성형 AI 프로그램인 달리2와 미드저니의 가장 큰 공통점은 사용자가 입력한 텍스트 명령어(Prompt)를 기반으로 새로운 형태의 고품질 시각 이미지를 생성해낸다는 점이다. 초기에는 일정 부분 무료로 이용 가능했지만, 현재는 아쉽게도 두 프로그램 모두 유료화가 되었다.
달리2(DALL·E 2)는 최근 가장 화두가 되고 있는 ‘Open AI’에서 개발한 제품이다. 2022년 4월에 공개됐는데 전작인 달리(DALL·E) 보다 화질이 4배 이상 상승했고 사용자가 이미지를 삽입해 기존 이미지를 변형하거나, 출력하는 것까지 가능할 정도로 더욱 정교한 결과물을 출력해낼 수 있다. 2022년 12월 Open AI의 주력 제품인 ‘챗GPT’가 선풍적인 인기를 끌면서, 달리2까지 자연스레 주목을 받게 되었다. 현재는 $15(한화 약 18,000원) 결제 시 115번의 크레딧을 구매할 수 있으며, 각각의 크레딧은 이미지 생성 시 한 개씩 차감된다.
미드저니는 샌프란시스코에 본사를 둔 스타트업으로 인공지능을 활용해 일반인들이 창의성을 증진시키고, 누구나 아름다운 그림을 그릴 수 있는 환경 제공을 목표로 한다. 특이하게도 미드저니는 음성 채팅 플랫폼인 디스코드를 통해서만 사용이 가능한데, 이는 다양한 커뮤니티와 상호작용하며 사용자들이 생성한 작품을 서로 쉽게 공유할 수 있도록 한다. 현재 미드저니는 $10(한화 약 12,000원) 지불 시 한 달에 약 200장의 이미지를 생성할 수 있는 서비스를 제공하고 있다.
이번 글에서는 두 프로그램 모두 직접 활용해 본 경험을 토대로, 사용자 관점에서의 장단점을 분석해 보았다.
달리2는 미드저니와는 다르게 웹 브라우저에서 직접 이미지 생성이 가능하므로 별도의 플랫폼을 설치할 필요가 없다. 이뿐만 아니라 달리2 접속 시 Open AI에서 제공하는 타 서비스 및 API에도 동시 접근이 가능하다. 홈 화면은 우리에게 익숙한 구글과 같은 검색창이 위치해 있으며, 사용자는 자신이 생성하고 싶은 모습의 이미지를 상상해 검색창에 텍스트를 입력하면 된다. 이는 사용자에게 빠른 실험 환경을 제공하여 이미지 생성 기능에 익숙하지 않은 사용자들에게 높은 접근성을 자랑한다.
달리2 웹사이트는 직관적이고 사용하기 쉬운 인터페이스를 제공한다. 웹사이트에 처음 접속하면 어떤 명령어를 입력해야 할지 감이 오지 않는 경우가 많은데, 이를 보완하기 위해 홈 화면 하단에 달리2로 생성한 이미지를 보여준다. 이 결과물을 통해 명령어 예시를 확인하고, 동일한 명령어를 적용할 수 있도록 한다. 이는 빠른 시행착오를 유도하여 사용자들이 프로그램과 더 빠르게 친숙해지고, 학습할 수 있게 돕는 장치다.
하지만 달리2에 아쉬운 부분도 있다. 현재는 유료화되었지만 초반에는 소량의 크레딧이 주어졌을 때가 있다. 이때 나(개인)에게 할당된 크레딧을 인지하지 못하여, 이미지를 계속 생성하다가 어느 순간 이미지 생성이 불가능한 상황에 처했던 경험이다. 먼저 이미지 생성의 다양성을 경험한 후 유료 지불을 고려했었는데, 크레딧의 관리는 물론 이미지 생성 시 크레딧 차감에 대한 시각적인 안내가 부족한 점이 아쉬웠다. 이에 크레딧의 보유 현황을 더 잘 드러나게 표시하거나, 이미지 생성 시 크레딧 차감을 강조하는 방법을 강화한다면 사용자들에게 더 나은 경험을 제공할 수 있을 것이다.
두 번째 단점은 텍스트 입력에 대한 명확한 가이드의 부재와 베리에이션(Variation)의 제한성이다. 앞서 장점으로 언급하기도 했지만, 예시 이미지를 통해 사용자에게 가이드를 제공하는 것은 좋다. 그러나 사용자 입장에서는 텍스트를 얼마나 상세하게 작성해야 하는지, 어떻게 표현해야 더 효과적인 결과물을 생성할 수 있는지에 대해 자세히 알고 싶다. 더욱이 이미지 결과를 기반으로 다른 베리에이션을 요청했을 때, 생성되는 이미지들이 너무 다양하고 상호 간의 연관성이 떨어져 결과를 함께 활용하기에 제한적이다. 따라서 베리에이션 생성 시 이미지들 간의 연관성을 수치로 조절할 수 있다면, 사용자들의 선호에 맞게 결과물을 얻을 수 있을 것이라 생각한다.
다음으로 미드저니의 장단점을 살펴보았다. 미드저니의 디스코드 채널은 이미지 생성에 대한 상세한 가이드를 블로그 형태로 제공하여, 사용자들이 쉽게 시작할 수 있도록 도와준다. 특히 'how to get started'라는 별도의 탭을 통해, 초기 접근에 필요한 정보와 단계별 안내를 제공하여 초보자들이 혼동 없이 이미지 생성을 시작할 수 있다. 이러한 상세한 가이드와 블로그 형태의 설명은 사용자들에게 큰 도움을 줄 수 있으며 접근성을 높여준다.
또한 미드저니의 디스코드 채널에선 다른 사용자들이 생성한 이미지들을 실시간으로 확인할 수 있다. 이는 사용자들이 생성하는 이미지들의 퀄리티와 다양성을 쉽게 파악하고, 다른 참여자들과의 상호작용과 아이디어 교환에 도움을 준다. 이미지 생성에 대한 실시간 피드백과 다른 사용자들의 작업물을 보며 영감을 얻을 수 있으며, 창의성을 자극하고 성장할 수 있는 기회를 제공하는 것도 장점 중 하나다.
그렇다면 미드저니의 가장 큰 단점은 무엇일까? 바로 디스코드라는 음성 채팅 플랫폼에 별도로 접속해야 한다는 점이다. 디스코드를 이용하지 않는 사람들에게는 별도의 플랫폼을 이용해야 하므로 접근성이 떨어질 수 있다. 물론 웹상에서도 구동이 가능하지만, 디스코드에 대한 이해도가 없는 사용자에게는 불편함이 따를 수 있다.
두 번째 단점은 이미지를 생성하는 과정에서 생성 중인 이미지에 대한 명확한 피드백이 부족하다는 점이다. 생성된 이미지가 어디서 확인되는지에 대한 정보를 파악하기 어렵거나, 다른 사용자들의 이미지와 혼동되어 작업의 주목도가 떨어지는 경험을 했다. 또한 동시에 다양한 이미지가 생성되기 때문에 개인적인 작업 공간을 확보하는 느낌이 부족하고, 이미지들이 다소 정신없이 생성되어 집중도가 떨어질 수 있다.
지금까지 살펴본 것처럼 달리2(DALL·E-2)와 미드저니(Midjourney)는 이미지 생성형 AI 기술의 혁신적인 발전을 보여주고 있다. 이러한 기술 발전은 우리의 창의성과 상상력을 새로운 수준으로 끌어올리며, 디자이너와 창작자들에게 무한한 가능성을 제시한다. 그러나 이러한 혁신 기술에는 몇 가지 우려점도 함께 존재한다.
첫 번째로 생성형 AI를 기반으로 한 이미지 생성 프로그램들은 이미지의 저작권 문제를 야기할 수 있다. 이미지 결과물을 생성한 주체가 개개인의 사용자가 아니기 때문에, 작품의 저작권 소유자를 명확히 확인하기 어려울 수 있다. 또한 기존의 소스 이미지를 활용할 때도 명확한 저작권을 명시하지 않는 경우, 이를 활용해 생성된 신규 이미지의 저작권 또한 명확하지 않다는 문제점이 있다.
두 번째로 생성형 AI 기술은 사실적인 이미지 생성을 가능하게 하지만, 이는 동시에 딥페이크와 같은 범죄에 악용되는 문제를 야기할 수도 있다는 점이다. 딥페이크는 실제와 구분하기 어려운 가짜 영상이나 이미지를 생성하는 기술로, 이번 글에 서론에서 언급한 펜타곤 사건처럼 사회적, 정치적으로 심각한 영향을 미칠 수 있다. 이에 대한 대응으로 기술적인 필터링 및 탐지 방법의 개발과 함께 이를 사용하는 사용자들의 교육과 인식을 높이는 활동이 필요하다.
지금까지 총 세 편의 글을 통해 소개한 이미지 생성형 AI 프로그램들이 우리에게 혁신적인 창작 가능성을 제공할 것이라는 것은 믿어 의심치 않는다. 다만 이와 동시에 책임과 규제의 필요성도 함께 대두되고 있다. 따라서 AI 기술 발전에 따른 새로운 문제에 대한 경각심을 가지고, 올바른 방향으로 나아가기 위한 방향을 모색해야 한다. 특히 저작권 문제와 신뢰성 확보를 위한 기술적, 법적 대응 및 사용자들의 인식과 교육이 필요하며, 예술 분야에서 창의적으로 활용할 수 있는 방안도 함께 고민해야 할 시점이다.
<참고 자료>
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.