회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 월 서버 비용이 부담되시나요?
디자이너의 자리를 위협하다, 이미지 생성형 AI 툴 UX 분석 2편
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
디자이너의 자리를 위협하다, 이미지 생성형 AI 툴 UX 분석 2편
지난 1편에서는 우리에게 가장 친숙한 2D 디자인 프로그램인 어도비 포토샵에서 출시한 베타 버전의 ‘Generative Fill’ 기능을 소개했다. 오늘은 좀 더 나아가 2D 이미지를 3D의 모습처럼 변환시키는 드래그겐(DragGan) 프로그램에 대해 다뤄보고자 한다. 2D, 3D 디자인 프로그램을 모두 쓰는 사용자 입장에서 얘기하면, 드래그겐의 이미지 편집 기술은 감히 놀랍다고 할 수 있다.
본격적으로 드래그겐(DragGan) 프로그램을 소개하기 앞서 문득 독자들에게 궁금한 점이 있다.
두 디자이너 모두 기본적으로 디자인에 대한 이해와 소양을 갖춰야 하지만, 각각 활동하는 영역과 필요로 하는 스킬셋은 생각보다 차이가 크다. 2D 디자이너가 그래픽 디자인, 타이포그래피 등을 주로 기본으로 익힌다면, 3D 디자이너는 기본적으로 컴퓨터 그래픽스와 같은 공간 지각 능력을 갖춰야 한다. 그런데 오늘 소개하는 DragGan은 이들 간의 경계선을 서서히 허물고 있는 모습이다.
2D 디자이너 | 3D 디자이너 | |
주 활동 영역 | 웹/앱 디자인 광고 디자인 그래픽 디자인 출판 디자인 패션 디자인 | 게임 디자인 영화 제작 애니메이션 건축 제품 디자인 자동차 디자인 |
필요한 스킬셋 | 그래픽 디자인 타이포그래피 색채 이론 시각 커뮤니케이션 | 컴퓨터 그래픽스 객체의 구조, 폴리곤 모델링, 애니메이션 워크플로우 등에 대한 기술적 이해 |
*사용 프로그램 |
|
|
(*출처: 2D, 3D 디자인 프로그램 사용 빈도별 순위. 구글 트렌드 데이터 2023.05월 기준)
드래그겐은 2022년 11월, 구글 AI와 MIT의 공동 연구로 대중에게 처음 선보인 프로그램으로, 아직은 일반인 사용이 불가하다.
이 프로그램은 명칭에 ‘GAN’이라는 단어가 포함되어 있듯, 생성적 적대 신경망 (Generative Adversarial Networs, GAN)이라는 기술을 사용한다. 쉽게 말하자면 GAN은 두 개의 신경망을 생성하는데, 하나는 진짜 이미지와 가짜 이미지를 구별하는 역할을 하고, 다른 하나의 신경망은 가짜 이미지를 생성하는 역할을 한다. 이 두 가지의 신경망이 동시에 서로 경쟁하며 이미지를 생성하는 능력을 향상시키는 원리다.
복잡한 설명보다는 위 GIF 이미지를 통해 프로그램의 작동 방식을 이해할 수 있다. 드래그겐 프로그램에서 하나의 원본 이미지를 불러온 후, 마우스를 한 지점에서 다음 지점으로 드래그 앤 드롭 (Drag & Drop)하면 이미지가 요청된 형태에 맞춰 자동 조정이 된다.
이때 이미지의 세부 정보를 제어할 수 있게 하는 기술이 DragGAN이다. 결국 이와 같은 간단한 방식으로 위 사진처럼 눈을 뜨고 있는 고양이의 눈을 감게 할 수 있을 뿐만 아니라, 고개를 회전시키는 등 마치 하나의 물체를 3D 모델링을 통해 여러 각도로 보는듯한 이미지를 생성할 수 있다. 위 GIF가 원래 영상이지 않냐고 생각할 수 있지만, 고양이의 단면을 찍은 2D 사진이다.
앞서 언급한 것처럼 드래그겐은 아직 일반인 사용은 어렵다. (지난 6월 22일 소스코드와 데모 공개) 따라서 DragGan 소개 페이지에 기재된 여러 영상을 참조해 장단점을 들여다보았다.
드래그겐은 원본 사진을 보다 사실적으로 수정 및 변환할 수 있다는 부분이 가장 큰 장점으로 꼽힌다. 이전에 소개한 포토샵의 경우, 이미지의 배경을 전체적으로 변경하거나 이미지 주변 영역을 선택하여 Generative Fill 기능으로 이미지를 생성, 확장하는 것은 매우 쉽지만, 이미지 내에서 선택된 개체나 대상의 각도를 변경하거나 변형하는 과정에는 제한 사항이 많았다.
하지만 드래그겐은 원본 이미지를 기반으로 마치 실제 영상이 움직이는 것처럼 작동하여, 마우스로 드래그한 영역에 자동으로 이미지를 변형해 준다. 이는 이미지를 보다 사실적으로 수정하고 다양한 변환을 적용할 수 있는 혁신적인 기능이다.
또한 드래그겐은 다양한 이미지 유형을 지원하며, 이미지의 레이아웃, 위치, 모양, 감정 등을 변경할 수 있어 매우 유연한 활용 가능성을 가지고 있다. 예를 들어, 동물 이미지에서는 강아지나 고양이의 모습을 바꾸는 것뿐만 아니라, 자동차 이미지에서는 색상, 디자인, 바퀴의 크기 등을 수정할 수 있다. 사람 이미지에서는 눈, 피부색, 머리카락, 입술 등의 길이를 조정해 분위기를 바꿔볼 수 있고, 풍경 이미지에서는 하늘의 밝기를 높이거나 바다의 색상을 수정할 수 있다.
이처럼 하나의 정적인 이미지를 특별한 디자인 역량 없이도 다양하고 쉽게 변형 시켜볼 수 있다.
이러한 드래그겐의 기능을 보고 단순히 신기하다, 놀랍다에서 끝나는 것이 아니라, 이를 접목해 볼 수 있는 유즈 케이스(Use Case)에 대해 생각하는 것이 필요하다. 드래그겐은 사진 편집, 디자인뿐만 아니라 게임 개발, 마케팅, 광고 등 다양한 분야에서 자유롭고 창의적인 작업을 지원할 것이다. 또한 전문적인 기술을 습득하는 시간을 줄이고, 다양한 아이디어를 빠르게 시각화할 수 있도록 도와줄 수 있다.
예를 들어, 광고에서는 제품 이미지의 배경이나 요소를 수정해 더 매력적인 광고물을 만든다거나, 제품의 색상 디자인을 다양하게 변경해 다양한 시각적 효과를 시도할 수 있을 것이다.
이커머스에서는 제품의 모습을 고객이 자유자재로 확인할 수 있도록 하여 더욱 뛰어난 시각적인 경험을 제공할 수 있고, 영화 및 게임 산업에서도 캐릭터, 배경, 특수 효과 등을 생성하고 수정하는 데 사용할 것으로 보인다. 캐릭터의 외모나 특성을 조정하거나, 배경의 조명과 색상을 변경하여 원하는 분위기와 시각적인 효과를 구현할 수 있을 것이다.
그렇다면 이렇게 다양하게 적용할 수 있는 드래그겐의 단점은 무엇일까? 현재 프로그램의 직접 사용이 어려워, 사용성 관점에서의 단점 파악은 다소 제한적이지만 현 수준에서 프로그램이 상업적으로 배포되었을 때 예상할 수 있는 단점은 두 가지가 있다.
드래그겐은 많은 양의 컴퓨팅 자원을 필요로 할 것으로 예상된다. 포토샵에서도 Generative fill 기능을 활용해 신규 이미지를 생성할 때 예상보다 오랜 시간이 소요되는 것을 경험했다. 드래그겐에서 사용한 컴퓨터 사양에 대해선 알 수 없으나, 해당 프로그램이 요구하는 이미지 변환 작업에는 대규모의 연산 작업이 필요할 것으로 예상된다.
따라서 일반적인 개인용 PC 또는 저사양 하드웨어로는 원활한 작업이 어려울 수 있다. 대용량 이미지나 복잡한 변환 작업 수행을 위해 고성능 컴퓨팅 시스템, 클라우드 기반 컴퓨팅 리소스를 활용해야 할 수 있으며, 추가적인 비용과 인프라 구축이 필요할 수도 있다.
현재 많은 이미지 생성 AI 프로그램은 저작권과 윤리적인 문제에서 자유로울 수 없다. 드래그겐 역시 마찬가진데, 이미지 변환과 관련된 기술은 사진 조작, 가짜 이미지 생성, 개인 정보 침해 등 부정적인 용도로도 활용될 수 있는 가능성이 존재하기 때문이다. 이로 인해 사회적인 혼란을 초래할 수도 있다.
예를 들어, 드래그겐을 사용해 실제 존재하지 않는 인물의 얼굴을 생성하거나 기존 사진에 인위적으로 변형할 경우, 이를 악용하여 가짜 정보를 전파하거나 사기를 저지를 수 있다. 또한 개인 정보 침해에 대한 우려도 있다. 드래그겐으로 실제 사람의 이미지를 변형하거나 재구성하는 과정에서, 사람들의 사생활과 개인 식별 가능한 정보를 보호하는 데에 각별한 주의가 필요할 것이다.
오늘 살펴본 드래그겐은 사실적인 이미지 수정과 변형을 쉽게 수행할 수 있는 프로그램으로, 사진 편집, 디자인, 게임 개발, 광고 등 다양한 산업 분야에서 활용될 수 있다. 그러나 아직 개발 단계에 있어 클라우드 형태로 서비스를 제공하지 않는다면, 많은 컴퓨팅 자원을 필요로 할 것으로 예상된다. 또한 이미지 생성 시 저작권 및 윤리적인 문제가 발생할 수 있어 주의가 필요하다.
그러나 드래그겐은 창의적이고 다용도인 도구로, 다양한 작업을 수행할 수 있는 잠재력을 가지고 있다. 따라서 적절한 사용과 관리를 통해 프로그램의 장점을 최대한 활용하고, 단점을 극복한다면 앞으로 많은 다양한 산업에서 새로운 가능성을 제공할 수 있을 것으로 기대된다.
<참고 자료>
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.