회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 이용 중이라면 월 기본 5% 할인받으세요
여러분은 ‘크리에이터’ 하면 어떤 이미지가 떠오르시나요? 저는 자신의 상상을 자유롭게 표현하는 창작자의 모습이 먼저 떠오르는데요. 창작자들은 음악, 디자인, 영상, 문학 등 다양한 분야에서 아이디어와 비전을 현실로 구현해 냅니다. 이러한 작업은 보통 오랜 학습과 반복을 통해 이루어지고, 전문적인 도구도 다룰 줄 알아야 합니다.
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
여러분은 ‘크리에이터’ 하면 어떤 이미지가 떠오르시나요? 저는 자신의 상상을 자유롭게 표현하는 창작자의 모습이 먼저 떠오르는데요. 창작자들은 음악, 디자인, 영상, 문학 등 다양한 분야에서 아이디어와 비전을 현실로 구현해 냅니다. 이러한 작업은 보통 오랜 학습과 반복을 통해 이루어지고, 전문적인 도구도 다룰 줄 알아야 합니다.
하지만 우리 앞에 등장한 생성형 AI 기술로 인해 크리에이터가 되기 위한 장벽은 점점 낮아지고 있습니다. 누구나 영감(Inspiration)만 있다면 AI 도구를 활용해 내 작품을 만들 수 있는 시대가 된 것이죠.
그래서 대표적인 이미지 생성 AI 툴 달리3(DALL-E3)와 미드저니(Midjoureny), 파이어플라이(Adobe Firefly)를 비교해 보고자 합니다. 이번 글에서는 같은 프롬프트를 입력해 각 툴에서 이미지를 만들어 보았습니다. (참고: AI 툴 선정 기준은 접근성과 대중성, 제가 자주 사용하는 빈도수에 따라 선정해 보았습니다.)
이미지 생성 AI는 각각 어떻게 이용할 수 있을까요? 우선 멤버십 가격부터 비교해 보았습니다. OpenAI에서 만든 달리3를 사용하려면 GPT Plus를 구독해야 하는데요. 요금은 월 22달러(한화 약 29,000원)입니다.
미드저니의 경우 4개 요금제로 구성되어 있으며, 일반적으로 많이 쓰는 베이직 요금제는 월 10달러(한화 약 13,000원)에 이용할 수 있습니다. 마지막으로 어도비의 파이어플라이는 월 25개 생성 크레딧은 무료로, 한화 기준 월 100개의 생성 크레딧은 월 5,500원에 이용할 수 있습니다. 가격만 봐서는 어떤 툴이 더 좋다고 비교하기 어렵기 때문에, 좀 더 자세한 기능을 살펴보겠습니다.
일단 세 도구의 공통점은 텍스트 기반으로 이미지를 만드는(Text-To-Image) AI라는 것입니다. 처음엔 비슷하게 느껴지지만, 사용하다 보면 각각의 특징이 있다는 것을 알 수 있죠. 이러한 점을 잘 활용하면 좀 더 원하는 이미지에 가까운 결과를 얻을 수 있습니다.
먼저 달리는 OpenAI에서 개발한 이미지 생성형 AI 도구입니다. 그래서 GPT Plus 사용자라면 별도의 가입이나 플러그인 설치 없이 챗GPT의 프롬프트에서 필요한 이미지를 요청하면 됩니다. 바로 이 점이 가장 큰 특징이자 장점인데요. 챗GPT와 연동되어 있어, 전체 맥락(Context)에 대한 이해가 뛰어납니다. 이 부분에 관해서는 뒤에서 더 자세히 살펴보겠습니다.
달리는 현재 마이크로소프트의 Bing Image Creator에도 적용되어 있습니다. 물론 달리에 비해 여러 제약이 있지만, 일단 무료로 사용해 보는 것도 가능합니다. 뒤에 나올 실제 이미지 제작 부분에서 달리와 Bing Image Creator도 함께 비교해 보겠습니다.
미드저니는 일러스트레이션 및 디자인 분야에 특화되어 있는데요. 최근 AI를 쓴 창작물은 대부분 미드저니를 사용한 사례가 많고, AI로 제작해 미술대회에서 수상한 작품 역시 미드저니로 제작됐습니다. 실제 광고나 디자인 분야에서는 스테이블 디퓨전과 함께 미드저니가 가장 많이 사용되고 있습니다.
달리가 챗GPT에 통합되어 있듯이 미드저니는 디스코드 내에 통합되어 있습니다. 또한 달리가 각 이미지를 개별적으로 취급하는 것에 비해, 미드저니는 앞서 작업한 이미지에 연속적인 작업이 가능합니다. 예를 들어, 먼저 작업한 이미지를 토대로 베리에이션(Variation)을 할 수 있고, 가지고 있는 이미지를 참고해서 작업을 요청할 수도 있죠. 크리에이터의 역량이나 숙련도에 따라 더 좋은 결과물을 만들 수 있는 환경입니다.
파이어플라이는 어도비에서 만든 이미지 생성 도구인데요. 어도비 사이트에 가입하면 누구나 무료로 이용할 수 있습니다. 사실 파이어플라이가 유명해진 것은 텍스트로 이미지를 만드는 것보다는 ‘Generate Fill’로 불리는 생성 채우기 기능 덕분입니다.
어도비가 만든 아래 영상을 보면, 달리나 미드저니와 어떤 면에서 다른지 알 수 있습니다.
처음 이미지 생성 AI가 등장했을 때 이제 어도비의 시대는 끝났다는 말이 나오기도 했는데요. 지금은 생성형 AI가 어도비의 포토샵, 일러스트레이터 등 기존 프로그램에 날개를 달아준 격이 되었죠. 미드저니 등 AI로 작업한 다음, 후반 작업은 다시 파이어플라이를 통해 보완하는 경우도 많기 때문입니다.
그렇다면 이제 각 AI의 결과물을 한번 비교해 볼까요? 한동안 디지털 노마드라는 말이 유행한 적이 있는데요. 생성형 AI로 인해 앞으로 진정한 디지털 노마드가 가능하지 않을까라는 생각에, ‘디지털 노마드’를 표현할 수 있는 그림을 제작해 봤습니다.
먼저 달리3에 ‘석양을 바라보며 바닷가에서 노트북으로 일하는 남자(전형적인 디지털 노마드의 모습이죠)의 모습’을 그려 달라고 요청했습니다. 좀 더 친근한 느낌을 위해 웹툰 스타일로 제작해 달라고 했고요. 그럼 결과를 한번 볼까요?
디지털 노마드의 느낌이 잘 표현되었나요? 달리의 경우 제가 요청한 프롬프트에 대해 어떻게 이해하고 적용했는지를 확인할 수 있습니다. 결과로 나온 이미지를 클릭한 후, 우상단의 ‘!’를 클릭하면 프롬프트를 보여주는데요. 위 이미지의 프롬프트는 아래와 같습니다.
Prompt: A webtoon-style illustration capturing the back view of a man embodying the digital nomad lifestyle. He's at a beach resort, working on his laptop in a cozy cabin, with the setting sun in the background. The man is wearing headphones and dressed in comfortable attire, suggesting a relaxed yet productive work mode. The cabin door is open, revealing the serene beach scene outside, and the man's posture is casual as he's engrossed in his work, with the warm hues of the sunset enveloping him and his temporary workspace.
다음으로 달리를 기반으로 이미지를 생성하는 빙 이미지 크리에이터를 사용해 보죠. 과연 어떤 결과를 만들어 줄까요? 우선 달리가 만들어준 프롬프트를 그대로 사용해 봤습니다. (한국어로 입력해도 됩니다.)
빙 이미지 크리에이터는 기본 3~4개의 이미지를 만들어 주는데요. 이미지 크기 조정이나 긴 프롬프트 입력이 어렵다는 점 등의 제약이 있지만, 기본적으로 달리와 꽤 비슷한 결과물을 만들어 준다는 것을 알 수 있습니다. (달리 프롬프트의 마지막 문장은 입력하지 못했습니다.)
또한 달리의 경우 챗GPT와 연동되어 있어, 단순 이미지뿐만 아니라 전반적인 맥락을 검토한 작업이 가능합니다. 예를 들어, 얼마 전 책 프랑켄슈타인의 콘티를 만들어 봤는데, 달리가 가장 뛰어난 결과물을 만들어 냈습니다.
아래 그림은 프랑켄슈타인이 자신의 외모를 비관하는 장면을 그려 달라고 요청한 결과인데요. 미드저니나 파이어플라이의 경우 우리가 생각하는 프랑켄슈타인(괴물)의 이미지를 반영하지 못했습니다. (원래 예시를 프랑켄슈타인 콘티 작업을 비교하는 것으로 하려다가, 미드저니의 결과물이 너무 어두운 느낌이 들어서 변경했습니다.)
참고로 프랑켄슈타인의 콘티를 작업한 전체 결과물은 여기에 있습니다. 저는 이 작업을 할 때 챗GPT에 콘티에 필요한 주요 장면을 뽑아 달라고 요청했는데요. 혹시 맥락을 설명하는 작업이 필요할 때는 챗GPT를 활용해 작업하는 것을 추천합니다. 특히 일러스트 느낌의 작업물이 이질감이 적어서 좋았습니다.
다음으로 미드저니와 파이어플라이로 작업한 결과물입니다. 먼저 미드저니를 통해 작업했는데, 영어로 프롬프트를 입력해야 해서 달리에서 얻은 프롬프트를 그대로 활용했습니다.
미드저니의 결과물을 보면 기본적으로 색감이 가장 풍부하다는 느낌이 드는데요. 저는 웹툰 스타일이라고 요청했지만, 디지털 아트나 그래픽 노블 쪽에 가깝게 표현해 줍니다. 그래서 실사 이미지 또는 약간 판타지적인 느낌을 살릴 때 주로 미드저니를 사용하는 경향이 있습니다.
이어서 파이어플라이의 작업 결과도 같이 확인해 볼게요. 이번 역시 동일한 프롬프트를 사용했습니다.
파이어플라이의 경우 종횡비(정사각형, 와이드스크린 등)와 콘텐츠 유형(사진, 아트), 참조하는 이미지, 효과 등을 직접 설정할 수 있는데, 동일 선상에서의 비교를 위해 다른 조건은 사용하지 않았습니다. 위 이미지는 정사각형에 사진 형태로 만들어 달라고 요청한 것인데, 사진보다는 아트에 가까운 결과가 아닌가 싶습니다.
‘디지털 노마드’를 표현한 결과물로 봤을 때 저는 미드저니가 가장 마음에 들었습니다. 아직은 로망에 가까운 단어라 그런지 그 점이 잘 표현됐다고 생각합니다. 그래서 미드저니로 기본적인 작업을 하고, 파이어플라이로 약간의 보정 작업을 거쳐 아래와 같은 최종 결과물을 만들어 봤습니다.
사실 저는 그림을 그릴 줄도 모르고, 포토샵도 잘 다루지 못합니다. 그래서 이미지 작업이 필요할 땐 윈도우 그림판을 쓰거나, 포토샵에서 간단한 기능만 써왔습니다. 그런데 최근 이미지 생성형 AI 툴을 접한 후, AI로 만든 이미지를 이곳저곳에 활용하고 있습니다.
이처럼 누구나 AI를 활용할 수 있게 되면서 ‘생성’과 ‘생각’의 차이에 대해 고민해 보았는데요. 생성은 프롬프트를 통해 만들 수 있는 가장 확률이 높은 결과입니다. 그러나 그 근원이 되는 것은 결국 인간의 생각이죠.
과거에는 1% 영감(Inspiration)과 99%의 노력(Perspiration)이라는 말이 흔히 쓰였는데요. 이제 이 ‘노력’이 ‘생성’으로 대체되는 시대가 온 것 같습니다. 인간의 노력은 1%의 영감에 모두 활용돼야 할 때가 아닌가 싶고요.
지금까지 살펴본 예시도 그렇지만 결국 어떤 그림을 만들 것인지, 또 그걸 보는 사람에게 어떤 느낌을 전할 것인지는 결국 스스로 결정해야 합니다. 그래서 기술의 시대일수록 인문학이 더욱 중요해진다는 말이 와닿는 것 같습니다. 그럼 이번 글을 통해 이미지 생성형 AI에 한 걸음 더 가까워지는 데 도움이 되길 바랍니다.
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.