챗GPT와 나노바나나에게 카페 홍보 이미지를 시켜봤더니, 디자이너의 자리가 보였다

AI가 디자이너를 대체할 수 있냐는 질문, 이제 좀 지겹잖아요. 근데 실제로 시켜보고 비교한 글은 의외로 드물어요.

레이디러너가 이걸 진짜 실험해봤어요. AI의 등장 이후로 디자이너의 역할과 대체성에 관한 이야기가 끊이지 않지만, 정작 궁금했던 건 이거였대요. 흔히 떠올리는 언어 기반 이미지 생성 모델들은 말 그대로 사진이나 그림 같은 '이미지' 생성에 최적화되어 있지, '디자인'에는 특화되어 있지 않거든요. 물론 피그마 메이크나 캔바 AI 같은 디자인 특화 도구도 있지만, 여기서 궁금했던 건 비전문가가 흔히 쓰는 AI 모델을 사용했을 때의 결과였어요.

클로드가 클라이언트, 챗GPT와 나노바나나가 디자이너

실험 구조부터 설명해야 해요. 대중적으로 널리 쓰이는 AI라 하면 챗GPT와 구글 제미나이(나노바나나)잖아요. 이 두 모델에게 동일한 디자인 요청을 하고 결과물을 비교하는 실험이에요.

재미있는 건 클라이언트 역할이에요. 실험 대상인 챗GPT와 제미나이 대신 클로드를 특별 게스트로 데려와서 클라이언트를 시켰거든요. 인스타그램 업로드용 이미지, 카페 신제품 출시 홍보라는 최소한의 범위만 설정하고 클로드에게 디자인 요청 사항을 써달라고 했어요.

클로드가 작성한 시나리오는 이랬어요. '달빛공방'이라는 연남동 수제 디저트 전문 카페가 '우유 생크림 소금빵'(4,500원)을 신제품으로 출시하는 상황. 겉은 바삭하고 속은 촉촉한 프랑스식 소금빵에 직접 만든 우유 생크림을 듬뿍 넣은 시그니처 메뉴라는 설정까지 꽤 디테일하더라고요. 배경 컬러도 #F4E8D0으로 지정하면서 "저희 카페 인테리어랑 똑같은 색"이라는 주문까지 붙였어요. (AI가 쓴 클라이언트 요청서치고 현실적이에요.)

실험 조건은 세 가지예요. 챗GPT와 제미나이 모두 동일한 프롬프트를 입력하고, 비전문가의 요청 상황으로 가정해서 전문 디자이너가 작성할 법한 키워드를 최대한 배제했어요. 그리고 핵심 — 이미지를 여러 번 생성하지 않고 단 한 번의 요청으로 생성된 결과물만 비교했어요. 리롤 없이 첫 결과만 본다는 거예요.

실험은 3가지 방식으로 진행했어요.

실험 1: 스케치를 기반으로 조합하기
실험 2: 요청 내용으로 바로 생성하기
실험 3: 전략을 짜서 프롬프트로 변환하기

결론부터 말하면, 놀랍게도 결과물에 큰 차이가 존재했어요.

실험 1: 스케치부터 그려보라고 했더니 — 구조 인식 테스트

AI가 얼마나 '디자이너처럼' 사고할 수 있을지가 궁금해서 선택한 방식이에요. 디자이너라면 작업을 시작할 때 구성 요소를 어떻게 배치할지 큰 그림부터 잡잖아요. 그래서 클로드의 요청 내용을 분석해서 레이아웃 스케치를 해보라고 시킨 거예요.

챗GPT와 나노바나나 모두 클로드의 요청 중 "NEW가 눈에 띄게 해달라"는 부분을 반영해서 NEW를 상단에 배치했고, 전체적인 레이아웃과 컴포지션에는 큰 차이가 없었어요. 여기까지는 괜찮았어요.

로고 생성에서 차이가 나왔어요. 클로드는 로고가 따로 없으니 카페 이름을 텍스트로 넣어달라고 했지만, 디자인 능력을 시험하는 김에 로고도 만들어 보기로 했거든요. 여기서 실험에 약간의 변수가 생겼는데, 챗GPT 버전에서는 스케치를 먼저 한 후 로고 자리에 들어갈 로고를 생성해 달라고 했고, 나노바나나 버전에서는 클로드의 이미지 디자인 요청 내용을 기반으로 로고를 만들어 달라고 했어요. 그래서 챗GPT는 '달빛공방'이라는 이름 자체에 좀 더 집중한 반면, 나노바나나는 수제 디저트 카페, 소금빵 등 디자인 요청 사항에 포함되었던 키워드가 더 반영된 모습이었어요.

소금빵 사진도 각각 생성했는데 서로 다른 방식으로 생크림을 채워 넣었더라고요. (AI마다 생크림에 대한 상상이 다른 게 좀 웃겨요.)

자, 레이아웃 스케치도 했고, 로고도 만들었고, 사진도 준비됐으니 이제 조합해서 디자인을 완성하기만 하면 돼요. 생성한 3개의 이미지를 참조로 넣고, 클로드의 디자인 요청 사항을 다시 덧붙이며 이미지를 생성해달라고 요청했어요. 결과는 — 스케치에 나름 충실했고 딱히 틀렸다고 볼 순 없는데 뭔가 "아..." 하게 되는 맛이 있었어요.

클로드가 "폰트는 읽기 쉬운 걸로 부탁드려요, 근데 너무 딱딱한 건 싫고요"라고 했더니 둥근 계열로 텍스트를 쓴 모양이에요. 그리고 챗GPT는 클로드가 특별히 요청한 배경 컬러(#F4E8D0)를 무시하고 로고 이미지에 쓰인 색상을 좀 더 참고했더라고요. 나노바나나도 로고에 쓰인 일러스트레이션 스타일을 장식에 추가로 활용한 점이 보였고요.

실험 2: 그냥 만들어달라고 했더니 — 자연어 해석 테스트

첫 번째 실험의 결과물이 썩 대단하지 않았다 보니 "요청 방식 자체가 AI에게 잘 맞지 않는 것이었나?" 하는 허탈함이 들었대요. 그래서 두 번째는 단순하게 갔어요. 클로드의 요청 사항을 그대로 전달하고 큰 부연 설명 없이 이미지를 생성해달라고만 했어요.

챗GPT는 나름 무난한 결과를 보여줬어요. 근데 나노바나나가 문제였어요. 타이포그래피가 너무 충격적이라 한참이나 말을 잇지 못했다고 해요. (진짜 궁금해서 저도 뚫어지게 봤어요.)

이때 레이디러너가 한 가지 사실을 떠올렸어요. "아, 디자이너라는 역할을 부여하면 좀 달라질까?" 결과는요. 별 차이 없었어요. 나노바나나의 경우는 오히려 퇴보했어요. 이럴 수가.

그나마 챗GPT의 두 가지 결과물은, 비전문가가 막연히 써 내려간 요청으로 만든 이미지라고 보면 나름대로 준수했어요. 아니면 나노바나나의 이미지를 보고 난 뒤 기대치가 바닥을 친 걸 수도 있고요.

실험 3: "전략을 먼저 세우고 프롬프트로 바꿔봐" — 메타 사고 유도 테스트

정말로 AI의 디자인 실력이 이 정도에 불과할까? 의문이 들어 고민하던 중 접근을 완전히 바꿨어요. 클로드의 요청 내용을 첨부하고 먼저 디자인 전략을 세우라고 한 거예요. 적합한 디자인 스타일, 무드, 서체, 컬러, 레이아웃 등 종합적인 디자인 전략을 텍스트로 정리하게 하고, 직접 세운 전략을 기반으로 이미지 생성 프롬프트를 작성하라고 했어요. 그리고 그 프롬프트로 이미지를 생성했어요.

결과가 확 달라졌어요.

뛰어난 디자인이라고 볼 순 없지만 왜인지 어색함이 줄어들고 자연스러워진 느낌이었어요. AI가 스스로 디자인 전략을 세우는 과정을 텍스트로 진행했기 때문인 것 같아요. 글로 전략을 세우고, 이미지 생성용 프롬프트로 한 번 더 다듬은 덕분이에요. (메타 인지를 시키면 AI도 좀 다르게 움직이는 거죠.)

실험을 거듭하다 보니 더 나은 결과를 얻고 싶어져서 전략을 세울 때 여러 가지 참고 기준을 제시한 점도 영향이 있었던 것 같다고 해요. 각 AI가 작성한 프롬프트를 보면 클로드의 원본 요청 내용보다 더 상세하고 정교한 내용으로 바뀌어 있었거든요. 디자이너다운 사고를 끌어내는 장치가 되어준 셈이에요.

나란히 놓고 보니 보이는 것들

전체 결과를 나란히 놓고 보면 패턴이 보여요. 위가 챗GPT, 아래가 나노바나나 결과물들인데, 한글 텍스트 생성 측면에서는 나노바나나가 더 안정적인 결과를 보여줬어요. 자율성을 준 경우에는 챗GPT가 장식성을 더 가미하는 경향이 있었고요. 근데 둘 다 실험 3에서 가장 나은 결과를 냈어요. 확실한 차이였어요.

여기서 한 가지 재미있는 점. 실험 1에서 챗GPT는 클로드가 지정한 배경 컬러 #F4E8D0을 무시했는데, 실험 3에서는 전략 단계에서 컬러를 다시 정리하면서 이 부분이 반영됐어요. 전략을 텍스트로 세우는 과정이 일종의 셀프 체크 역할을 한 셈이죠.

프롬프트를 잘 쓰려면 결국 디자이너가 필요하다

"AI가 디자이너를 대체할 수 있을까?"라는 원래의 질문으로 돌아가면, 아직은 먼 얘기예요. 최적의 결과물을 내려면 그만큼 프롬프트를 상세하게 작성해야 하는데, 여기서 짚게 되는 부분이 결국 전문 디자이너의 감각과 지식으로 작성되는 부분이거든요. 비전문가가 "예쁘게 해주세요"라고 하면 나오는 결과와, 디자이너가 "무드는 미니멀 내추럴, 서체는 세리프 계열, 여백 비율 3:7"이라고 하면 나오는 결과가 다른 거예요. 근데 후자를 쓸 수 있는 건 디자이너뿐이잖아요. 묘한 역설이에요.

실험 결론은 세 가지로 정리돼요. 첫째, AI는 평균적인 시각 결과물을 생성할 수는 있지만, 디자인 판단의 맥락과 순서를 스스로 조직하지는 못해요. 둘째, 프롬프트 방식에 따라 결과물의 완성도에 차이가 나타났으며, 이를 정교화하는 과정에는 디자이너의 지식과 판단이 개입될 수밖에 없어요. 셋째 — 이게 핵심인데 — AI는 디자이너의 역할을 대체하는 게 아니라 디자이너의 작업 방식과 도구를 대체하는 형태에 가까워요.

이번 실험에서는 최대한 비전문가의 접근 상황을 가정했기 때문에 프롬프트나 결과물의 완성도가 높지 않았는데, 디자이너다운 사고방식을 상세히 제시하고 유도했을 때의 결과도 궁금하다고 해요. 그건 성격이 완전히 다른 실험이니 새로운 방법을 고민해 봐야겠다면서요.

도구가 바뀌는 거지, 판단하는 사람이 사라지는 건 아니에요. 그리고 그 판단을 가르치는 것도, 결국 사람의 몫이고요.