Midjourney V8, 이제 긴 프롬프트를 제대로 알아듣는다
![]()
Midjourney가 V8으로 업데이트됐어요. 아직 정식은 아니고 얼리 액세스 단계인데, 써보니까 V7이랑 체감 차이가 확실하더라고요. 특히 프롬프트 이해력. V7에서는 세밀한 묘사를 넣어도 무시당하는 경우가 많아서 여러 번 돌려야 했거든요.
V8에서는 다르더라고요. "눈이 하얗게 빛나는" 같은 디테일이 한 번에 반영돼요. CEO가 레딧에서 직접 답한 내용인데, 짧은 프롬프트보다 긴 프롬프트가 효과적이라고 했어요. 짧게 쓸 거면 개인화 설정이나 스타일 레퍼런스를 같이 써야 한다고요.

한글도 된다 — 근데 완벽하진 않다
따옴표로 지정한 글자를 함께 생성하는 능력이 좋아졌어요. 한글도 이전보다 잘 나와요. 근데 여전히 여러 번 돌려야 오타 없는 결과물을 받을 수 있어요. '화이팅'을 넣었는데 '화이탕'을 자꾸 만들어줘서 몇 번을 돌렸다는 후기가 있더라고요. (읽으면서 웃겼어요. AI가 한글을 완벽하게 처리하는 날은 아직 좀 멀었나 봐요.)

개인화, 스타일 레퍼런스, 무드보드 — 세 가지 스타일 제어
V8에서 주목할 건 스타일 제어의 정밀도가 올라갔다는 점이에요.
개인화 설정은 나의 취향을 모델에 학습시키는 방식인데, 수백 장의 이미지를 선택해야 하는 번거로움이 있어요. 스타일 레퍼런스는 Midjourney 내부에 학습된 스타일을 코드로 적용하는 거고, 무드보드는 가지고 있는 이미지를 업로드해서 스타일 참조로 쓰는 방식이에요. 개인화 설정을 적용하기 전과 후를 비교하면 결과물이 확연히 달라져요. 같은 프롬프트인데 스타일이 완전히 다른 이미지가 나오거든요.
영상 생성할 때 첫 프레임 이미지를 Midjourney에서 뽑는 사람들이 많은데, 타 모델은 스톡 이미지 느낌이 강한 반면 Midjourney는 시네마틱하고 유려한 이미지를 더 잘 뽑아내는 경향이 있어요.
이미지 생성 모델 상향 평준화 속에서 Midjourney의 자리
솔직히 요즘은 이미지 생성 모델이 상향 평준화됐어요. DALL-E, Stable Diffusion, Ideogram 다 쓸만하거든요. 근데 Midjourney를 계속 유료 구독하는 이유가 있어요. 같은 프롬프트를 넣어도 "느낌"이 달라요. 기술적으로 설명하기 어려운 건데, 스톡사진 vs 영화 스틸컷의 차이랄까요.
V8이 얼리 액세스라 아직 안정성에서 아쉬운 부분이 있을 수 있어요. 하지만 프롬프트 이해력 향상만으로도 업그레이드 가치는 충분해 보여요. 프롬프트 쓰는 법 자체가 언어 모델의 도움으로 쉬워지고 있으니, 진입장벽은 계속 낮아지겠죠.