Krea가 노드 워크플로우의 진입장벽을 에이전트로 부숴버렸다

헤드라인

AI 이미지 생성에는 두 갈래 길이 있었어요. 하나는 Midjourney처럼 텍스트 프롬프트를 넣으면 이미지가 나오는 길. 단순하고, 접근성이 좋죠. 다른 하나는 ComfyUI 같은 오픈소스 모델을 써서 커스텀 노드를 직접 짜고, 자기만의 워크플로우를 구축하는 길. 자유도는 비교할 수 없을 만큼 높은데, 대가가 있었어요. 고성능 GPU가 필요하고, 각 노드를 어떻게 연결해야 하는지 알아야 하고, 시행착오를 버텨야 하거든요.

그래서 노드 방식은 일종의 '지식의 해자'로 통했습니다. 할 줄 아는 사람과 모르는 사람의 격차가 꽤 컸고, 그 격차를 메우려면 상당한 시간이 필요했어요. (솔직히 진입장벽이라기보다 진입절벽에 가까웠죠.)

근데 그 해자가 하루아침에 메워졌어요. Krea가 에이전트를 도입했거든요.

텍스트 한 줄이 노드 10개를 대체한다

Krea가 공개한 기능은 이래요. 오른쪽 아래 작은 채팅창에 원하는 걸 자연어로 입력하면, 에이전트가 알아서 필요한 노드들을 생성하고 연결한 다음 이미지를 만들어줍니다. 사용자가 직접 노드를 하나하나 끌어다 놓고, 파라미터를 조정하고, 실행 순서를 배치하는 그 과정 전체를 에이전트가 대신 해주는 거예요.

이전에도 노드 방식이 Runway에 적용된 적은 있었어요. 하지만 그때도 노드를 설계하는 건 사람의 몫이었습니다. Krea는 그 마지막 단계까지 에이전트한테 넘겨버렸어요. "이런 이미지 만들어줘"라고 말하면 끝. 해당 에이전트 기능은 Pro, Max, Business 요금제 구독자에게 제공된다고 해요.

여기서 기능 소개는 끝이에요. 근데 이 뉴스레터의 저자가 던진 질문이 훨씬 날카롭더라고요.

"프론트"가 사라지면 뭘 클릭하죠?

에이전트가 노드를 자동으로 만들 수 있다면, 사용자가 노드 배치를 확인하는 화면은 왜 필요할까요? 한 발 더 나가면 — 에이전트에게 음성으로 지시하고, 모델의 결과물이 충분히 좋은 세상이 오면, 과정을 시각적으로 보여주는 '프론트엔드' 자체가 의미 있을까요?

좀 과격한 질문이에요. 근데 곱씹어보면 과격하지만은 않아요. 우리가 웹페이지와 버튼을 쓰는 이유는 기계에게 의도를 전달할 수단이 그것뿐이었기 때문이잖아요. 텍스트로 전달할 수 있고, 나아가 음성으로 전달할 수 있게 되면? 버튼은 과도기의 유물이 됩니다.

결국 병목 문제예요. AI와 인간이 협업할 때 가장 큰 병목은 의외로 '인간'이라는 거예요. 각 노드가 제대로 연결됐는지, 생성이 잘 되고 있는지 과정별로 인간이 확인하는 행위 자체가 속도를 늦추는 거죠. 더 빠른 속도와 효율이 요구될수록 인간의 감시 단계를 줄이는 방향으로 갈 수밖에 없어요.

농부 1명, 에이전트 100대

이 저자가 재밌는 비유를 하나 들었어요. 이미 자동화가 많이 진행된 농업에서는 한 사람이 거대한 농지를 경작할 수 있다고요. AI 에이전트 시대도 비슷한 풍경이 될 거라는 거예요.

1명의 사람 + 수많은 에이전트가 50개, 100개 영상 제작 프로젝트를 동시에 운영하는 모습. 각 에이전트가 노드를 짜고, 이미지를 만들고, 영상을 편집하는 동안 사람은 방향만 잡아주면 되는 거죠. 농사 비유가 꽤 적확합니다. (트랙터가 밭을 갈 때 농부가 고랑 하나하나 확인하진 않잖아요.)

그런데 이 비유에는 한 가지 불편한 진실이 숨어 있어요. 농업 자동화가 진행되면서 농부의 수가 줄었듯이, 에이전트가 크리에이티브 워크플로우를 대체하면 필요한 사람의 수도 줄어든다는 거예요. "1명이 100개 프로젝트를 돌린다"는 건 달리 말하면 "예전엔 100명이 필요했다"는 뜻이기도 하니까요.

"아직까지는"이라는 말을 지금 당장 버려야 하는 이유

이 글의 저자는 2023년부터 뉴스레터를 발행해왔다고 해요. 그리고 이렇게 시간이 없다고 느끼는 건 처음이라고 쓰더라고요.

지금 당장 인간이 버려야 할 단어는 "아직까지는"이라고요. "아직까지는 AI가 못 해", "아직까지는 사람이 필요해" — 이런 문장의 유통기한이 점점 짧아지고 있으니까요. 속도가 정말 빠릅니다. 지금 이런 기능이 공개됐다면, 공개하지 않은 건 뭘까? 라고 생각해야 한다고요.

음성으로 지시하는 세상, 프론트 없이 에이전트만 존재하는 세상. 추상적인 미래 이야기처럼 들리는데, Krea가 채팅창 하나로 노드 워크플로우를 대체한 걸 보면 추상적이라고만 할 수는 없어요.

저자는 학생들을 가르치는 입장이라 마음이 더 급해진 것인지도 모르겠다고 했는데요. 결론은 명확해요. 디자이너는 프론트가 없는 시대의 상호작용을 연구해야 하고, 음성으로 기계를 사용하는 방식의 UX를 탐구해야 하고, 학부생부터 관련 논문을 내기 시작해야 한다고요.

"파도에 대비를 해야 합니다." 이 문장이 뉴스레터 에디터의 위기감이 아니라 팩트에 가까워지고 있다는 게, 좀 무서운 부분이에요.