81,000명이 AI에 바란 건 '생산성'이 아니라 '화요일 저녁 엄마랑 요리'였다

"AI가 마법 지팡이처럼 뭐든 해줄 수 있다면, 뭘 원하세요?" 81,000명한테 이 질문을 던졌어요. 159개국, 70개 언어. 역대 최대 규모의 다국어 정성 연구라고 합니다. Anthropic이 자사 AI 인터뷰어를 동원해서 1주일 만에 수집한 데이터예요.

1위는 예상대로 "전문적 탁월함"(18.8%)이었어요. 루틴 업무는 AI한테 맡기고 전략적 사고에 집중하겠다는 거죠. 놀랍지도 않은 결과. 근데 여기서 끝났으면 그냥 또 하나의 설문조사였을 거예요. Anthropic의 AI 인터뷰어가 한 걸음 더 들어갔거든요. "그래서 그게 실현되면 뭘 하고 싶은데요?"

답이 바뀌었어요.

"생산성 30% 향상"은 기능이고, "엄마랑 요리"가 성과다

콜롬비아의 한 사무직 응답자는 이렇게 말했어요. AI 덕분에 업무를 효율적으로 처리하게 됐고, 지난 화요일에는 일을 마무리하는 대신 어머니와 함께 요리를 했다고요. 일본의 프리랜서는 클라이언트 문제에 쓰는 두뇌 에너지를 줄여서 책을 더 읽고 싶다고 했고요.

처음에 나온 답변들을 숫자로 볼게요. 전문적 탁월함 18.8%, 개인적 변화 13.7%, 삶 관리 13.5%, 시간 자유 11.1%, 재정 독립 9.7%, 사회 변화 9.4%, 창업 8.7%, 학습과 성장 8.4%, 창작 표현 5.6%. 겉보기엔 생산성이 1위잖아요. 근데 후속 질문을 던지자 구조가 완전히 뒤집혔어요.

전체 응답을 재구성하면 이래요. 약 3분의 1은 AI로 삶의 여유를 만들고 싶어했어요 — 시간, 돈, 인지적 여유. 4분의 1은 더 의미 있는 일을 하고 싶었고요. (일에서 도망치는 게 아니라, 일의 질을 높이는 거예요.) 5분의 1은 더 나은 사람이 되고 싶었어요 — 배우고, 치유하고, 성장하는 것. 나머지는 뭔가를 만들거나 세상을 고치고 싶어했고요.

GTM 전략 관점에서 보면 전형적인 "표면 니즈와 심층 니즈의 괴리"예요. 고객한테 "뭐가 필요하세요?" 하면 기능을 말하거든요. "왜 그게 필요한데요?"라고 세 번쯤 파고들어야 진짜 욕구가 나와요. AI 기업들이 "생산성 30% 향상"을 마케팅 메시지로 쓰고 있는데, 정작 사용자들이 그 30%로 하고 싶은 건 가족과 저녁을 먹는 거였다는 거예요. 기능과 성과의 간극. 여기서 다음 마케팅 전쟁이 갈릴 수 있어요.

같은 사람이 AI를 사랑하면서 두려워한다

이 연구에서 가장 날카로운 발견은 따로 있었어요. 희망과 불안이 서로 다른 진영에 있는 게 아니라, 한 사람 안에서 공존한다는 사실. 연구팀은 이걸 "빛과 그림자(Light and Shade)"라고 불렀더라고요. 다섯 가지 핵심 긴장이 반복적으로 나타났어요.

학습 vs 인지 퇴화. 응답자의 33%가 AI의 학습 효과를 언급했어요. 동시에 17%는 AI에 의존하면서 스스로 생각하는 능력을 잃고 있다고 걱정했고요. 한국의 한 응답자가 한 말이 꽤 아팠어요 — AI가 준 답으로 좋은 성적을 받았지만, 실제로 배운 건 아무것도 없었다고요. 그때 가장 큰 자책감을 느꼈다고. 교육자 집단에서 인지 퇴화를 직접 목격했다는 비율은 평균의 2.5~3배였어요. 학생들한테서 그 변화를 눈앞에서 보고 있는 거겠죠.

의사결정 향상 vs 신뢰성 문제. 이건 다섯 가지 긴장 중 유일하게 부정적 측면이 긍정을 압도한 항목이에요. 22%가 AI 덕분에 더 나은 판단을 내리게 됐다고 했는데, 37%는 AI의 불안정한 신뢰성이 오히려 좋은 판단을 방해한다고 답했거든요. 양쪽 모두 직접 경험에 뿌리를 두고 있었어요 — 혜택 언급자의 88%, 피해 언급자의 79%가 실제로 겪은 일이었다는 거예요. 법률·금융·의료 같은 고위험 직종에서 이 긴장은 평균의 거의 2배로 나타났고요. 변호사 집단은 절반 가까이가 신뢰성 문제를 직접 경험했다고 답했는데, 동시에 의사결정 혜택을 가장 많이 보고한 집단이기도 했어요. AI의 판단에 기대면서, 동시에 그 판단에 데이는 거예요. 솔직히 좀 무서운 얘기예요.

시간 절약 vs 환상적 생산성. 응답자의 절반(50%)이 시간 절약 효과를 언급했어요. 가장 많이 나온 혜택이죠. 근데 18%는 오히려 기대치가 올라가면서 더 바빠졌다고 했어요. 프랑스의 한 프리랜서 개발자 표현이 인상적이었거든요 — "일하는 시간 대비 쉬는 시간의 비율은 전혀 바뀌지 않았다, 같은 자리에 있으려고 더 빨리 달려야 하는 것뿐." 붉은 여왕 효과의 AI 버전이에요. 《거울 나라의 앨리스》에서 붉은 여왕이 "같은 자리에 있으려면 계속 뛰어야 한다"고 했잖아요. 기술이 발전해도 기대치가 함께 올라가서 체감 여유가 안 변하는 현상이죠.

감정적 지지 vs 감정적 의존. 비율은 작지만(16% 대 12%) 가장 강하게 얽혀 있는 긴장이었어요. AI한테 감정적 지지를 받는다고 답한 사람은, 동시에 AI에 감정적으로 의존하게 될까 봐 걱정할 확률이 3배 높았거든요. 한 미국 대학원생은 파트너에게도 말하지 못하는 것들을 Claude에게 이야기하고 있었다고 고백했어요. 감정적 외도를 하는 것 같았다고. (읽다가 멈칫했어요.)

경제적 역량 강화 vs 경제적 대체. 28%가 AI를 통한 경제적 기회를 언급했고, 18%는 일자리 대체를 우려했어요. 프리랜서 크리에이터 그룹이 가장 극단적인 위치에 있었는데, 실질적 혜택(23%)과 실질적 위협(17%)이 거의 비등했거든요. 도구이면서 경쟁자. 한 사람의 삶에 이 두 가지가 동시에 존재한다는 거예요.

우려 항목 전체 순위도 짚어볼게요. 1위는 신뢰성 문제(26.7%). 환각, 부정확한 인용, 검증 부하. 그 다음이 고용·경제(22.3%), 자율성·주체성(21.9%), 인지 퇴화(16.3%). 고용·경제 우려가 AI에 대한 전반적 태도를 가장 강하게 예측하는 변수였어요. 다른 어떤 이슈보다 이 문제가 사람들의 AI 감정 온도를 좌우했다는 뜻이에요.

1주일에 81,000명 — AI가 인터뷰어가 되면 뭐가 달라지나

잠깐 딴 얘기인데, 연구 결과만큼이나 연구 방법 자체가 흥미로웠어요.

이 연구에서 AI(Claude)가 인터뷰어 역할을 했거든요. 정해진 기본 질문을 하되, 응답에 따라 후속 질문을 적응적으로 생성한 거예요. 수집된 응답은 역시 Claude 기반 분류기가 다차원으로 코딩했고요 — 원하는 것, 경험 여부, 우려, 직업, 전반적 태도 등으로요.

기존 정성 연구의 최대 규모와 비교하면 의미가 더 선명해져요. USC Shoah Foundation의 홀로코스트 증언 아카이브가 약 52,000건인데, 1994년부터 1999년까지 5년에 걸쳐 모은 거예요. 세계은행의 "Voices of the Poor" 프로젝트가 60개국 약 60,000명인데, 이것도 1990년대 전반에 걸친 장기 프로젝트였고요. 이번 연구는 80,508명, 159개국, 70개 언어를 1주일 만에 수집했어요.

5년 걸리던 규모를 1주일에. 정성 연구는 전통적으로 깊이와 규모 사이에 트레이드오프가 있었잖아요. 깊이 있는 인터뷰를 하려면 소수만 할 수 있고, 대규모로 하려면 선택지를 줄인 설문조사로 갈 수밖에 없었죠. AI 인터뷰어가 이 트레이드오프를 무너뜨릴 수 있다는 가능성을 보여준 셈이에요.

편향을 인정하면서도 연구를 했다는 태도

물론 한계는 분명해요. Anthropic이 직접 명시했거든요.

첫째, 표본 편향. 이 사람들은 이미 Claude를 쓰고 있는 활성 사용자예요. AI에 충분한 가치를 느끼고 있어서 계속 쓰고 있는 사람들이죠. 둘째, 질문 순서 편향. 인터뷰가 긍정적 비전을 먼저 물어보고 우려를 나중에 물었어요. 이 순서가 응답에 영향을 미쳤을 가능성이 있고요. 셋째, AI가 질문을 생성하고 응답을 분류하는 과정에서 어떤 편향이 들어갔는지에 대한 별도 검증이 필요해요. 분류기가 놓친 뉘앙스, 문화적 맥락에 따른 해석 차이 같은 것들이요.

그럼에도 "그래서 안 하는 것"이 아니라, 한계를 공개하면서 진행했어요. 솔직히 이 태도가 결과만큼이나 중요하다고 봐요. 데이터 분석에서 가장 위험한 건 "편향이 없다고 주장하는 것"이니까요. 편향이 있다고 인정하면서 결과를 내놓는 게 훨씬 정직한 연구 태도잖아요.

여담이지만, 한국 응답자의 목소리가 몇 번 인용됐는데 하나같이 인상적이었어요. "인류는 자기보다 똑똑한 것을 다뤄본 적이 없다"고 말한 소프트웨어 엔지니어, AI가 준 답으로 좋은 성적은 받았지만 아무것도 배우지 못했다고 고백한 학생. 기술 수용도가 높은 한국 사회에서 기술에 대한 성찰의 깊이도 함께 높아지고 있다는 신호 아닐까요.

결국 이 연구가 말하는 건 두 가지예요. 사람들이 AI한테 원하는 건 "더 빠른 업무"가 아니라 "더 나은 삶"이었다는 것. 그리고 AI를 가장 잘 활용하는 사람이 AI를 가장 깊이 걱정하고 있다는 것. 이 두 사실이 동시에 참이라는 게, 솔직히 좀 불편하면서도 안심이 돼요.