AI 도입했다 거둬들인 회사들 — 맥도날드·코카콜라가 부딪힌 같은 벽
맥도날드는 AI 주문을 3년 만에 멈췄고, 클라르나는 사람을 다시 뽑았습니다. 'AI를 대부분 접었다'는 기업이 1년 새 17%에서 42%로(S&P Global). 망신·철회로 끝난 11개 실제 사건에서 회사들이 부딪힌 같은 벽을 봅니다.
새로 들인 AI가 회사 망신의 주인공이 된다면 어떨까요. 드라이브스루에서 손님이 “아이스크림 하나요”라고 했는데 화면에 베이컨 얹은 아이스크림 수백 개가 찍힌다면. 고객센터 챗봇이 자기 회사를 “세계 최악”이라고 욕하는 시를 써서 트위터에 박제된다면. 실제로 일어난 일들입니다. 그것도 우리가 다 아는 큰 회사들에서요.
2024~2025년은 기업들이 AI를 앞다퉈 도입한 해이자, 그렇게 들인 AI를 조용히 거둬들인 해이기도 합니다. 흥미로운 건, 이들이 무너진 지점이 ‘AI가 멍청해서’가 아니었다는 것입니다. 대부분은 기술이 아니라 사람·신뢰·책임의 문제에서 부딪혔습니다.
편집팀은 이런 사건 11건을 골라 각각의 원 보도(로이터·CNN·BBC·CNBC 등)를 직접 찾아 교차 확인했습니다. 단순히 “AI가 사고 쳤다”가 아니라, 무엇을 맡겼다가 → 무엇이 터져서 → 어떻게 끝났는지를 따라가 보면 묘하게 비슷한 벽이 보입니다. 그 벽이 내 회사가, 혹은 내가 다니는 부서가 AI를 들일 때 피해야 할 지점입니다.
핵심 요약 (Key Takeaways)
- ‘기술 실패’보다 ‘신뢰 실패’가 많다. 맥도날드·뉴욕시 챗봇은 작동은 했지만 틀린 결과가 브랜드·법적 신뢰를 깎아 중단됐습니다.
- AI로 사람을 통째로 대체한 곳일수록 되돌렸다. 클라르나는 “직원 700명분”을 홍보했다가 사람을 다시 채용했습니다.
- AI가 ‘전면’에 선 순간 위험이 커진다. 고객 응대·기사·광고처럼 결과가 그대로 외부에 노출되는 자리가 가장 많이 터졌습니다.
- 숫자로도 흐름이 보인다. ‘AI를 대부분 접었다’는 기업이 1년 새 17% → 42%(S&P Global)로 늘었습니다.
- 공통 교훈은 ‘속도’가 아니라 ‘경계선’. 어디까지 맡기고 어디서 사람이 검수하는지를 정한 곳이 살아남았습니다.
한눈에 보기 — 11개 사건 표
각 사건의 결말은 완전 중단 / 사람으로 되돌림 / 도입은 유지하되 해명·축소로 나뉩니다. 이 구분이 중요합니다. 같은 ‘망신’이라도 회사가 실제로 발을 뺐는지는 다르니까요.
| 회사·기관 | 무엇을 AI에 맡겼나 | 무슨 일이 터졌나 | 결말 | 시점 |
|---|---|---|---|---|
| 맥도날드(미국) | 드라이브스루 음성 주문 | 베이컨 아이스크림 등 오주문 영상 바이럴 | 파트너십 종료·매장 철수 | 2024.06 |
| 클라르나 | 고객지원 챗봇 | 품질·만족도 저하 인정 | 사람 상담원 재채용 | 2025.05 |
| DPD(영국 배송) | 고객 응대 챗봇 | 욕설·자사 비판 시 작성 | 기능 즉시 비활성화 | 2024.01 |
| CNET | AI 금융 기사 | 77건 중 41건 정정 필요 | 기사 작성 일시 중단 | 2023.01 |
| 스포츠 일러스트레이티드 | AI 리뷰 기사·가짜 작성자 | 실존하지 않는 필자·AI 프로필 사진 | 기사 삭제·업체 계약 종료 | 2023.11 |
| 가넷(미 최대 신문체인) | 고교 스포츠 기사 | 미치환 코드 그대로 노출 | 전 지역 실험 중단 | 2023.08 |
| 리바이스 | 쇼핑몰 AI 모델 이미지 | ”사람 대신 AI” 비판 | 해명·축소 | 2023.03 |
| 코카콜라 | 크리스마스 광고 영상 | ”영혼 없다”는 역풍 | 도입 유지·옹호 | 2024.11 |
| 윌리 웡카 체험전(글래스고) | AI 홍보 이미지·대본 | 실제는 휑한 창고, 경찰 출동 | 행사 취소·환불 | 2024.02 |
| 뉴욕시 ‘MyCity’ 챗봇 | 공공 행정 안내 | 위법한 조언을 자신 있게 제공 | 논란 후 종료 수순 | 2024.03 |
| 스캐터랩 ‘이루다’(한국) | 대화형 챗봇 | 차별 발언·개인정보 논란 | 서비스 잠정 중단 | 2021.01 |
이제 이 사건들을 무엇을 맡겼는가로 묶어 보겠습니다. 네 가지 유형이 나옵니다.
유형 1 — 고객 응대를 통째로 맡겼다가
가장 흔하고, 가장 빨리 들통난 유형입니다. 고객을 직접 상대하는 자리는 실수가 곧바로 외부에 노출되니까요.
맥도날드 — 3년 실험의 끝. 맥도날드는 2021년부터 IBM과 함께 미국 100여 개 매장에서 AI 음성 자동주문을 시험했습니다. 그런데 “맥너겟 수백 개”, “베이컨 얹은 아이스크림” 같은 오주문 장면이 SNS에서 퍼지며 웃음거리가 됐죠. 2024년 6월 17일 맥도날드는 IBM과의 파트너십 종료를 발표했습니다(내부 메모상으로는 7월 말까지 매장에서 기술을 제거하기로 한 것으로 보도됐습니다 — CBS·CNBC). 흥미롭게도 맥도날드는 AI를 완전히 포기한 게 아니라, 이후 구글과 새 협업으로 방향을 틀었습니다. 즉 “이 방식은 아니다”였지 “AI는 아니다”가 아니었던 셈입니다.
클라르나 — “700명분”에서 다시 사람으로. 핀테크 클라르나는 2024년 OpenAI 기반 AI 어시스턴트가 “상담원 700명분의 일을 한다”고 대대적으로 홍보했습니다. 그런데 2025년 들어 CEO가 직접 “효율과 비용에만 집중하다 품질이 떨어졌다”며 사람 상담원 재채용으로 선회했습니다(Fortune, 2025.05). 다만 ‘700명 대체’는 회사가 내세운 홍보 수치이고 실제 인원 감소의 상당 부분은 자연 감원이었다는 점은 구분해 둘 필요가 있습니다. 일을 줄이려던 자동화가 오히려 새 부담을 만든 구조는, AI가 일을 줄여준다더니 왜 더 바빠졌을까에서 본 ‘워크슬롭’과 닮아 있습니다.
DPD — 챗봇이 자기 회사를 욕하다. 2024년 1월, 영국 배송사 DPD의 AI 챗봇은 한 고객의 유도에 따라 욕설을 하고 “DPD는 세계 최악의 배송사”라는 조롱 시까지 썼습니다. 트윗이 바이럴되자 DPD는 “업데이트 후 오류”라며 AI 기능을 즉시 껐죠. 사람 상담원이라면 절대 하지 않을 말을, AI는 누군가 살짝 부추기자 거리낌 없이 했습니다.
여기서 보이는 벽: 고객 응대는 ‘대부분 맞으면 되는’ 일이 아닙니다. 단 한 번의 황당한 결과가 박제되고 퍼집니다. 평균 정확도가 아니라 ‘최악의 한 번’이 브랜드를 정의합니다.
유형 2 — 글을 AI에게 쓰게 했다가
다음은 콘텐츠입니다. 언론사들이 비용 절감을 노리고 AI에 기사를 맡겼다가 신뢰를 잃은 사례가 줄을 이었습니다.
CNET — 41건을 정정하다. IT 매체 CNET은 2022년 11월부터 “CNET Money Staff” 명의로 AI가 쓴 금융 설명 기사 77건을 조용히 올렸습니다. 그런데 외부 보도로 알려진 뒤 자체 감사 결과 41건(약 53%)에 정정이 필요했습니다(Washington Post·CNN, 2023.01). 복리를 설명한 기사 한 건에서만 여러 개의 오류가 나왔죠. 돈을 다루는 글에서 절반이 틀렸다는 건 치명적이었습니다.
스포츠 일러스트레이티드 — 존재하지 않는 기자. 2023년 11월, SI가 실존하지 않는 작성자명과 AI로 만든 프로필 사진으로 제품 리뷰를 게재한 정황이 드러났습니다(CNN·NPR). SI 측은 외부 업체가 납품한 콘텐츠라며 기사를 삭제하고 계약을 종료했지만, 모회사 CEO가 이후 해임되는 등 파장이 컸습니다.
가넷 — 코드가 그대로 실리다. 미국 최대 신문 체인 가넷은 AI 도구로 만든 고교 스포츠 기사에 [[WINNING_TEAM_MASCOT]] 같은 미치환 코드가 그대로 노출되며 조롱당했습니다(CNN, 2023.08). 여러 지역지에서 같은 문제가 터지자 가넷은 전 지역에서 실험을 중단했습니다.
여기서 보이는 벽: 정보 콘텐츠에서 AI의 적은 ‘거짓말’만이 아닙니다. 가넷처럼 ‘검수 없이 발행하는 프로세스’ 자체가 문제였습니다. AI가 틀릴 수 있다는 전제 위에서 사람이 한 번 거르는 단계가 빠지면, 작은 오류도 그대로 독자 앞에 도착합니다.
유형 3 — 사람 대신 AI 이미지·영상을 내세웠다가
세 번째는 ‘사람의 자리’를 AI로 채웠다가 정서적 역풍을 맞은 유형입니다. 여기서는 사실 오류가 없어도 비판이 나왔습니다.
리바이스 — ‘다양성’이라는 해명. 2023년 3월, 리바이스는 온라인 쇼핑에서 “다양성을 늘리기 위해” AI 생성 모델을 시범 도입한다고 발표했다가 “진짜 모델을 쓰면 될 일”이라는 비판을 받았습니다(NBC News). 곧 “이 시범은 다양성 목표를 진전시키는 수단이 아니다”라며 물러섰습니다. 완전 철회는 아니었지만, 의도와 정반대의 메시지로 읽힌 사례입니다.
코카콜라 — 오류 없이도 욕먹다. 2024년 11월, 코카콜라가 1995년의 명작 “Holidays Are Coming” 광고를 생성형 AI로 리메이크하자 “영혼이 없다”, “AI 슬롭”이라는 반응이 쏟아졌습니다(NBC News·Adweek). 코카콜라는 광고를 내리지 않고 “신기술을 실험하는 여정”이라며 옹호했지만, 2025년 재시도에서도 비슷한 비판이 반복됐습니다. AI 생성물이 일상에 넘치며 생긴 피로감은 AI 슬롭, 한국에도 밀려온다에서 다룬 흐름과 같은 결입니다.
윌리 웡카 체험전 — 밈이 된 참사. 2024년 2월 글래스고에서, AI로 만든 환상적인 이미지로 티켓을 판 ‘윌리 웡카’ 체험 행사가 실제로는 휑한 창고에 소품 몇 개뿐이었던 사실이 드러났습니다. 분노한 부모들의 신고로 경찰이 출동했고 행사는 중도 취소됐죠. 한 배우는 대본이 “AI가 만든 15쪽짜리 횡설수설”이었다고 폭로했습니다(Poynter). 대기업 사례는 아니지만, ‘AI가 만든 그림 = 실제’라고 과신하면 어떤 일이 벌어지는지 보여 준 상징적 장면이었습니다.
여기서 보이는 벽: 이 유형은 ‘맞고 틀림’의 문제가 아니라 ‘진정성’의 문제입니다. 사람이 있어야 할 자리(모델·창작·약속)를 AI로 채우면, 결과물이 완벽해도 “성의가 없다”는 반응이 따라옵니다.
유형 4 — 공공·법적 책임이 걸린 자리
마지막은 가장 무거운 유형입니다. 틀린 답이 곧 법 위반이나 인권 침해가 되는 자리에 AI를 둔 경우입니다.
뉴욕시 ‘MyCity’ 챗봇 — 위법을 권하다. 뉴욕시가 2023년 출시한 공공 챗봇이, 탐사보도 매체 검증에서 “사장이 종업원 팁을 가져가도 된다”, “현금 결제를 거부해도 된다” 같은 명백히 위법한 조언을 자신 있게 내놓았습니다(The Markup, 2024.03). 문장은 매끄러웠지만 내용이 틀렸다는 점이 더 위험했습니다 — 시민이 그대로 믿으면 법을 어기게 되니까요.
이루다(한국) — 윤리와 개인정보의 분기점. 2020년 12월 출시된 스캐터랩의 챗봇 ‘이루다’는 2주 만에 40만 명을 모았지만, 여성·성소수자·장애인 등에 대한 차별 발언과 학습 데이터의 개인정보 처리 논란이 불거졌습니다. 개인정보보호위원회 조사가 시작된 직후인 2021년 1월 12일 서비스가 잠정 중단됐습니다(한국일보·AI타임스). 이 사건은 이후 국내에서 AI 학습 데이터의 동의·비식별화 기준을 다시 보게 한 계기가 됐습니다.
여기서 보이는 벽: 책임이 사람에게 귀속되는 일(법률 조언·행정·개인정보)에서 AI의 ‘자신 있는 말투’는 오히려 독입니다. 틀린 답을 머뭇거리지 않고 내놓기 때문에, 받는 사람이 의심할 기회조차 사라집니다.
숫자로 보는 흐름 — ‘접는’ 기업이 늘고 있다
개별 사건만 보면 운 나쁜 해프닝처럼 보일 수 있습니다. 하지만 통계는 더 넓은 흐름을 보여 줍니다. S&P Global Market Intelligence가 북미·유럽 기업 1,000여 곳을 조사한 결과, “AI 이니셔티브의 대부분을 폐기했다”고 답한 기업이 2024년 17%에서 2025년 42%로 크게 늘었습니다.
같은 조사에서 평균적인 조직은 개념검증(PoC)의 약 46%를 양산 전에 폐기하는 것으로 나타났습니다. 가트너도 2025년 말까지 생성형 AI 프로젝트의 30% 이상이 PoC 후 폐기될 것으로 내다봤는데, 이는 실측이 아니라 예측치라는 점은 감안해야 합니다. (“AI 프로젝트 80%가 실패한다” 같은 수치도 떠돌지만, 출처와 정의가 제각각이라 단정해 인용하기 어렵습니다.)
여기서 한 가지는 분명합니다. AI 도입이 늘어난 만큼, ‘기대만큼 안 돼서 접는’ 경험도 빠르게 쌓이고 있다는 것입니다. 이 흐름은 AI 거품일까 실체일까에서 본 ‘투자와 실제 성과의 간극’과도 맞닿아 있습니다.
그래서, 공통의 벽은 무엇이었나
11개 사건과 통계를 겹쳐 놓으면 세 가지 패턴이 반복됩니다.
- ‘평균’이 아니라 ‘최악의 한 번’이 결정했다. 맥도날드 AI는 대부분의 주문을 제대로 처리했을 겁니다. 하지만 사람들의 기억에 남은 건 베이컨 아이스크림 한 장면이었습니다. 고객·독자·시민을 직접 마주하는 자리일수록, 평균 성능보다 가장 나쁜 결과가 평판을 만듭니다.
- 사람을 ‘치우는’ 도입은 되돌아왔고, 사람을 ‘돕는’ 도입은 남았다. 클라르나는 사람을 대체했다가 되돌렸고, 맥도날드는 전면 자동화를 접고 보조 도구로 방향을 틀었습니다. 검수하는 사람을 없앤 자리(가넷·CNET)에서 사고가 났습니다.
- AI의 ‘자신감’이 책임 있는 자리에선 약점이 됐다. 뉴욕시 챗봇과 이루다는 틀린 내용을 머뭇거림 없이 내놨습니다. 결과가 곧 법·윤리 문제가 되는 자리에서, 매끄러운 말투는 오히려 의심을 지웠습니다.
요컨대 무너진 건 ‘AI 성능’이 아니라 ‘AI를 어디에 어떻게 두었는가’라는 설계였습니다.
내 회사·내 부서가 AI를 들일 때 — 체크리스트
이 사건들을 남의 일로만 둘 필요는 없습니다. 작은 팀이 업무 자동화를 검토할 때도 같은 질문이 유효합니다.
- 이 자리는 ‘최악의 한 번’이 치명적인가? 고객 응대·대외 공개물이라면, 평균 정확도가 아무리 높아도 사람이 최종 검수하는 단계를 남기세요.
- AI가 틀렸을 때 누가 책임지는가? 법·돈·개인정보가 걸린 일이라면, AI는 초안까지만. 결정과 발신은 사람이 합니다.
- 사람을 ‘없애는’ 그림인가, ‘돕는’ 그림인가? 인력 대체를 KPI로 잡으면 클라르나의 길을 갑니다. ‘사람 1명이 3배 일하게’를 목표로 잡는 편이 안전합니다.
- 결과물이 그대로 외부로 나가는가? 기사·광고·게시물처럼 검수 없이 발행되는 파이프라인이라면, 발행 전 사람 확인 게이트를 반드시 두세요(가넷의 교훈).
- ‘진정성’이 중요한 자리인가? 창작·약속·고객과의 정서적 접점은 효율보다 신뢰가 먼저입니다. 여기서 AI를 전면에 세우면 코카콜라처럼 “성의 없다”는 역풍이 옵니다.
AI 도입 자체가 틀린 선택이라는 이야기가 아닙니다. 오히려 이 실패들은 AI를 어디까지 맡기고 어디서 사람이 지켜야 하는지, 그 경계선을 비싼 수업료로 알려 준 사례에 가깝습니다. 빨리 들이는 것보다, 경계선을 먼저 긋는 쪽이 결국 멀리 갑니다.
자주 묻는 질문
Q. AI 도입이 실패한 진짜 이유는 기술이 부족해서인가요? 대부분은 기술이 틀려서가 아니라 사람·신뢰·책임 문제 때문입니다. 맥도날드 AI는 주문을 못 알아들어서가 아니라 틀린 주문이 웃음거리가 되며 신뢰를 깎았고, 뉴욕시 챗봇은 멀쩡한 문장으로 위법한 조언을 했습니다. ‘작동하느냐’보다 ‘믿고 맡길 수 있느냐’에서 무너진 경우가 많습니다.
Q. 그럼 기업은 AI를 도입하면 안 되나요? 그건 아닙니다. 실패의 공통점은 ‘AI 자체’가 아니라 ‘사람 없이 전면에 내세운 방식’입니다. 살아남은 도입은 대체로 AI를 뒤에서 돕는 도구로 쓰고 최종 판단·고객 응대엔 사람을 남긴 경우입니다. 핵심은 속도가 아니라 경계선입니다.
Q. AI 프로젝트를 접는 기업이 정말 늘고 있나요? 네. S&P Global 조사에서 ‘AI 이니셔티브의 대부분을 폐기했다’는 비율이 2024년 17%에서 2025년 42%로 늘었습니다. 가트너는 2025년 말까지 생성형 AI 프로젝트의 30% 이상이 PoC 후 폐기될 것으로 전망했습니다(예측치).
Q. AI가 쓴 기사나 광고는 왜 그렇게 비판받았나요? 사실 오류와 ‘영혼 없음’ 두 가지입니다. CNET은 AI 기사 77건 중 41건을 정정해야 했고, 가넷은 미치환 코드가 그대로 실렸습니다. 코카콜라 광고는 오류는 없었지만 ‘감정이 없다’는 반응이 컸습니다. 신뢰성과 정서, 둘 중 하나만 무너져도 역풍이 옵니다.
Q. 한국에도 비슷한 사례가 있나요? 있습니다. 2021년 1월 스캐터랩의 챗봇 ‘이루다’가 차별 발언·개인정보 논란으로 출시 2주 만에 잠정 중단됐습니다. 개인정보보호위원회 조사로 이어졌고, 국내 AI 데이터 처리 기준을 다시 보게 한 분기점이 됐습니다.
참고 자료
- CBS News. McDonald’s ends AI drive-thru ordering test (IBM 파트너십 종료). 2024-06-17. 2026-06-20 확인. 자료 보기
- CNBC. McDonald’s to end IBM AI drive-thru test. 2024-06-17. 2026-06-20 확인. 자료 보기
- Fortune. Klarna, AI 대신 사람으로 선회 (CEO 품질 저하 시인). 2025-05-09. 2026-06-20 확인. 자료 보기
- Fox Business. DPD AI chatbot swears, calls itself worst delivery service. 2024-01. 2026-06-20 확인. 자료 보기
- The Washington Post. CNET, AI 기사 정정 사태 (77건 중 41건). 2023-01-17. 2026-06-20 확인. 자료 보기
- CNN Business. Sports Illustrated, 가짜 작성자·AI 프로필 기사 삭제. 2023-11-27. 2026-06-20 확인. 자료 보기
- CNN Business. Gannett, AI 고교 스포츠 기사 실험 중단. 2023-08-30. 2026-06-20 확인. 자료 보기
- NBC News. Levi’s, AI 모델 도입 백래시. 2023-03. 2026-06-20 확인. 자료 보기
- NBC News. Coca-Cola, AI 크리스마스 광고 논란. 2024-11. 2026-06-20 확인. 자료 보기
- Poynter. Willy’s Chocolate Experience(글래스고) AI 마케팅 참사. 2024-02. 2026-06-20 확인. 자료 보기
- The Markup. 뉴욕시 MyCity 챗봇, 위법한 조언 제공. 2024-03-29. 2026-06-20 확인. 자료 보기
- 한국일보. AI 챗봇 ‘이루다’ 서비스 잠정 중단. 2021-01-12. 2026-06-20 확인. 자료 보기
- CIO Dive. S&P Global, AI 이니셔티브 폐기율 17%→42%. 2025-03. 2026-06-20 확인. 자료 보기
- Gartner. 2025년 말까지 생성형 AI 프로젝트 30%+ PoC 후 폐기 전망(예측치). 2024-07-29. 2026-06-20 확인. 자료 보기
고지
- AI 작성 보조: 본 글의 초안과 자료 정리는 AI 도구의 보조를 받았으며, 최종 편집·사실 확인·관점 결정은 운영자가 수행했습니다.
- 정보 기준 시점: 사건 경위·통계는 2026년 6월 기준 공개 보도를 바탕으로 하며, 일부 수치(기업 자체 홍보·내부 메모 기반)는 본문에 출처를 함께 표기했습니다.