AI가 그럴듯한 거짓말을 할 때: 환각을 줄이는 프롬프트 습관 5가지
AI가 자신 있게 틀릴 때 문제는 답변의 말투가 아니라 검증 구조입니다. 모른다고 말하게 하고, 출처를 요구하고, 자료 안에서만 답하게 만드는 프롬프트 습관을 정리했습니다.
AI에게 뭔가 물었더니, 존재하지 않는 논문이나 없는 법 조항, 가짜 통계를 너무도 자연스럽게 답한 적 있으실 겁니다. 말투는 자신만만한데 내용은 틀린 그 답변 말입니다. 이런 현상을 AI 환각(hallucination)이라고 부릅니다.
그리고 의외의 사실이 하나 있습니다. 이건 최신 AI에서도 완전히 사라지지 않았고, 앞으로도 쉽게 사라지지 않습니다. 다만 우리가 손쓸 수 있는 부분이 분명히 있습니다. 같은 질문이라도 어떻게 묶어서 던지느냐에 따라 환각은 줄어듭니다. 이 글은 그 차이를 대충 질문과 제대로 묶은 질문으로 직접 비교해 보여주고, 그대로 복사해 쓸 수 있는 프롬프트 다섯 개를 정리합니다.
왜 AI는 그럴듯한 거짓말을 할까?
핵심부터 말하면, AI는 정답을 찾아오는 기계라기보다 그럴듯한 다음 말을 이어가는 시스템에 가깝습니다. 우리가 질문하면 AI는 질문 뒤에 올 법한 단어와 문장을 확률적으로 이어 붙입니다. 대부분의 경우 그 그럴듯함이 사실과 맞아떨어집니다. 문제는 맞지 않을 때입니다. 그래도 AI는 멈추지 않고, 똑같이 자신 있는 말투로 이어 갑니다.
OpenAI가 2025년 9월 공개한 글과 논문은 언어 모델의 환각을 표준 학습·평가 방식과 연결해 설명했습니다. 핵심은 불확실성을 인정하는 답보다 일단 맞힐 가능성이 있는 답을 내는 쪽이 평가에서 유리해질 수 있다는 점입니다. 비유하자면 시험을 떠올리면 쉽습니다. 모르는 문제를 비워두면 0점이지만, 찍으면 맞을 확률이라도 생깁니다. 그래서 학생은 찍습니다. AI도 비슷한 방향으로 행동할 수 있습니다.
여기서 우리가 할 일이 분명해집니다. AI가 추측을 하도록 두면, 우리는 질문할 때 추측하지 말라는 조건을 직접 걸어주면 됩니다. 아래 다섯 가지가 그 방법입니다.
환각이 진짜 문제가 된 순간들
추상적으로 들릴 수 있으니, 실제로 돈과 신뢰가 걸렸던 사례부터 보겠습니다.
가장 유명한 건 2023년 미국의 한 항공사 소송입니다. 변호사들이 ChatGPT가 만들어준 판례들을 법원에 제출했는데, 그 판례들은 존재하지 않는 가짜였습니다. 관련 분석에 따르면 법원은 이들에게 5,000달러의 제재금을 부과했습니다. 한 번의 해프닝으로 끝나지 않았습니다. 2025년 9월에는 캘리포니아 항소법원이 한 변호사에게 1만 달러의 벌금을 매겼습니다. 보도에 따르면 그가 제출한 인용문 23개 중 21개가 ChatGPT가 지어낸 것이었습니다.
한국도 이 문제를 가볍게 보지 않습니다. 한국지능정보사회진흥원(NIA)은 2026년 1월 AI 환각을 다룬 정책 보고서를 발표했습니다. KDI 경제교육·정보센터에 게재된 요약은 이 보고서가 AI 환각을 신뢰성을 저해하는 위험 요소이자 관리해야 할 정책 대상으로 다뤘다고 설명합니다. 법정과 병원처럼 정확성이 생명인 분야일수록 환각의 비용은 커집니다.
META TOUR의 관점: 환각의 진짜 위험은 틀린다는 사실 자체가 아니라, 자신 있게 틀린다는 데 있습니다. 우물쭈물 틀려주면 우리가 의심이라도 하는데, AI는 가짜 판례조차 진짜처럼 또박또박 적어냅니다. 그래서 환각 대응의 핵심은 AI가 모를 때 모른다고 말하게 만드는 것입니다.
습관 1. 모르면 모른다고 해라고 못 박기
가장 간단하면서 효과가 큰 습관입니다. AI는 빈칸을 싫어합니다. 그러니 모르면 차라리 비워두라고 미리 허락해 줘야 합니다.
대충 질문
조선시대 거북선은 정확히 몇 척이 만들어졌어?
그대로 나온 답 예시
총 6척이 건조되었습니다.
왜 위험한가: 숫자가 딱 떨어지지만, 거북선 건조 척수는 사료마다 기록이 갈려 단일 숫자로 확정하기 어려운 사안으로 알려져 있습니다. AI는 그런 불확실함을 지운 채 하나의 숫자를 자신 있게 제시할 수 있습니다.
제대로 묶은 질문
조선시대 거북선은 정확히 몇 척이 만들어졌어?
확실하지 않으면 추측하지 말고 "확실하지 않다"고 답하고,
무엇이 불확실한지 알려줘.
달라진 답 예시
정확한 수는 사료마다 기록이 갈려 확정하기 어렵습니다. 임진왜란 당시 소수가 운용된 것으로 전해지나, 총 건조 척수는 불확실합니다.
한 줄 정리: 모르면 모른다고 해 한 문장이 환각의 가장 흔한 출구를 막습니다. OpenAI의 2025년 환각 글도 불확실성을 인정하는 답이 평가에서 보상받아야 한다는 방향을 강조합니다.
복붙용 프롬프트
확실하지 않은 내용은 추측하지 마.
근거가 부족하면 "확실하지 않음"이라고 표시하고,
무엇이 불확실한지 따로 설명해줘.
습관 2. 출처와 기준 시점을 함께 요구하기
숫자나 사실을 물을 때는 근거도 같이 내놓으라고 요구하세요. 출처를 붙이라고 하면, AI 답변을 사람이 확인할 수 있는 형태로 바꿀 수 있습니다. 근거를 못 대는 답은 그대로 믿지 않고 확인 필요로 분리하면 됩니다.
대충 질문
2026년 전기차 보조금 얼마야?
그대로 나온 답 예시
2026년 전기차 국고 보조금은 최대 650만 원입니다.
왜 위험한가: 그럴듯한 숫자지만 어느 자료에서 왔는지, 언제 기준인지 알 수 없습니다. 정책 금액은 해마다 바뀌고 차종·지자체별로도 달라질 수 있습니다.
제대로 묶은 질문
2026년 전기차 보조금이 궁금해.
출처와 기준 시점을 함께 밝히고,
확실한 근거를 댈 수 없으면 "확인 필요"라고만 답해줘.
달라진 답 예시
보조금은 환경부가 매년 발표하며 차종·지자체별로 다릅니다. 구체적 금액은 해당 연도 환경부 공고를 확인해야 하며, 현재 답변만으로는 단정하기 어렵습니다. 확인 필요.
한 줄 정리: 출처를 요구하면 검증 가능한 답과 검증 불가능한 답이 갈립니다. OpenAI의 프롬프트 엔지니어링 도움말도 사실 기반 작업에서는 입력과 지시를 명확히 구분하고, 구체적인 형식을 요구하는 방식을 권합니다.
복붙용 프롬프트
답변마다 출처명, 문서명 또는 링크, 기준 시점을 함께 적어줘.
출처를 확인할 수 없는 내용은 "확인 필요"로 분리해줘.
정책·가격·통계는 작성일 기준 정보인지도 표시해줘.
습관 3. 자료를 먼저 주고 이 안에서만 답해
환각을 가장 확실하게 줄이는 방법입니다. AI가 학습 데이터에서 끌어오게 두지 말고, 답의 근거가 될 자료를 직접 붙여준 뒤 이 안에서만 답하라고 가두는 것입니다. 전문 용어로는 그라운딩(grounding)에 가깝습니다.
대충 질문
우리 회사 환불 규정 알려줘.
그대로 나온 답 예시
일반적으로 구매일로부터 7일 이내 미개봉 상품에 한해 환불이 가능합니다.
왜 위험한가: AI는 일반적인 규정을 그럴듯하게 말할 수 있습니다. 정작 우리 회사 규정과는 다를 수 있습니다.
제대로 묶은 질문
아래 환불 규정 안에서만 답하고,
자료에 없는 내용은 "자료에 없음"이라고 해.
[여기에 실제 규정 텍스트 붙여넣기]
질문: 개봉한 상품도 환불돼?
달라진 답 예시
제공된 규정에는 개봉 상품 환불에 대한 조항이 없습니다. 자료에 없음. 명시된 것은 미개봉 7일 이내 환불뿐입니다.
한 줄 정리: 답의 재료를 직접 쥐어주면 AI가 헤맬 여지가 줄어듭니다. Google Cloud는 grounding을 모델 출력을 검증 가능한 정보원에 연결하는 방식으로 설명하며, 사실이 아닌 내용을 만들어낼 가능성을 줄인다고 안내합니다. 사규, 계약서, 매뉴얼처럼 우리만의 정확한 답이 필요할 때 특히 강력합니다.
복붙용 프롬프트
아래 [자료] 안에서만 답해줘.
자료에 없는 내용은 추측하지 말고 "자료에 없음"이라고 표시해줘.
답변마다 근거가 된 문장이나 항목을 함께 적어줘.
[자료]
여기에 원문을 붙여넣기
[질문]
여기에 질문 쓰기
습관 4. 확신도를 표시해줘
답을 받되, 각 항목이 얼마나 믿을 만한지도 함께 표시하게 하는 방법입니다. 그러면 사실과 추측이 한 덩어리로 섞여 나오는 일을 막을 수 있습니다.
대충 질문
이 영양제 성분 세 가지의 효능 정리해줘.
그대로 나온 답 예시
첫째는 면역력 강화, 둘째는 피로 회복, 셋째는 혈압 개선에 효과가 있습니다.
왜 위험한가: 확실한 사실과 근거 약한 주장이 똑같은 무게로 나란히 적혀, 어디까지 믿어야 할지 알 수 없습니다. 건강 정보는 특히 사람이 최종 확인해야 합니다.
제대로 묶은 질문
이 영양제 성분 세 가지의 효능을 정리하되,
각 항목 끝에 [근거 충분 / 근거 제한적 / 불확실]을 표시하고,
불확실한 건 그렇게 말해줘.
달라진 답 예시
면역 관련 효과 [근거 제한적] / 피로 회복 [불확실] / 혈압 관련 주장 [근거 제한적, 전문가 상담 권장].
한 줄 정리: 확신도 표시는 사실과 추측에 서로 다른 라벨을 붙이게 만들어, 어디를 의심해야 할지 보여줍니다. 환각의 뿌리가 불확실함을 인정하지 않는 것에 있다면, 인정할 자리를 열어 주는 방법입니다.
복붙용 프롬프트
각 답변 항목 끝에 신뢰도를 표시해줘.
표시는 [근거 충분 / 근거 제한적 / 불확실] 중 하나로 해줘.
불확실한 항목은 왜 불확실한지도 한 줄로 설명해줘.
습관 5. 바로 답하지 말고 단계로 쪼개 검산하게
계산이나 추론이 필요한 질문에서, AI는 결론으로 성급하게 건너뛰다 틀릴 수 있습니다. 그러니 과정을 단계별로 적고 마지막에 검산하라고 시키면 오류를 사람이 확인하기 쉬워집니다.
대충 질문
월 30만 원씩 3년 부으면 원금 얼마야?
그대로 나온 답 예시
총 900만 원입니다.
왜 위험한가: 계산 문제는 맞을 때도 있지만, 개월 수를 잘못 세거나 곱셈을 건너뛰면 엉뚱한 숫자가 자신 있게 나옵니다.
제대로 묶은 질문
월 30만 원씩 3년 부으면 원금 얼마야?
바로 답하지 말고, 풀이 과정을 단계별로 적은 뒤
마지막에 검산까지 해줘.
달라진 답 예시
1단계: 3년 = 36개월. 2단계: 30만 원 × 36 = 1,080만 원. 검산: 1년에 360만 원 × 3년 = 1,080만 원. 일치합니다.
한 줄 정리: 복잡할수록 한 번에 답하지 말라는 조건이 도움이 됩니다. 중간 과정을 펼치면 사람이 오류를 더 빨리 찾을 수 있고, 검산이 한 번 더 걸러줍니다.
복붙용 프롬프트
바로 결론부터 말하지 말고,
1단계부터 순서대로 계산 또는 판단 과정을 적어줘.
마지막에는 다른 방식으로 한 번 검산하고,
두 결과가 다르면 "불일치"라고 표시해줘.
한 번에 붙여 쓰는 환각 방지 문장: 확실하지 않으면 추측하지 말고 확실하지 않다고 표시해줘. 답변마다 출처와 기준 시점을 적고, 제공한 자료 밖의 내용은 자료에 없음이라고 해줘. 계산이나 추론은 단계별로 적고 마지막에 검산해줘.
그래서 오늘부터 무엇을 하면 될까
환각은 AI를 쓰는 한 완전히 사라지지 않습니다. 그러니 없애려 하기보다 줄이고 걸러내는 쪽으로 마음을 바꾸는 게 현실적입니다.
오늘 당장 해볼 한 가지를 고른다면, 습관 1을 권합니다. 다음에 AI에게 사실을 물을 때, 질문 끝에 "확실하지 않으면 모른다고 해"를 붙여보세요. 단 한 문장인데, 자신 있게 틀린 답을 줄이는 데 도움이 됩니다.
한 발 더 나가자면, 이 다섯 가지를 따로 외울 필요도 없습니다. 중요한 답일수록 "근거를 대고, 모르면 모른다고 하고, 자료 안에서만 답해"를 습관처럼 덧붙이면 됩니다. AI는 점점 똑똑해지겠지만, 모를 때 모른다고 말하게 만드는 책임은 한동안 쓰는 사람 몫으로 남습니다. 그 책임을 질문 한 줄로 대신할 수 있다면, 꽤 남는 거래입니다.
자주 묻는 질문
AI 환각을 완전히 없앨 수 있나요?
완전히 없어진다고 단정하기 어렵습니다. OpenAI는 2025년 9월 글에서 환각이 여전히 모든 대형 언어 모델의 근본 과제라고 설명했습니다. 최신 모델도 빈도를 줄일 수는 있지만 중요한 사실은 사람이 최종 확인해야 합니다.
프롬프트만 바꿔도 정말 효과가 있나요?
효과가 있습니다. 모르면 모른다고 하게 하기, 출처와 기준 시점을 요구하기, 자료 안에서만 답하게 하기처럼 답변 조건을 분명히 주면 자신 있게 추측하는 답을 줄일 수 있습니다. 다만 완벽한 보장은 아니므로 중요한 사실은 사람이 최종 확인해야 합니다.
어떤 질문에서 환각이 특히 위험한가요?
법률, 의료, 세무, 정책 금액처럼 틀리면 피해가 큰 영역입니다. 실제로 가짜 판례나 인용을 법원 문서에 넣은 변호사들이 미국 법원에서 제재를 받은 사례가 반복됐습니다.
그라운딩이 뭔가요?
답의 근거가 될 자료를 AI에게 직접 주고, 그 안에서만 답하게 하는 방법입니다. Google Cloud 문서는 grounding을 모델 출력을 검증 가능한 정보원에 연결하는 방식으로 설명하며, 환각을 줄이는 데 도움이 된다고 안내합니다. 사규, 계약서, 매뉴얼 질문에 특히 효과적입니다.
AI가 출처까지 지어내면 어떻게 하나요?
실제로 가능한 일입니다. 그래서 출처를 받았다고 끝이 아니라, 그 출처가 진짜 존재하는지 한 번 더 확인해야 합니다. 링크나 문서명을 직접 검색해 보는 습관이 마지막 안전장치입니다. AI의 답은 초안으로 두고 사실은 사람이 확정하는 게 안전합니다.
참고 자료
- OpenAI, Why language models hallucinate, 2025년 9월 5일. 확인일 2026년 6월 2일. 자료 보기
- OpenAI, Why Language Models Hallucinate PDF, 2025년 9월. 확인일 2026년 6월 2일. 자료 보기
- OpenAI Help Center, Best practices for prompt engineering with the OpenAI API. 확인일 2026년 6월 2일. 자료 보기
- Google Cloud, How Vertex AI grounding helps build more reliable models, 2024년 12월 2일. 확인일 2026년 6월 2일. 자료 보기
- Google Cloud Documentation, Grounding overview. 확인일 2026년 6월 2일. 자료 보기
- Seyfarth Shaw LLP, Update on the ChatGPT Case: Counsel Who Submitted Fake Cases Are Sanctioned, 2023년 6월 23일. 확인일 2026년 6월 2일. 자료 보기
- CalMatters, California issues historic fine over lawyer's ChatGPT fabrications, 2025년 9월. 확인일 2026년 6월 2일. 자료 보기
- KDI 경제교육·정보센터, AI 환각: 위험 관리와 창의적 활용을 위한 정책 대응 전략, 2026년 1월 27일. 확인일 2026년 6월 2일. 자료 보기