사진 글자 추출, ChatGPT로 무료로 끝내기 — 영수증·손글씨·메뉴판

Q: 사진 속 글자를 텍스트로 추출하는 가장 쉬운 방법은?

ChatGPT·제미나이 채팅창에 사진을 올리고 추출 프롬프트를 함께 붙여 넣는 것입니다. 전용 앱이나 스캐너 설치가 필요 없고, 추출과 동시에 표 정리·번역·검산까지 한 번에 이어집니다. 단순히 글자만 빠르게 복사하려면 폰에 이미 있는 구글 렌즈·아이폰 라이브 텍스트가 더 빠릅니다.

Q: AI가 글자를 잘못 읽거나 지어내지는 않나요?

있을 수 있습니다. 특히 흐릿한 숫자를 그럴듯한 다른 숫자로 메우는 환각이 가장 위험합니다. 프롬프트에 '안 보이는 글자는 추측하지 말고 [판독 불가]로 표시'라는 규칙을 넣고, 금액·날짜·계좌번호 같은 숫자는 원본 사진과 직접 대조하는 습관이 필요합니다.

Jun 12, 2026

영수증과 손글씨 메모 사진 속 글자가 정돈된 디지털 텍스트로 변환되는 것을 형상화한 개념 일러스트

책에서 마음에 드는 구절을 발견했습니다. 메모해두고 싶은데, 한 문단을 폰으로 타이핑하자니 한숨부터 나옵니다. 경비 처리할 영수증은 지갑에서 구겨진 채 나왔고, 회의실 화이트보드는 지우기 직전에 급하게 사진만 찍어뒀습니다. 공통점이 하나 있습니다. 전부 ‘글자가 이미지에 갇혀 있다’는 것.

⏱ 설명은 나중에 읽고 일단 꺼내고 싶다면 — 복붙 프롬프트로 바로 가기↓

이미지에서 글자를 꺼내는 기술, 즉 사진 글자 추출(이미지 텍스트 변환)을 OCR(광학 문자 인식)이라고 합니다. 예전엔 전용 프로그램이나 스캐너 앱의 영역이었지만, 지금은 ChatGPT 채팅창에 사진을 올리는 것으로 끝납니다. 성능도 어중간하지 않습니다. 2026년 1월 AI Multiple이 300개 문서로 진행한 OCR 벤치마크에서, 최신 AI 모델의 손글씨 인식 정확도는 95%에 달했습니다. 흘려 쓴 글씨에선 전통 OCR 프로그램보다 AI 쪽이 낫다는 평가입니다.

이 글은 사진 한 장과 프롬프트 하나로 글자를 꺼내는 방법을 다룹니다. 영수증을 지출 표로, 화이트보드 손글씨를 회의 메모로, 책 페이지를 인용문으로 바꾸는 실전 데모 네 개를 채팅 화면 그대로 보여드립니다. 그리고 AI OCR이 글자를 ‘지어내는’ 함정과, 개인정보가 든 사진을 다루는 원칙까지 짚습니다.

핵심 요약

사진 속 글자 추출은 이제 전용 프로그램 없이 ChatGPT·제미나이 채팅창에서 끝납니다. 2026년 벤치마크 기준 AI의 손글씨 인식 정확도는 95% — 흘림체에선 전통 OCR보다 강합니다(AI Multiple).

핵심은 규칙 블록입니다. “보이는 글자만 그대로, 안 보이면 [판독 불가]“를 박아두면, AI가 흐린 글자를 그럴듯하게 지어내는 환각을 막을 수 있습니다.

금액·날짜 같은 숫자는 반드시 원본과 대조하고, 주민번호·카드번호·기밀이 보이는 사진은 올리지 않습니다.

AI OCR이란? 사진 찍는 게 타이핑보다 빨라진 이유

OCR은 Optical Character Recognition, 우리말로 광학 문자 인식입니다. 이미지 속 글자 모양을 읽어 편집 가능한 텍스트로 바꾸는 기술이고, 주차장 번호판 인식부터 은행의 서류 자동화까지 이미 생활 곳곳에 들어와 있습니다. 시장도 빠르게 큽니다. 시장조사기관 모도 인텔리전스에 따르면 글로벌 OCR 시장은 2026년 200억 2천만 달러 규모로, 2031년까지 연평균 17%대 성장이 전망됩니다.

달라진 건 도구의 문턱입니다. 예전의 OCR은 ‘활자 전용’에 가까웠습니다. 스캔 품질이 좋고 글꼴이 단정해야 제 성능이 났고, 손글씨나 구겨진 영수증 앞에선 자주 무너졌습니다. 반면 ChatGPT 같은 멀티모달 AI는 글자를 모양으로만 읽지 않고 문맥으로 함께 읽습니다. 앞뒤 단어를 보고 흐린 글자를 가려내는 식입니다. 2026년 1월 AI Multiple 벤치마크에서 손글씨 부문 정확도가 95%까지 오른 배경이고, “손글씨 추출이 필요하다면 사실상 AI가 유일한 현실적 선택”이라는 평가까지 나옵니다.

사용자 입장에서 더 중요한 변화는 이것입니다. 추출과 정리가 한 번에 됩니다. 전용 OCR 앱은 글자를 꺼내주는 데서 끝나지만, AI는 꺼낸 글자를 표로 만들고, 합계를 내고, 번역까지 이어서 합니다. 도구는 이미 손안에 있습니다. 2025년 한국은행 조사 기준 업무에 생성형 AI를 쓰는 한국 직장인은 51.8%, 그중 챗GPT 사용자가 67.8%로 가장 많습니다. 빠진 건 도구가 아니라 ‘시키는 법’ 하나입니다.

복붙해서 바로 쓰는 글자 추출 마스터 프롬프트

방법은 두 단계입니다. 채팅창의 클립(+) 버튼으로 사진을 올리고, 아래 프롬프트를 함께 붙여 넣습니다. ChatGPT 무료 계정도 이미지 업로드를 지원하니(횟수 제한 있음) 따로 결제할 필요는 없습니다. 제미나이 등 다른 AI에서도 같은 프롬프트가 그대로 작동합니다.

너는 이미지 속 글자를 정확하게 받아 적는 OCR 비서야.
첨부한 사진에서 글자를 추출해줘.

[규칙]
- 사진에 보이는 글자만 그대로 옮겨. 문장을 다듬거나 요약하지 마.
- 흐리거나 잘려서 안 보이는 글자는 추측하지 말고 "[판독 불가]"로 표시해.
- 숫자·날짜·금액은 특히 보이는 그대로. 임의로 보정하지 마.
- 원문이 외국어면 원문 그대로 추출해. 번역은 내가 따로 요청할게.
- 표 형태의 내용은 표 구조를 유지해서 정리해줘.

나의 의도: (예: 영수증을 지출 내역 표로)

구성요소마다 이유가 있습니다. 역할 지정(“받아 적는 비서”)은 모델을 창작이 아닌 전사 모드로 고정합니다. 규칙 블록은 이 프롬프트의 안전핀입니다 — AI는 흐린 글자를 만나면 그럴듯한 글자로 메우려는 성질이 있는데, “[판독 불가]로 표시하라”는 한 줄이 그 관성에 제동을 겁니다. 숫자 항목을 따로 못 박는 건, 글자 환각 중 가장 비싼 사고가 금액과 날짜에서 나기 때문입니다. 마지막 나의 의도 한 줄은 추출 후의 정리 방향을 정합니다. 같은 영수증도 “지출 표로”와 “그대로 전문만”은 출력이 다릅니다.

before / after — 사진 네 장으로 보는 실전

말보다 화면이 빠릅니다. 아래는 같은 마스터 프롬프트에 사진과 의도만 바꿔가며 쓴 네 가지 장면입니다. AI 출력은 모두 예시이며, 실제 결과는 사진 품질과 모델에 따라 매번 달라집니다.

데모 1. 영수증 사진을 지출 표로 — 1분 텍스트 변환

경비 처리의 영원한 숙제부터. 구겨진 영수증 사진 한 장을 올리고 시작합니다.

1 영수증 — 추출에서 검증까지 한 스레드

📷 (구겨진 카페 영수증 사진 첨부)

마스터 프롬프트 + 나의 의도: 영수증을 지출 내역 표로

○○커피 강남점 · 2026-06-09 14:32

품목	수량	금액
아메리카노(ICE)	2	9,000
카페라떼	1	5,500
치즈케이크	1	[판독 불가]

합계: 21,300원 · 카드 결제(신한 ****1234)

⚠ 치즈케이크 금액은 접힌 부분에 가려 읽을 수 없어 [판독 불가]로 표시했습니다.

치즈케이크는 6,800원이야. 반영해서 합계 맞는지 확인해줘.

반영했습니다. 9,000 + 5,500 + 6,800 = 21,300원 — 영수증의 합계와 일치합니다. ✅

날짜·사용처·금액·용도 4개 열로 바꿔줘. 용도는 '팀 미팅 다과'로.

날짜	사용처	금액	용도
2026-06-09	○○커피 강남점	21,300원	팀 미팅 다과

경비 양식에 그대로 붙여 넣을 수 있게 한 줄로 정리했습니다.

눈여겨볼 건 두 군데입니다. 가려진 금액을 멋대로 채우지 않고 [판독 불가]로 남긴 것, 그리고 사람이 값을 알려주자 합계 검산까지 이어진 것. 추출→검증→양식 변환이 한 대화 안에서 끝났습니다.

데모 2. 손글씨 텍스트 변환 — 화이트보드 메모를 할 일 목록으로

이번엔 손글씨입니다. 회의 끝나고 지우기 직전에 찍은, 화살표와 약어투성이 화이트보드 사진.

2 화이트보드 — 흘림체 메모를 할 일 목록으로

📷 (회의실 화이트보드 사진 첨부)

마스터 프롬프트 + 나의 의도: 보드 내용을 텍스트로, 이후 할 일 정리

추출 결과
· 신규 랜딩페이지 → 6/20 오픈
· 카피 시안 A/B — 김 [판독 불가]까지
· 예산 추가분 → 대표 컨펌 필요
· SNS 광고는 보류

⚠ 둘째 줄 '김' 다음 글자는 흘림이 심해 읽지 못했습니다. '금요일'로도 보이지만 확정할 수 없어 표시만 했습니다.

맞아, '금요일까지'야. 반영해줘.

반영했습니다. → "카피 시안 A/B — 금요일까지"

나머지 항목은 수정 없이 그대로 유지합니다.

이제 담당·기한 붙여서 할 일 목록으로. 랜딩페이지는 개발팀, 카피는 박주임 담당이야.

할 일 목록
· 신규 랜딩페이지 오픈 — 개발팀 · 6/20
· 카피 시안 A/B 완성 — 박주임 · 금요일
· 예산 추가분 컨펌 요청 — 담당 미정 · 기한 미정
· SNS 광고 — 보류(조건 미정)

담당이 안 정해진 예산 건은 비워뒀습니다. 회의 기억이 생생할 때 채워두는 걸 권합니다.

손글씨에서 진가가 나옵니다. ‘금요일’로 추정되지만 확신이 없는 글자를 추측으로 메우지 않고 멈춘 것 — 규칙 블록이 일하는 장면입니다. 이렇게 정리한 메모를 회의록으로 발전시키는 프롬프트는 메모를 회의록으로 바꾸는 프롬프트에서 이어집니다.

데모 3. 책 페이지 글자 추출 — 인용은 토씨 하나까지 그대로

읽다가 만난 좋은 문단, 보고서에 인용할 통계 표. 옮겨 적다 오타가 나면 인용이 아니라 왜곡이 됩니다.

3 책 페이지 — 원문 보존이 생명인 작업

📷 (책 한 페이지 사진 첨부)

마스터 프롬프트 + 나의 의도: 둘째 문단만 인용용으로 그대로 추출

둘째 문단 전문입니다.

"기록은 기억을 대신하는 것이 아니라, 기억이 왜곡되는 것을 막아주는 장치다. 우리는 적어둔 것만을 정확히 의심할 수 있다."

사진 속 문장부호와 띄어쓰기를 그대로 유지했습니다.

출처 표기에 쓰게 페이지 하단의 쪽수도 알려줘.

페이지 하단 가운데에 137이 보입니다. 인용 표기 예: (저자명, 책 제목, 137쪽)

혹시 추출하면서 다듬은 데 없어? 원문이랑 다르면 안 돼.

다듬은 곳 없습니다. 다만 정확성을 위해 한 가지만 짚으면 — 둘째 문장의 '적어둔'은 사진상 '적어 둔'(띄어쓰기)일 가능성도 있습니다. 인용이 목적이라면 이 부분만원본과 한 번 대조해 보시길 권합니다.

마지막 턴이 포인트입니다. “다듬은 데 없어?”라고 한 번 되묻는 습관. 인용·계약·공문처럼 원문 보존이 중요한 작업일수록, 이 확인 턴 하나가 사고를 막습니다.

데모 4. 외국어 메뉴판 번역 — 원문 추출과 번역을 한 번에

여행지에서 가장 자주 만나는 OCR 상황입니다. 추출과 번역이 한 번에 되는 게 AI 방식의 강점입니다.

4 일본 메뉴판 — 추출·번역·추천까지

📷 (일본 식당 메뉴판 사진 첨부)

마스터 프롬프트 + 나의 의도: 원문 추출 후 한국어 번역을 나란히

원문	번역	가격
豚骨ラーメン	돈코츠 라멘	¥980
味玉トッピング	맛달걀 토핑	¥150
替え玉	면 사리 추가	¥100

替え玉가 정확히 뭐야? 면만 더 주는 거야?

맞습니다. 가에다마(替え玉)는 남은 국물에 면만 추가하는 후쿠오카식 주문 문화입니다. 국물 리필이 아니라 면 사리만 나오니, 국물을 좀 남겨두고 주문하는 게 요령입니다.

점원한테 일본어로 뭐라고 말하면 돼?

"가에다마 오네가이시마스(替え玉お願いします)" — '면 사리 하나 부탁합니다'입니다. 손가락 하나를 같이 들면 더 확실합니다. 🍜

메뉴판이 회화 연습으로 이어졌습니다. 전용 번역 앱과 갈리는 지점이 여기입니다 — 추출이 끝이 아니라 대화의 시작이라는 것. 여행 회화를 본격적으로 준비하고 싶다면 여행 영어 롤플레이 프롬프트와 묶어 쓰기 좋습니다.

AI OCR의 진짜 함정 — 안 보이는 글자를 지어낼 때

AI OCR에서 가장 위험한 건 오독이 아니라 환각입니다. 모델은 흐린 글자를 만나면 앞뒤 문맥으로 ‘그럴듯한 글자’를 메우려는 성질이 있습니다. 문맥으로 읽는 능력은 손글씨 인식률을 끌어올린 바로 그 힘인데, 같은 힘이 거꾸로 작동하면 없는 글자를 만들어냅니다. 흐릿한 ‘6,800원’을 ‘5,300원’으로, 잘린 날짜를 멀쩡한 날짜로 채우는 식입니다.

이게 무서운 이유는 틀린 티가 안 나서입니다. 출력이 매끄러울수록 의심은 줄어듭니다. 데모 1에서 가려진 금액이 [판독 불가]로 남은 건 규칙 블록 덕분이지, 모델의 기본 성향이 아닙니다. 규칙 없이 같은 사진을 올리면 모델이 빈칸을 채워버릴 수 있고, 그 표가 경비 시스템에 그대로 들어가면 사고가 됩니다. AI가 왜 빈칸을 채우려 드는지, 그 원리와 방어법은 AI 환각을 줄이는 프롬프트에서 따로 다뤘습니다.

그래서 용도에 따라 검증 강도를 달리하는 게 현실적입니다. 책 구절 메모라면 가볍게 훑어도 되지만, 돈과 책임이 걸린 문서라면 숫자는 전수 대조가 원칙입니다. 벤치마크 정확도 95%는 거꾸로 읽으면 ‘스무 글자 중 하나는 틀릴 수 있다’는 뜻이기도 합니다.

추출 결과 쓰기 전, 5초 셀프 점검

[판독 불가] 표시가 있나? → 원본 사진을 보고 직접 채운다.

금액·날짜·번호가 들어 있나? → 원본과 한 자리씩 대조한다.

표의 합계가 있나? → “합계 맞는지 검산해줘”로 한 턴 더 확인한다.

인용·계약 등 원문 보존이 중요한가? → “다듬은 데 없어?”를 한 번 묻는다.

한 가지 더, 사진을 올리기 전에 멈춰야 할 경우가 있습니다. 주민등록번호·카드번호·계좌 비밀번호가 보이는 문서, 서명된 계약서, 사내 기밀 자료입니다. 외부 AI 서비스에 올린 이미지는 내 손을 떠난 데이터입니다. 회사 문서라면 사내 보안 정책을 먼저 확인하고, 개인 문서라면 민감한 부분을 가리고 찍는 것이 원칙입니다. 편리함의 값으로 치르기엔 개인정보가 너무 비쌉니다.

무료로 사진 글자 추출하는 법 — 전용 도구가 더 빠른 경우

모든 OCR을 AI 채팅으로 할 필요는 없습니다. ‘복사만 빨리’ 하면 되는 상황엔 폰에 이미 들어 있는 도구가 더 빠르고, 아래는 전부 무료입니다. 아이폰·갤럭시는 사진 앱 안에서 추가 설치 없이 글자를 바로 복사할 수 있습니다.

도구	쓰는 법	이런 때
구글 렌즈	카메라로 비추고 텍스트 선택	길거리 간판·안내문을 즉석에서 복사
네이버 스마트렌즈	네이버 앱 검색창 옆 카메라	한국어 문서·간판 인식, 번역 연계
아이폰 라이브 텍스트	사진 앱에서 글자를 길게 누르기	찍어둔 사진 속 전화번호·주소 복사
갤럭시 빅스비 비전	갤러리에서 사진 열고 텍스트 추출 아이콘	갤럭시 폰에서 사진 글자 즉석 복사
윈도우 캡처 도구	캡처 후 ‘텍스트 작업’ 버튼	PC 화면 속 복사 안 되는 글자

가르는 기준은 간단합니다. 꺼내기만 하면 끝이면 전용 도구, 꺼낸 다음 할 일이 있으면 AI입니다. 표로 정리하고, 합계를 검산하고, 번역하고, 할 일로 바꾸는 후속 작업이 붙는 순간 AI 채팅 쪽이 압도적으로 편해집니다. 대량 문서를 정기적으로 처리하는 업무라면 전용 OCR 솔루션이 따로 있는 영역이고요. 이 글의 프롬프트는 그 사이, 일상과 업무에서 매일 만나는 ‘사진 몇 장’ 구간을 맡습니다.

자주 묻는 질문

사진 속 글자를 텍스트로 추출하는 가장 쉬운 방법은?

ChatGPT·제미나이 채팅창의 클립(+) 버튼으로 사진을 올리고, 위의 마스터 프롬프트를 함께 붙여 넣는 것입니다. 전용 앱이나 스캐너 설치가 필요 없고, 추출과 동시에 표 정리·번역·검산까지 한 번에 이어집니다. 무료 계정도 이미지 업로드가 가능합니다(횟수 제한 있음). 단순히 글자만 빠르게 복사하려면 폰에 이미 있는 구글 렌즈·아이폰 라이브 텍스트가 더 빠릅니다.

사진 글자 추출, 무료로 되나요?

됩니다. ChatGPT 무료 계정도 이미지 업로드를 지원하고(횟수 제한 있음), 구글 렌즈·네이버 스마트렌즈·아이폰 라이브 텍스트·갤럭시 빅스비 비전은 모두 무료입니다. 이 글의 마스터 프롬프트도 그대로 복사해 쓰는 무료 도구입니다. 2026년 벤치마크 기준 AI 모델의 손글씨 인식 정확도는 95%에 달합니다 — AI Multiple.

아이폰·갤럭시에서 사진 속 글자를 복사하려면?

아이폰은 사진 앱에서 글자를 길게 누르면 ‘라이브 텍스트’로 바로 복사됩니다. 갤럭시는 사진을 열고 빅스비 비전(또는 갤러리의 텍스트 추출 아이콘)을 누르면 됩니다. 둘 다 무료·기본 내장 기능이라 ‘복사만’ 하면 될 때 가장 빠릅니다. 꺼낸 글자를 표로 정리하거나 번역까지 이어가려면 ChatGPT 쪽이 편합니다.

손글씨도 인식이 되나요?

됩니다. 오히려 손글씨가 AI OCR의 최대 강점입니다. 2026년 1월 AI Multiple의 300개 문서 벤치마크에서 최신 AI 모델은 손글씨 정확도 95%를 기록했고, 흘림체에선 전통 OCR보다 정확하다는 평가를 받았습니다. 다만 흐린 글자는 [판독 불가]로 표시하게 규칙을 거는 것이 안전합니다.

AI가 글자를 잘못 읽거나 지어내지는 않나요?

있을 수 있습니다. 특히 흐릿한 숫자를 그럴듯한 다른 숫자로 메우는 환각이 가장 위험합니다. 프롬프트에 “안 보이는 글자는 추측하지 말고 [판독 불가]로 표시”라는 규칙을 넣고, 금액·날짜·계좌번호 같은 숫자는 원본 사진과 직접 대조하는 습관이 필요합니다.

개인정보가 있는 문서 사진도 올려도 되나요?

권하지 않습니다. 주민등록번호·카드번호·계약서·사내 기밀이 보이는 사진은 외부 AI 서비스에 올리지 않는 것이 원칙입니다. 회사 문서라면 사내 보안 정책을 먼저 확인하고, 개인 문서라면 민감한 부분을 가리고 찍어서 올리는 것이 안전합니다.

결론

이미지 속 글자를 옮기는 일은 더 이상 타이핑 노동이 아닙니다. 사진 한 장, 프롬프트 하나, 그리고 후속 질문 몇 턴이면 영수증은 지출 표가 되고 화이트보드는 할 일 목록이 됩니다. 기억할 건 두 가지입니다. 규칙 블록으로 환각을 막을 것, 숫자는 원본과 대조할 것.

다음에 책에서 옮기고 싶은 문단을 만나면, 타이핑하는 대신 사진을 찍어 이 프롬프트에 붙여보세요. 질문을 던지는 방식 자체를 다듬고 싶다면 ChatGPT, 이렇게 물으면 답이 달라진다가 다음 글로 좋습니다.

참고 자료

AI Multiple. OCR Benchmark: Text Extraction / Capture Accuracy (300개 문서, 손글씨 부문 AI 모델 정확도 95%, 인쇄 텍스트 96%). 2026-01-22 업데이트. 2026-06-12 확인. 자료 보기
Mordor Intelligence. 광학 문자 인식 시장 규모 분석 (2026년 200억 2천만 달러 → 2031년 445억 2천만 달러, CAGR 17.34%). 2026-06-12 확인. 자료 보기
한국은행. BOK 이슈노트 제2025-22호 — AI의 빠른 확산과 생산성 효과 (업무 목적 생성형 AI 활용률 51.8%, 챗GPT 67.8%). 2025-08. 2026-06-12 확인. 자료 보기
OpenAI Help Center. 파일 업로드 FAQ (무료 등급 이미지 업로드 지원·횟수 제한, 파일당 512MB 제한). 2026-06-12 확인. 자료 보기