이미지 OCR

이미지에서 텍스트를 인식하고 추출합니다. 이미지는 서버로 전송되지 않고 브라우저에서 직접 처리됩니다.

인식 언어

OCR 안내

OCR이란OCR

정의광학 문자 인식(Optical Character Recognition). 이미지 속 텍스트를 컴퓨터가 읽을 수 있는 문자열로 변환하는 기술

처리 방식이미지가 서버로 전송되지 않고 브라우저에서 직접 처리됩니다. 개인정보가 포함된 문서도 안전하게 사용 가능

지원 형식JPG, PNG, GIF, WebP, BMP 등 일반적인 이미지 포맷을 모두 지원

엔진Google이 개발한 Tesseract OCR 엔진을 WebAssembly로 변환해 사용. 첫 실행 시 언어 데이터를 다운로드

더 잘 인식되는 이미지Tips

해상도고해상도 이미지일수록 인식률이 높습니다. 최소 300dpi 이상 권장

배경텍스트와 배경의 대비가 높을수록 유리합니다. 흰 배경에 검은 글씨가 최적

기울기텍스트가 수평으로 정렬된 이미지에서 인식률이 높습니다. 기울어진 이미지는 정확도 저하

언어 선택이미지에 포함된 언어에 맞게 선택하세요. 한글+영어 혼용 문서는 "한국어 + 영어" 선택

활용 예시Usage

스크린샷화면 캡처 이미지에서 텍스트를 추출해 복사·편집에 활용

명함·영수증명함의 연락처나 영수증의 금액·품목을 텍스트로 변환

스캔 문서스캐너로 찍은 문서나 책의 텍스트를 디지털화

이미지 번역텍스트 추출 후 번역기에 붙여넣어 이미지 속 외국어 번역에 활용

OCR 결과를 믿기 전에 확인할 기준

OCR은 편리하지만 이미지 품질과 문서 형태에 따라 정확도가 크게 달라집니다. 아래 기준을 같이 보면 실패 원인을 빨리 좁힐 수 있습니다.

해상도와 대비가 인식률에 가장 큰 영향을 줍니다

OCR은 텍스트 경계를 얼마나 선명하게 구분하느냐에 따라 정확도가 크게 달라집니다. 흔들린 사진, 낮은 대비, 작은 글씨는 인식 실패나 오탈자를 크게 늘릴 수 있습니다.

브라우저 내 처리는 개인정보 보호에 유리합니다

이미지를 서버에 올리지 않고 로컬에서 처리하면 민감한 문서나 화면 캡처를 비교적 안심하고 다룰 수 있습니다. 다만 브라우저 캐시와 기기 보안은 별도로 관리해야 합니다.

언어 선택이 정확도에 직접 영향을 줍니다

한글 문서인지, 영어 문서인지, 혼합 문서인지에 따라 적절한 언어 데이터를 선택해야 결과가 안정적입니다. 잘못된 언어 모델을 쓰면 문장 구조가 크게 깨질 수 있습니다.

표, 손글씨, 복잡한 레이아웃은 한계가 있습니다

OCR은 일반 문단 텍스트에는 강하지만 손글씨, 구겨진 영수증, 표 구조, 복잡한 디자인 문서는 결과가 불안정할 수 있습니다. 추출 후 반드시 사람이 한 번 검토하는 편이 안전합니다.

자주 묻는 질문

서버 전송 여부, 첫 실행 속도, 손글씨 인식, 정확도 향상처럼 이미지 OCR에서 자주 묻는 질문을 정리했습니다.

이미지를 업로드하면 서버로 전송되나요?

이 페이지 설명 기준으로 이미지는 브라우저 안에서 직접 처리됩니다. 따라서 일반적인 서버 업로드형 OCR보다 민감한 문서를 다룰 때 노출 범위를 줄일 수 있습니다.

첫 실행이 느린 이유는 무엇인가요?

OCR 엔진과 언어 데이터가 처음 실행될 때 로드되기 때문입니다. 특히 한글과 영어를 함께 사용할 경우 필요한 리소스가 더 커져 첫 처리 시간이 길어질 수 있습니다.

손글씨도 잘 인식되나요?

일반 인쇄 텍스트보다 정확도가 떨어질 가능성이 큽니다. OCR은 또렷한 활자와 정렬된 문단에서 가장 강하고, 손글씨는 사람마다 필체 차이가 커 오인식이 자주 생길 수 있습니다.

OCR 정확도를 높이려면 무엇을 해야 하나요?

고해상도 이미지, 선명한 대비, 수평 정렬, 적절한 언어 선택이 가장 중요합니다. 가능하면 그림자와 왜곡이 적은 이미지를 사용하고, 필요하면 잘라내기나 리사이즈 후 다시 시도하는 것이 좋습니다.

표나 영수증도 그대로 구조화해서 추출되나요?

텍스트 자체는 추출될 수 있지만 표 구조나 열 정렬은 깨질 수 있습니다. OCR 결과를 복사한 뒤 필요한 형식에 맞게 다시 정리하는 과정이 필요할 수 있습니다.