일반적인 사실은 다음 글을 참고하기 바란다.
2026.04.09 - [IT/Python] - Tesseract 와 EasyOCR을 비교 : 일반적으로 알려져 있는 사항
Tesseract 와 EasyOCR을 비교 : 일반적으로 알려져 있는 사항
테서랙트(Tesseract)와 이지OCR(EasyOCR)은 파이썬 환경에서 가장 널리 쓰이는 두 가지 오프라인 OCR 엔진이다. 두 엔진은 개발 방식과 장단점이 아주 명확하게 대비된다. 표1. 두 엔진의 핵심적인 차이
mmemories.tistory.com
다양하게 경험하진 못했고, 파이썬 코드를 만들어 책과 웹사이트 캡쳐한 것을 가지고 간단하게 테스트해 보았다.
결과적으로
- 스크린 캡쳐나 아니면 깨끗하게 잘 스캔된 책과 같은 페이지들을 대상으로한 인식은 2가지가 크게 다르지 않았다.
- 대신 EasyOCR은 로딩시에 시간이 아주 많이 걸린다. 5-10초 정도?
- 일반적으로 알려진 사실은 지저분하게 스캔된 책은 EasyOCR이 더 잘된다고 되어 있으나 확인하지 못했다. 지저분한 것을 구하지 못했기 때문에..
- 둘 다 영어는 아주 잘 되지만 한글은 아주 잘되진 않고 대충된다. 한글인식률을 높이려면 아마도 유료엔진을 사용하거나 Paddle OCR을 사용해야할 것 같다. 패들은 현재 파이썬 3.14를 지원하지 않는다.
'IT > Python' 카테고리의 다른 글
| uv sync 사용시 warning: Failed to hardlink files; falling back to full copy. This may lead to degraded performance. If the cache and target directories are on different filesystems, hardlinking may not be supported. 경고가 나올 때 (0) | 2026.05.20 |
|---|---|
| 파이썬 코드를 실행파일로 만들기 (1) | 2026.04.30 |
| 우분투에서 flet app을 android apk 로 만들기 위한 환경 설정 (0) | 2026.04.26 |
| python으로 만년달력을 만들 때 (0) | 2026.04.12 |
| Tesseract 와 EasyOCR을 비교 : 일반적으로 알려져 있는 사항 (0) | 2026.04.09 |
| loc 와 iloc은 어떻게 다른가? (0) | 2026.04.09 |
| tabulate 를 사용하여 가장 예쁘게 출력할수있는 방법은? (1) | 2026.04.09 |
| pandas df를 프린트할 때 행열을 예쁘게 잘 맞추어 프린트하는 방법은? (0) | 2026.04.09 |
