Show HN: Locro – Chrome의 screen_ai를 통한 빠르고 정확한 로컬 OCR
hackernews
|
|
📦 오픈소스
#chrome
#ocr
#python
#review
#screen-ai
#show hn
원문 출처: hackernews · Genesis Park에서 요약 및 분석
요약
이 라이브러리는 Chrome의 내장 'screen-ai' OCR 엔진을 이용하여 브라우저 창을 열지 않고도 Python에서 직접 텍스트 추출을 수행할 수 있게 해줍니다. 기존 대안보다 매우 빠르고 정확하며 특히 텍스트 추출에 강점이 있는 이 도구는 윈도우, 리눅스 등에서 PDF와 다양한 이미지 파일을 지원합니다. 설치 방법은 간단하여 로컬 폴더에서 `pip install` 명령어를 통해 실행할 수 있으며, CLI와 API 형태로 모두 활용 가능합니다.
본문
This is a Python wrapper for Chrome's built-in screen-ai OCR engine. This engine is extremely fast compared to other alternatives (Tesseract, etc.) and very accurate (particularly for extracting text; less so when dealing with complex layouts such as tables and forms). However, it is only available through Chrome/Chromium. The magic of this wrapper is that it allows you to call the screen-ai library directly from Python (using ctypes), without having to open browser windows. It works on Windows (chrome_screen_ai.dll ), Linux (libchromescreenai.so ), and should be easy to modify it to work on MacOS. Lastly, it supports both PDFs and images (JPG, PNG, WebP, BMP, TIFF, GIF). To install this library, simply clone it and then install it from the local folder: pip install -e . # install locro download # (optional) one-time: copy library + models from Chrome locro ocr document.pdf # process a PDF locro ocr photo.jpg --text # process an image See GUIDE.md for the full user guide, including installation, CLI, and API documentation. See CHROME_SCREEN_AI_DLL.md for technical details on how the library interface was reverse-engineered.
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유