Show HN: PerceptAI – 브라우저뿐만 아니라 모든 화면에서 AI 에이전트의 시선을 제공합니다.

hackernews | | 📰 뉴스
#뉴스
원문 출처: hackernews · Genesis Park에서 요약 및 분석

요약

PerceptAI를 구축한 이유는 모든 에이전트 도구가 DOM을 통한 웹사이트에서만 작동합니다.<p>실제 컴퓨터 작업의 75%가 데스크톱에서 발생합니다. API가 없는 앱, 레거시 소프트웨어 및 도구. 에이전트는 이 모든 것을 전혀 알지 못합니다.</p><p>PerceptAI는 EasyOCR + Groq Vision을 사용하여 읽습니다. 모든 화면과 PyAutoGUI가 이에 대해 작동합니다. 하나의 일반 영어 교육은 다음과 같이 자율적으로 실행됩니다. 자가 치유 및 기억.</p><p>데모: percept-ai-phi.vercel.app GitHub: github.com&#x2F;Neeraj04-CY&#x2F;PerceptAi</p><p>

본문

I built PerceptAI because every agent tool I
found only works on websites via DOM.<p>75% of real computer work happens in desktop
apps, legacy software, and tools with zero APIs.
Agents are completely blind to all of it.</p><p>PerceptAI uses EasyOCR + Groq Vision to read
any screen and PyAutoGUI to act on it. One plain
English instruction executes autonomously with
self-healing and memory.</p><p>Demo: percept-ai-phi.vercel.app
GitHub: github.com&#x2F;Neeraj04-CY&#x2F;PerceptAi</p><p>Would love feedback from anyone building agents.</p>

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →