뉴스피드 큐레이션 SNS 대시보드 저널

7ms E2E 그래프-RAG 검색 Neo4j Golang 재작성. Reddit은 성능을 "미친"이라고 불렀습니다.

hackernews | | 💼 비즈니스
#golang #graph-rag #neo4j #검색 #성능최적화

요약

이 글은 대부분의 시스템이 약 100ms의 엔드투엔드 지연 시간을 목표로 하는 가운데, Golang으로 재작성된 Neo4j 기반 Graph-RAG 시스템이 7ms라는 경이적인 성능을 달성했다고 주장하는 Reddit 논쟁을 소개합니다. 저자는 쿼리 임베딩, 검색, HTTP 전송을 모두 포함한 전체 과정에서의 구체적인 p50, p95, p99 지표와 프로덕션 환경에서의 목표치에 대해 궁금해합니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

I’m curious what your target p50/ P95/p99-s are for your graph-RAG system full e2e? it seems like from what i read, most systems are targeting somewhere around ~100ms e2e latency. that’s including embedding the original user query string, retrieval, and http transport. what are your production target goalsv

관련 저널 읽기

전체 보기 →