7ms E2E 그래프-RAG 검색 Neo4j Golang 재작성. Reddit은 성능을 "미친"이라고 불렀습니다.
hackernews
|
|
💼 비즈니스
#golang
#graph-rag
#neo4j
#검색
#성능최적화
요약
이 글은 대부분의 시스템이 약 100ms의 엔드투엔드 지연 시간을 목표로 하는 가운데, Golang으로 재작성된 Neo4j 기반 Graph-RAG 시스템이 7ms라는 경이적인 성능을 달성했다고 주장하는 Reddit 논쟁을 소개합니다. 저자는 쿼리 임베딩, 검색, HTTP 전송을 모두 포함한 전체 과정에서의 구체적인 p50, p95, p99 지표와 프로덕션 환경에서의 목표치에 대해 궁금해합니다.
왜 중요한가
개발자 관점
검토중입니다
연구자 관점
검토중입니다
비즈니스 관점
검토중입니다
본문
I’m curious what your target p50/ P95/p99-s are for your graph-RAG system full e2e? it seems like from what i read, most systems are targeting somewhere around ~100ms e2e latency. that’s including embedding the original user query string, retrieval, and http transport. what are your production target goalsv