Perplexity (@perplexity_ai)

쿼리 인지형 압축(query-aware compression)을 프로덕션에 적용해 검색 품질과 속도를 개선했다는 소식입니다. 컨텍스트 토큰을 최대 70% 줄이면서 답변 품질은 향상시켰다고 밝혔습니다. RAG/검색 시스템에서 컨텍스트 최적화에 바로 참고할 만한 실무적 인사이트입니다.

https://x.com/perplexity_ai/status/2057151002105753950

#search #compression #rag #contextwindow #retrieval

Perplexity (@perplexity_ai) on X

We've productionized query-aware compression for faster, cleaner, more-accurate search. Better context is better than more context. Our system cuts context tokens up to 70% while improving answer quality.

X (formerly Twitter)