Perplexity (@perplexity_ai)
쿼리 인지형 압축(query-aware compression)을 프로덕션에 적용해 검색 품질과 속도를 개선했다는 소식입니다. 컨텍스트 토큰을 최대 70% 줄이면서 답변 품질은 향상시켰다고 밝혔습니다. RAG/검색 시스템에서 컨텍스트 최적화에 바로 참고할 만한 실무적 인사이트입니다.
Perplexity (@perplexity_ai)
쿼리 인지형 압축(query-aware compression)을 프로덕션에 적용해 검색 품질과 속도를 개선했다는 소식입니다. 컨텍스트 토큰을 최대 70% 줄이면서 답변 품질은 향상시켰다고 밝혔습니다. RAG/검색 시스템에서 컨텍스트 최적화에 바로 참고할 만한 실무적 인사이트입니다.