Akshay (@akshay_pachaar)

AI 엔지니어를 위한 핵심 실무 주제를 정리한 트윗입니다. 하니스 엔지니어링, 프롬프트 캐싱과 시맨틱 캐싱의 차이, KV 캐시 관리, speculative decoding과 양자화 비교, 구조화된 출력 실패 대응, LLM-as-judge와 휴먼 평가 등 개발자에게 중요한 기술 포인트를 소개합니다.

https://x.com/akshay_pachaar/status/2053815461150859272

#aiengineering #llm #promptengineering #caching #evals

Akshay 🚀 (@akshay_pachaar) on X

As an AI Engineer. Please learn: - Harness engineering, not just prompt engineering - Prompt caching vs. semantic caching tradeoffs - KV cache management at scale - Speculative decoding vs quantization - Structured output failures & fallback chains - Evals (LLM-as-judge + human

X (formerly Twitter)

WordPress maintenance – PHP, page caching and federation (unrelated)

TL;DR I solved some lingering issues with my blog (WordPress) that got on my nerves. 1. I upgraded PHP from 8.2x to 8.5, 2. I improved page responsiveness by installing page cache plugin (WP Supercache) and most important: 3. I fixed ActivityPub federation that I broke when I installed Anubis. 1. PHP upgrade I was delaying upgrading PHP (WordPress was nagging) because ... it sounded too complex for me. Then I found (by accident) this php-upgrade script by Ernolf […]

https://blog.rozman.info/wordpress-maintenance-php-page-caching-and-federation-unrelated/

Wordpress maintenance – PHP, page caching and federation (unrelated) – Tomi's junkyard

Most cache misconfiguration is not carelessness, it's a missing handshake.

Your build encodes assumptions: hashed filenames mean the URL changes whenever the content changes. The web server has to know that, or the assumption stays unused.

If the config doesn't reflect what the build produces, the framework's work gets quietly undone at the last layer of the chain.

#WebPerf #Caching #StaticSite #Astro #Caddy

TanStack Queryでいい。もう自分でやらなくていい。 - Qiita

TanStack Query — 毎日手動でやっているデータフェッチの悩みを解決する useEffect + useState でデータを取得しているなら、この記事はあなたのためです。 その方法が間違っているわけではありません。ただ、本来やらなくていいことを自分でたくさ...

Qiita

"Cloudflare cache bypass kurallarının gizli yüzünü keşfettim! Nginx ile nasıl aştım?"

#Cloudflare #Caching #Nginx #Performance

https://mustafaerbay.com.tr/blog/technology/cloudflare-cachein-kr-noktas-bypass-kuralnn-bedeli

Show HN: An agent that tunes its own cache

chat.betterdb.com은 Valkey, Redis, Dragonfly 문서 기반 RAG 시스템으로, 자체 캐시 라이브러리를 테스트하기 위해 개발된 에이전트입니다. 이 에이전트는 툴 캐시와 의미 기반 캐시 두 계층을 활용해 LLM 호출을 줄이고 비용을 절감하며, 캐시 메타데이터를 분석해 TTL 조정 등 캐시 설정을 자동으로 최적화합니다. 에이전트가 스스로 캐시 설정을 조정하고 제안하며, 재시작 없이 구성 변경이 가능하도록 설계되어 AI 서비스의 효율적 운영에 참고할 만한 사례입니다. 다만, 의미 기반 캐시와 툴 캐시 간 라우팅 문제는 코드 변경이 필요해 완전 자동화에는 한계가 있음을 지적합니다.

https://news.ycombinator.com/item?id=48062214

#rag #caching #llm #redis #valkey

Show HN: An agent that tunes its own cache | Hacker News

#Development #Guides
Browser caching with No-Vary-Search · Better HTTP caching by ignoring irrelevant query parameters https://ilo.im/16crk2

_____
#Caching #URL #UrlParameters #HTTP #HttpCache #HttpHeaders #Browsers #WebPerf #WebDev #Frontend

Better Browser Caching with No-Vary-Search – CSS Wizardry

No-Vary-Search lets HTTP caches ignore irrelevant query parameters such as UTM tags, while still keeping meaningful ones like product variants in the cache key.

Copilot Studio gets faster with .NET 10 on WebAssembly - .NET Blog

Microsoft Copilot Studio recently upgraded its .NET WebAssembly engine to .NET 10. The migration was straightforward, simplified deployment, and delivered another round of meaningful performance gains for end users.

.NET Blog

Show HW: Vectors.Space – An free service for embeddings

Vectors.Space는 OpenAI, Gemini, Voyage, 로컬 Llama 등 여러 임베딩 제공자를 단일 API로 통합해 개발자가 임베딩 파이프라인 관리에 신경 쓰지 않고 제품 개발에 집중할 수 있도록 지원하는 무료 서비스입니다. 내장된 캐싱과 사용량 추적, 토큰 오버플로우 처리 기능으로 비용과 지연을 줄이며, 대시보드를 통해 사용 현황과 성능을 한눈에 파악할 수 있습니다. 벡터 임베딩 모델 간 즉각적인 전환과 키 관리, 상세 로그 제공 등 AI 인프라 운영에 필요한 안정성과 편의성을 제공합니다.

https://vectors.space

#embedding #api #caching #llm #aiinfrastructure

vectors.space