I added prompt caching to my Anthropic Batch API workflow. The hit rate was 0%.

Each model has a minimum cacheable token count — 4,096 for Haiku 4.5. If your cache_control block is below that, the API silently ignores it. Successful response, zero cache reads, no warning.

My IAB taxonomy prompt was 1,064 tokens. Well under the threshold.

Full write-up:

https://mikenoe.com/posts/prompt-caching-classivore/

#AnthropicAPI #LLM #PromptCaching #AIEngineering

OPENAI API EMBRACES "PROMPT CACHING"

OpenAI API prompt caching, starting March 22, 2026, helps AI applications save money and time by reusing prompt tokens. Learn how it works.

#OpenAIAPI, #PromptCaching, #AITechnology, #LLM, #TechNews

https://newsletter.tf/openai-api-prompt-caching-saves-money-time/

OpenAI API's new prompt caching feature can save users money and time. This is because it reuses parts of prompts, like saving common phrases.

#OpenAIAPI, #PromptCaching, #AITechnology, #LLM, #TechNews
https://newsletter.tf/openai-api-prompt-caching-saves-money-time/

OpenAI API prompt caching saves money and time from March 22, 2026

OpenAI API prompt caching, starting March 22, 2026, helps AI applications save money and time by reusing prompt tokens. Learn how it works.

NewsletterTF

Prompt-caching – auto-injects Anthropic cache breakpoints (90% token savings)

https://prompt-caching.ai/

#HackerNews #PromptCaching #AutoInject #Anthropic #TokenSavings #CacheBreakpoints

prompt-caching — Cut Claude Code Token Costs by 90% Automatically

Open source MCP plugin that automatically injects prompt cache breakpoints into Claude Code sessions. Up to 90% token cost reduction — zero config.

prompt-caching
OpenAI spills technical details about how its AI coding agent works

Unusually detailed post explains how OpenAI handles the Codex agent loop.

Ars Technica
Strands AgentsでClaudeモデルのプロンプトキャッシュを使う方法 - Qiita

Bedrockはプロンプトキャッシュに対応しています。 2025年9月のアップデートでこのプロンプトキャッシュが使いやすくなり、「とりあえずメッセージの最後にキャッシュポイントを追加したらOK」的な感じになりました。 制限事項もあるので詳細はドキュメントを見...

Qiita
Oh look, another genius idea from the depths of corporate innovation 🤔: cut costs with 'prompt caching' and save those precious LLM tokens 💰. Because clearly, the problem is not the convoluted explanations but *how* to make them cheaper in bulk. As if slapping a price tag on incomprehensibility is the ultimate solution 🎉.
https://ngrok.com/blog/prompt-caching/ #corporateinnovation #promptcaching #costcutting #LLMtokens #techsatire #businessstrategy #HackerNews #ngated
Prompt caching: 10x cheaper LLM tokens, but how? | ngrok blog

A far more detailed explanation of prompt caching than anyone asked for.

ngrok blog
Prompt caching: 10x cheaper LLM tokens, but how? | ngrok blog

A far more detailed explanation of prompt caching than anyone asked for.

ngrok blog
Prompt Cachingをもう少し踏み込んで動かしてみた(Anthropic) - Qiita

Prompt Cachingの仕様はAnthropicの公式サイトに詳しい説明があります。 とはいえ、うまく理解できない部分があったため、実際に動かして理解を深めてみました。 また、理解を深められたことで、状況に応じてこう使えばいいんだと気づきを得た部分もありました。...

Qiita
Amazon BedrockのPrompt CachingでMCP TOOL一覧のトークン数を削減しよう - Qiita

はじめに MCPを利用した場合、MCPのツール一覧情報で毎回一定(それなり)のトークン数を消費することになります。 この対応として、Prompt Caching を用いることでコストを削減できます。 本記事では、Amazon Bedrock 経由で Claude Sonn...

Qiita