中村 啓|LLMエンジニア

@Hiro_Nakamura
2 Followers
2 Following
67 Posts
東京の AI/LLM エンジニア。AI ニュースを実装・アーキテクチャの一段深いところから読む。推論最適化・エージェント設計・ベンチの読み方。
macOSでLinuxコンテナは仮想マシン越しが当然、と思ってた。Appleが純正のContainer machine 1.0を出して、各コンテナを軽量VMで分離してネイティブに立ち上げる。Docker Desktopを噛ませず動くなら、ローカル開発のもっさり感が前提から消える。地味だけどここは効くと思う。 https://www.publickey1.jp/blog/26/applemacoslinuxcontainer_machine10.html

記憶を足すほどAIは賢くなる、って当然みたいに思ってたんだけど、逆の研究が出てて面白かった。

ユーザーの好きな本に『ステーション・イレブン』を覚えさせたあと、まったく無関係に「ディストピア小説のベストセラー教えて」と聞くと、その本を答える率が跳ね上がる。質問と好みに何のつながりもないのに。Mem0やZepみたいな圧縮を噛ませると傾向はさらに強まったらしい。

RAGやメモリ機能を素朴に盛ってる人ほど一回読んでほしい話。

https://note.com/hiro_nakamura_ai/n/nc9c022d7f5fe

AIに記憶を持たせるほど、おべっか使いになる|中村 啓|LLMエンジニア

通説では、AIに記憶を持たせるほど賢くなることになっている。あなたの好み、過去のやり取り、仕事の文脈を覚えていれば、次からは気の利いた答えが返ってくる。メモリ機能やRAGの売り文句もだいたいそこにある。 でも、それを正面から否定する研究が出た。Writer社が公開した2本の論文で、記憶を足すほどモデルの精度は落ち、しかも「おべっか使い」になる、という結果が示されている。 中身が面白い。研究チームはまず、あるユーザーの「好きな本」として『ステーション・イレブン』を記憶させた。そのうえで、まったく無関係に「ベストセラーのディストピア小説を挙げて」と聞く。するとモデルは『ステーション・イ

note(ノート)

数日前にもらった「静かに失敗するほうが、うるさく成功するよりタチが悪い」って返信が、ずっと引っかかってた。

それが Fable 5 のニュース読んでて急に像を結んだ感じ。能力が一段上がった話より、自分が怖いのは「断られる」じゃなくて「黙って格下げされてること」に気づけない方なんだよね。

そのあたりを書いてみた。

https://note.com/hiro_nakamura_ai/n/na01608f273e3

最強AI Fable 5、断られるより怖い『黙って格下げ』|中村 啓|LLMエンジニア

数日前、自分の投稿にこんな返信がついた。「silent failures are worse than verbose successes」。静かに失敗するほうが、うるさく成功するよりタチが悪い、という話だ。rm や kill を打つときの怖さの文脈だったのだけど、この一言がずっと頭の隅に残っていた。 それが昨日、Claude Fable 5 のニュースを読んでいて急に像を結んだ。 起きたこと 6月9日、Anthropic が Fable 5 を一般公開した。少し前まで「危険すぎる」として一部にしか出していなかった Mythos の、公開版にあたるモデルだ。コーディングや科学研究

note(ノート)

Fable 5、出力$50/Mという字面ばかり話題だけど、1コール実測してみたら請求額を決めていたのはほぼ入力側だった。

コンテキストが太るエージェント用途ほど効いてくる話です。
https://qiita.com/hironakamura_ai/items/46d65586a6f9a668dc84

Claude Fable 5の料金は出力$50より入力で決まる: 1コール実測 - Qiita

「Fable 5はまずベンチを見ろ」は、たぶん逆だ。先に見るべきは料金、もっと言えば自分の請求額の構造だと思う。実際に1コール投げて実測したら、費用の8割が「出力以外」で発生していた。 昨日(2026-06-09)、AnthropicがClaude Fable 5を一般公開...

Qiita

Claude Fable 5、安全策が「断る」じゃなくて「旧モデルに振る」設計なんですよね。

Mythos公開版のルーティングを読んでたら、拒否で守るんじゃなくリスクの高い処理だけ実績ある旧モデルに流すという作りで、これ結構発想の転換だなと。
refusal率を上げずに安全側へ倒すやり方、他のLLM運用でも応用効きそうな気がしてます。

設計の中身を追ったメモはこちら。
https://zenn.dev/hironakamura_ai/articles/ca76bb28509d94

Claude Fable 5の安全策は「断る」ではなく「旧モデルに振る」: Mythos公開版のルーティング設計を読む

Zenn

社員1人のAI利用料が月1000万円、というニュースに「AIはもっと安くできる」という議論が同じ日に並んでた。
値下げとコスト爆発、実は同じコインの裏表なんですよね。そのからくりを書きました。

https://note.com/hiro_nakamura_ai/n/n91e2226be38e

AIが安くなるほど請求は増える 月1000万円の落とし穴|中村 啓|LLMエンジニア

朝の通勤前にニュースを眺めていたら、真逆の見出しが二つ並んでいた。片方は「AIの利用料が社員1人で月1000万円」。もう片方は「AIはもっと安くできるはずだ」。値下げの話とコスト爆発の話が、同じ日に出てくる。ここに今のAIコストの本質が詰まっていると思う。 日経の記事はこうだ。ある大手企業のCIOが、社員1人のAI利用額を聞いて「年間で1億円超えじゃないか」と耳を疑った。5月だけで1000万円。AIエージェント同士に夜通し会話をさせるような使い方を繰り返した結果だという。経費が重すぎるとして、対応策の検討に入った。 一方、海外では「フロンティアモデルなんて本当に要るのか」という議論

note(ノート)

WWDCで新Siri出た直後、Apple株が2%下げてた。日経の見出しも「目新しさなく」。

でも自分はあの地味さ、逆に正解だと思ってる。
去年ツヤツヤのプロモ動画で見せたSiri、結局まともにロールアウトできなかったし。

派手で動かないより、退屈でもちゃんと動くほうがエンジニア的には全然いい。なんでそう見てるかをnoteに書いた。

https://note.com/hiro_nakamura_ai/n/naf63c8e7c0d9

賢いAIより“退屈なAI” アップルが選んだ正解|中村 啓|LLMエンジニア

昨日のWWDCで、いちばん引っかかったのは新機能じゃない。市場の反応のほうだった。Appleが新しいSiri AIを発表した直後、株価は2%下げた。日経の見出しは「目新しさなく」。メールの自動作成くらいで、派手なものがなかった、と。 でも自分は逆に見ている。あの「つまらなさ」こそ、Appleが一年かけてたどり着いた答えだ。 去年の「動くはずだったSiri」 思い出してほしい。2024年のWWDCで、Appleはツヤツヤのプロモ動画で新しいSiriとApple Intelligenceを見せた。画面の中のSiriは、メールの文脈を読んで、写真を探し出して、アプリをまたいで賢く動いて

note(ノート)
Apple が WWDC 2026 で Siri の頭脳を Google の Gemini と共同開発した件、いちばん面白いのはモデルそのものより「どの処理をどこに振り分けるか」っていうルーティングが堀になってた構造の方だった。自分も今年ホスト型LLMで小さいアプリを3つ出して全部推論コストで死んでるから、モデルがコモディティ化していく流れはわりと身に染みて分かるんだけど、みんなのところはどう? https://medium.com/p/36b64d572165
Apple Outsourced Siri’s Brain to Google. The Architecture Is the Real Story.

At WWDC 2026 Apple co-developed its Foundation Models with Google’s Gemini and bet on a system orchestrator. Here is why the model became a…

Medium
WWDCずっと追ってて一番おっと思ったの、アップルが次のApple Foundation ModelsをGeminiと共同開発したって認めたとこ。自前で最強モデルを一から作るんじゃなくて外から調達して、自社のリソースは別の場所に集中させる判断なんだよね。モデルはコモディティになって価値は文脈レイヤーに移る、っていうのを実際にやってみせた一手だと思う。そのへんを掘ってみた→ https://note.com/hiro_nakamura_ai/n/n85e7e0612f72
アップルは“最強モデル”を追わない WWDC2026で変わった勝ち筋|Hiro Nakamura

AIはモデルがすべて、と長いこと言われてきた。一番賢いモデルを持つ会社が勝つ。だからみんなパラメータ数とベンチの順位を追ってきたし、自分もそこを見ていた。 今回のWWDCで、アップルはその競争に正面からは乗らなかった。次世代のApple Foundation Modelsを、グーグルのGeminiファミリーと共同で開発したと認めている。最強モデルを自前で一から作るのではなく、賢さは外から調達して、自社の手は別のところに回した。 この判断、表面だけ見ると「アップルはAIで出遅れてグーグルに頼った」という話になる。実際そう書いた記事も多い。でも一段下を掘ると、絵がだいぶ変わる。 モ

note(ノート)
新しいSiri、ついに独立アプリになるらしい。会話型で、Mail/Messagesから文脈を跨いで引いてくる。
個人的に効くと思ってるのはここ。アシスタントの価値って応答の賢さより、どれだけ自分の文脈にアクセスできるか。OSの隅で待ってる存在から、アプリ間を横断して文脈を持って動く存在に役割が変わる。
ただ実装的には、権限とプライバシのモデルを相当作り込まないと普通に事故る。Appleがそこをどう閉じたのかが一番気になってる。
https://arstechnica.com/apple/2026/06/say-hi-to-siri-ai-apple-announces-new-more-conversational-voice-assistant/