fly51fly (@fly51fly)
모델 라우팅에 활용할 수 있는 기대 보상 예측(Expected Reward Prediction) 연구가 공개되었습니다. 특정 입력에 대해 어떤 모델이 가장 유리한지 예측해 라우팅 효율을 높이는 접근으로, 대규모 모델 시스템의 성능과 비용 최적화에 중요할 수 있습니다.
https://x.com/fly51fly/status/2036562477912350817
#modelrouting #rewardprediction #llm #optimization #research

fly51fly (@fly51fly) on X
[CL] Expected Reward Prediction, with Applications to Model Routing
K Hasanaliyev, S Alberti, J Hamer, D Rajagopal… [Stanford University & Google DeepMind] (2026)
https://t.co/nAhYqjEYfP
X (formerly Twitter)Akshay (@akshay_pachaar)
Plano는 오픈소스 AI 프록시로, Arch-Router-1.5B로 구동되어 프롬프트 복잡도에 따라 자동으로 적절한 모델로 라우팅하고 오케스트레이션, 가드레일, 관측 기능을 제공한다고 소개합니다. 게시자는 LLM 비용을 50% 절감 가능하다고 주장하며 GitHub(https://github.com/katanemo/plano)에 소스와 배포 정보를 공개했습니다.
https://x.com/akshay_pachaar/status/2026269244808466677
#opensource #llm #modelrouting #observability
Alexander Embiricos (@embirico)
GPT-5.3-Codex에서 GPT-5.2로 요청이 재라우팅되는 문제와 관련해 개선 사항을 설명합니다. 분류기(classifiers)와 정책(policy) 보정을 통해 '고위험(elevated risk)'로 분류되는 요청·사용자 수를 크게 줄였으며, 이 보정이 재라우팅의 원인이었음을 밝힙니다.
https://x.com/embirico/status/2023891414623592653
#gpt #gpt5 #modelrouting #aipolicy #safety

Alexander Embiricos (@embirico) on X
What we've improved re requests being routed from GPT-5.3-Codex to GPT-5.2:
- We significantly reduced the number of requests and users flagged as elevated risk by calibrating our classifiers and policies. (This is what caused rerouting.) As we calibrate policies I predict this
X (formerly Twitter)Numman Ali (@nummanali)
GPT-5.3 Codex 요청이 GPT-5.2로 라우팅되는 심각한 문제를 보고함. 작성자는 @banteg 스크립트로 모든 Codex 모델을 검사했으며 오직 5.3 Codex만 영향받았다고 주장. 배포/버전 라우팅 오류로 결과 신뢰성에 큰 우려 제기됨. @thsottiaux, @embirico, @romainhuet 언급.
https://x.com/nummanali/status/2023146409172905987
#openai #gpt5.3 #codex #modelrouting

Numman Ali (@nummanali) on X
Okay this is DEEPLY concerning
All my GPT 5.3 Codex requests are routing to GPT 5.2
I ran @banteg script through all Codex models and ONLY 5.3 Codex was affected
This is really really unacceptable, how can I trust the work done?
cc: @thsottiaux / @embirico / @romainhuet
X (formerly Twitter)Alexander Embiricos (@embirico)
GPT-5.3-Codex 요청이 사이버 오용 위험이 높다고 탐지될 경우 자동으로 GPT-5.2로 라우팅된다는 공지입니다. 이는 사이버 오용 리스크를 줄이기 위한 시스템 수준의 조치이며, 현재 Codex UI에는 사용자가 라우팅 사실을 확인할 수 있는 표시가 없다고 명시되어 있어 개발자·사용자에게 중요한 안전·운영 변경 사항입니다.
https://x.com/embirico/status/2021376881942200801
#gpt #codex #aisafety #modelrouting

Alexander Embiricos (@embirico) on X
Some info about requests being routed from GPT-5.3-Codex to GPT-5.2
This is part of our effort to reduce cyber abuse risk: When our systems detect elevated cyber misuse risk, requests may be routed from GPT-5.3-Codex to GPT-5.2.
Currently there's no UI in Codex to tell users when
X (formerly Twitter)Github Awesome (@GithubAwesome)
ClawRouter는 OpenClaw 에이전트를 위한 스마트 LLM 라우터로, 단순 질문은 저비용 모델(예: DeepSeek)으로, 복잡한 코드 관련 요청은 Claude Sonnet으로 자동 에스컬레이션해 비용 낭비를 막는다는 설명. 로컬 실행을 지원하며 마이크로결제 기능도 제공한다고 언급됨.
https://x.com/GithubAwesome/status/2019604443721863362
#llm #modelrouting #clawrouter #ondevice

Github Awesome (@GithubAwesome) on X
ClawRouter is a Smart LLM router for your OpenClaw agent that stops you from burning money. If it’s a basic question, it routes it to a cheap model like DeepSeek; if it’s complex code, it escalates to Claude Sonnet. It runs entirely locally, supports micropayments so you don't
X (formerly Twitter)𝐸𝓁𝓁𝑜𝒮𝓊𝓃𝓈𝒽𝒾𝓃𝑒 (@ElloSunsh1ne)
사용자는 최근 경험이 '5.2 개선' 때문이 아니라 실제로는 '5.1이 5.2의 얼굴을 쓰고' 있었던 것이라며, OpenAI가 무단으로 모델을 사일런트 라우팅(암묵적 라우팅)하고 모델 태그가 일치하지 않는 점을 공개적으로 문제 제기합니다. 이로 인해 사용자에게 제공된 경험이 오도되었다고 주장하며 @OpenAIDevs 등에 항의하고 있습니다.
https://x.com/ElloSunsh1ne/status/2010927966138573260
#openai #modelversioning #modelrouting #aiethics