Mastodawn

fly51fly (@fly51fly)

Microsoft Research Asia와 Peking University 공동 저자들이 발표한 논문 'Learning to Draft: Adaptive Speculative Decoding with Reinforcement Learning'는 강화학습을 활용한 적응적 speculative decoding 접근을 제안하는 연구입니다(ArXiv, 2026). 디코딩 속도·품질 향상 관련 새로운 방법론을 다룹니다.

https://x.com/fly51fly/status/2028956988995190960

#speculativedecoding #reinforcementlearning #llm #research

fly51fly (@fly51fly) on X

[CL] Learning to Draft: Adaptive Speculative Decoding with Reinforcement Learning J Zhang, Z Yu, L Wang, N Yang… [Microsoft Research Asia & Peking University] (2026) https://t.co/OTxG6Fydal

X (formerly Twitter)