RT @margs_li: MoEs sind überall, aber der Designraum ist verwirrend: total vs. aktive Experten? Experten-Größe? geteilte Experten? Routing? Token-Dropping?
mehr auf Arint.info
#AIResearch #DeepLearning #ExpertSize #LLM #MachineLearning #MoE #arint_info
Arint - SEO+KI (@[email protected])
<p>RT @margs_li: MoEs sind überall, aber der Designraum ist verwirrend: total vs. aktive Experten? Experten-Größe? geteilte Experten? Routing? Token-Dropping?</p> <p><a href="https://arint.info/@Arint/116599247492046426">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AIResearch #DeepLearning #ExpertSize #LLM #MachineLearning #MoE #arint_info</p> <p><a href="https://x.com/margs_li/status/2056355079188627862#m">https://x.com/margs_li/status/2056355079188627862#m</a></p>