论文试图解决如何有效整合多样化基础模型(如不同架构或闭源API的LLMs)以实现协同推理的问题。由于现有方法如权重合并受限于模型结构不匹配和无法访问内部参数,难以灵活组合多个大模型的能力。该问题在当前多模型协作需求日益增长的背景下具有现实意义,并非全新问题,但挑战依然显著。 #机器学习 #多模态大模型 #Agent https://hub.baai.ac.cn/paper/a9b0adf4-cf1c-473b-bba6-ce41153be648
TRINITY: An Evolved LLM Coordinator - 智源社区论文

结合多种基础模型具有广阔前景,但权重融合方法受限于架构不匹配和封闭的API。Trinity通过引入一个轻量级协调器来解决这一问题,该协调器可组织多个大语言模型(LLM)协同工作。该协调器由一个紧凑型语言模型(约0.6B参数)和一个轻量级输出...