#開源分享 面壁開源了其最新模型:MiniCPM-o 2.6,首個支持在 iPad等端側設備進行多模態即時流式交互的多模態模型,視覺、語音和多模態流式能力說是達到了GPT-4o-202405級別

1、總參數量 8B

2、支持可配置聲音的中英雙語語音對話,同時具備情感、語速、風格控制、端到端聲音複製、角色扮演等進階能力

3、能接受連續影片和音訊串流,進行即時語音互動。在StreamingBench上,超過了GPT-4o-202408和Claude 3.5 Sonnet

4、增強了OCR、可信行為、多語言支持和影片理解等視覺能力

專案地址: github.com/OpenBMB/MiniCPM-o

#面壁小鋼炮 #MiniCPMo #MiniCPM