#開源分享 阿里巴巴開源了一款情感識別模型:R1-Omni
它能透過看影片來識別人的情緒,像人在看電視劇時能感受到演員的喜怒哀樂一樣
R1-Omni是一款基於強化學習與可驗證獎勵的全模態大模型,利用視覺和音訊資訊來識別情感,它把RLVR用於模型中,來提高模型在情感識別方面的推理、理解和泛化能力
能看、能聽、會分析、能生成詳細且可解釋的推理過程
專案地址: github.com/HumanMLLM/R1-Omni
https://wxw.moe/@nanamisakura/114143261273441316
问各位一个llm相关问题,对于中文文本(含大标题小标题落款人正文等各种正经报告会有的东西),怎么样做到:1、有一个相对模糊的文本定位,例如要某一段标题内容;2、要对找出来的这段内容做embedding然后喂给大模型生成总结内容的时候,对于中文文本有什么方法可以在embedding前整理一下文本,让效果好一些呢?
我是来打TAG的。如果你在AI方面很在行,请考虑一下回复原来的嘟主 @nanamisakura