Mô hình AniMUL-v1, 30B tham số, được tinh chỉnh từ Qwen3-Omni để phân loại loài động vật qua âm thanh. Sử dụng dữ liệu NatureLM với 26 triệu cặp âm thanh-văn bản, huấn luyện trên 8x B200 suốt ~912 giờ. Hiệu suất vượt trội: 75% trùng khớp chính xác, tăng 61% so với mô hình gốc. Thử nghiệm tại animul.ai! #AI #MachineLearning #AudioClassification #SpeciesIdentification #TríTuệNhânTạo #PhânLoạiÂmThanh #ĐộngVật học #MôHìnhNgônNgữ
https://www.reddit.com/r/LocalLLaMA/comments/1qtf8hk/animulv1_a_30b_mo
