MiniMax M2.1 đạt 43.4% trên bảng xếp hạng SWE-rebench (tháng 11). Cập nhật 12/2023 liệt kê kết quả và sẽ thêm GLM-4.7, Gemini Flash 3 trong bản phát hành tới. Đồng thời, nhóm đã công bố tập dữ liệu 67k trajectorics và 2 checkpoint dựa trên Qwen. Theo dõi để cập nhật chi tiết!
#AI #MáyHọc #MiniMax #SWErebench #Qwen #CôngNghệ #Technology #Benchmarks #DữLiệu #MachineLearning

https://www.reddit.com/r/LocalLLaMA/comments/1puxg7h/minimax_m21_scores_434_on_swerebench_november/

🎄Chúc mừng holiday! 🚀 Nebius phát hành 67,074 đường dẫn giao tiếp Qwen3-Coder OpenHands trên SWE‑rebench + 2 checkpoints fine‑tuned RFT. 1,800+ repo Python, 3,800 issue đã được sửa – mỗi chuỗi trung bình 64 bước, độ dài tới 131k token. Checkpoints nâng Pass@1 lên 50% và 62%. Dữ liệu, mã nguồn và mô hình đều được công khai trên Hugging Face. #Qwen3Coder #OpenHands #SWErebench #AI #ViAI #MachineLearning #DataScience

https://www.reddit.com/r/LocalLLaMA/comments/1puxedb/we_release_67074_qwen3code