🔍 Nghiên cứu phân tích 23+ mô hình từ 7 phòng thí nghiệm cho thấy đặc tính “thermodynamic” của mô hình phụ thuộc nhiều hơn vào nhà phát triển hơn là số tham số. Các mô hình EleutherAI (Pythia, GPT‑NeoX) có xu hướng giảm tín hiệu (G<1), trong khi Meta/OpenAI (LLaMA, OPT, GPT‑2) mở rộng (G>1). Fine‑tuning chỉ thay đổi độ lớn, hiếm khi đảo ngược dấu, nên việc chọn base model quan trọng. #AI #NLP #LLM #MachineLearning #Mô_hình #DeepLearning #Research #EleutherAI #Meta #LLaMA #Finetuning
https://ww