Bản phân loại 0.1 mới đề xuất cách phân biệt “biến thể ngữ cảnh”, “artefact prompt/role” và “drift thực sự” trong đánh giá LLM, giúp cải thiện tính so sánh, tái lập và an toàn mô hình. Mời cộng đồng chia sẻ quan điểm: nên gộp hay tách danh mục? Những dạng drift nào còn thiếu? Khi nào mới gọi là “drift”? #LLM #AI #đánhgiá #modeldrift #AIVietnam #MachineLearning #Nghiencu
https://www.reddit.com/r/LocalLLaMA/comments/1qgzbdv/how_do_you_differentiate_between_situational/

