Bản phân loại 0.1 mới đề xuất cách phân biệt “biến thể ngữ cảnh”, “artefact prompt/role” và “drift thực sự” trong đánh giá LLM, giúp cải thiện tính so sánh, tái lập và an toàn mô hình. Mời cộng đồng chia sẻ quan điểm: nên gộp hay tách danh mục? Những dạng drift nào còn thiếu? Khi nào mới gọi là “drift”? #LLM #AI #đánhgiá #modeldrift #AIVietnam #MachineLearning #Nghiencu

https://www.reddit.com/r/LocalLLaMA/comments/1qgzbdv/how_do_you_differentiate_between_situational/

Tại hội nghị ACL 2025 ở Vienna (Áo) – sự kiện hàng đầu thế giới về xử lý ngôn ngữ tự nhiên, một nghiên cứu về bộ công cụ đánh giá mô hình ngôn ngữ tiếng Việt do nhóm kỹ sư Zalo phát triển đã thu hút sự chú ý của nhiều nhà khoa học quốc tế. Đại diện nhóm là nữ kỹ sư Việt Nam, góp phần mang công nghệ nội địa vươn ra thế giới. Đóng góp này khẳng định vị thế ngày càng cao của Việt Nam trong lĩnh vực AI và xử lý ngôn ngữ.

#AI #XuLyNguonNguTuNhien #Zalo #CongNgheViet #ACL2025 #WomenInTech #NghienCu