OpenAI giới thiệu FrontierScience – bộ kiểm tra đánh giá AI trong nghiên cứu khoa học. Tuy nhiên, có ý kiến cho rằng các benchmark hiện tại thiếu chính xác: 1) Sử dụng xHigh reasoning (tương đương GPT5.2-Pro), 2) Mô hình 5.2 tự động chuyển chế độ nhanh, dẫn đến kết quả không rõ ràng. AI hiện tại có đủ tin cậy cho nghiên cứu chuyên sâu? #AIResearch #FrontierScience #KhoaHocAI #CongNhanAI #OpenAI
https://www.reddit.com/r/singularity/comments/1po9srh/openai_introduces_frontierscience_benchmark/