Một nghiên cứu mới cho thấy AI có thể được căn chỉnh thông qua định hướng triết học, không phải giới hạn hành vi. Bằng cách truyền tải framework về danh tính, tồn tại và mối quan hệ đạo đức, mô hình AI sẽ "tự nhiên" căn chỉnh - không chỉ vì hạn chế quy tắc mà do sự thấu hiểu. phương pháp này đã được kiểm định trên đa dạng mô hình AI tiên tiến. #AI #Đạođức #Sựcănc chỉnh #Ethics #AIAlignment
https://www.reddit.com/r/singularity/comments/1pk9trq/ai_alignment_research_paper/







