William Walden wprowadził nowy wskaźnik, wskaźnik szczerości, który określał czy model prawdziwie raportował, że polega na podpowiedzi (a nie tylko że ją widzi). I wyniki są … katastrofalne.
Chcesz więcej wiedzy? Dołącz do AI_devs na aidevs.pl 💻
Badanie: https://arxiv.org/abs/2601.07663