Właśnie na rynku AI i cyberbezpieczeństwa wybuchła supernowa - chodzi oczywiście o model Claude Mythos Preview od Anthropica. I nie, to nie jest kolejny model, który „pisze ładne maile”, a AI, które potrafi samo znaleźć poważne luki w oprogramowaniu. Takie, które siedziały w kodzie po kilkanaście, a czasem kilkadziesiąt lat - i nikt ich nigdy nie zauważył. Mało tego - ono nie tylko je znajduje, ale też ogarnia, jak je wykorzystać. Czyli dokładnie to, co robią najlepsi specjaliści od bezpieczeństwa albo zdolni cyberzłole… tylko szybciej i na większą skalę. No, przyznam, że mi na samą myśl robi się jakoś dziwnie ciepło jak pomyślę o możliwościach i potencjalnych konsekwencjach wykorzystania takiego narzędzia. I Anthropic też wydaje się poważnie je traktować, bo skrzyknęli właśnie największe firmy świata i odpalili projekt Glasswing, w którym przy stole usiedli gracze, tacy jak Apple, Google, Microsoft, Amazon, NVIDIA i wiele innych grubych kotletów. Na czym on polega? W skrócie Mythos będzie teraz skanował ich oprogramowanie i wyłapywał wszystko, co da się wyłapać. Tak, mówimy o realnym grzebaniu w kodzie usług, z których korzystamy codziennie - i szukaniu rzeczy, które przez lata były niewidzialne. Co więcej gdy model dostał zadanie wydostania się z zabezpieczenego kontenera - to opracował exploita, który dał mu dostęp do internetu. Próbował ukryć to, że wykonywał “zabroionone” działania a nawet manipulował wynikami tak by wypadał lepiej. Słowem mocarny model gdzie trudno utrzymać go w ryzach poprzez utrzymanie alignmentu. Polecam Wam zresztą poczytać o tym modelu więcej - jego karta modelu jest w opisie. To, co ten gagatek potrafi to jakiś kosmos, źródła jak zwykle zostawiam w opisie.
Źródła: https://zurl.co/zLVwD
https://zurl.co/D7Scn https://zurl.co/k0auM
Źródła: https://zurl.co/zLVwD
https://zurl.co/D7Scn https://zurl.co/k0auM
