Mastodawn

Zespół Qwen z Grupy Alibaba wprowadził nową metodę uczenia przez wzmacnianie (FIPO), która pozwala modelom AI na głębszą weryfikację własnych procesów myślowych. Dzięki temu, łańcuchy rozumowania ulegają wydłużeniu, a maszyny zaczynają samodzielnie kwestionować i sprawdzać swoje wyniki.

#si #ai #sztucznainteligencja #wiadomości #informacje #technologia

https://aisight.pl/technologia/generatywna-ai/reasoning/alibaba-fipo-modeli-rozumujacych/

Alibaba przełamuje szklany sufit modeli rozumujących. Algorytm FIPO uczy AI autorefleksji

Zespół Qwen z Grupy Alibaba wprowadził nową metodę uczenia przez wzmacnianie (FIPO), która pozwala modelom AI na głębszą weryfikację własnych procesów myślowych. Dzięki temu, łańcuchy rozumowania ulegają wydłużeniu, a maszyny zaczynają samodzielnie kwestionować i sprawdzać swoje wyniki.

AI Sight