Zespół Qwen z Grupy Alibaba wprowadził nową metodę uczenia przez wzmacnianie (FIPO), która pozwala modelom AI na głębszą weryfikację własnych procesów myślowych. Dzięki temu, łańcuchy rozumowania ulegają wydłużeniu, a maszyny zaczynają samodzielnie kwestionować i sprawdzać swoje wyniki.
#si #ai #sztucznainteligencja #wiadomości #informacje #technologia
https://aisight.pl/technologia/generatywna-ai/reasoning/alibaba-fipo-modeli-rozumujacych/

Alibaba przełamuje szklany sufit modeli rozumujących. Algorytm FIPO uczy AI autorefleksji
Zespół Qwen z Grupy Alibaba wprowadził nową metodę uczenia przez wzmacnianie (FIPO), która pozwala modelom AI na głębszą weryfikację własnych procesów myślowych. Dzięki temu, łańcuchy rozumowania ulegają wydłużeniu, a maszyny zaczynają samodzielnie kwestionować i sprawdzać swoje wyniki.