In dem unten verlinkten Artikel ist die rede davon das dort mit Belohnungen und Strafen gearbeitet wird.
Wie kann man den eine Software belohnen bzw. bestrafen ?
" Reinforcement Learning – deutsch Verstärkungslernen – ist eine Lernmethode, die mit Belohnungen und Strafen arbeitet. "
#KI #AI #Lernmethoden #Strafen #Belohnen #ReinforcementLearning
https://www.scinexx.de/news/technik/blick-unter-die-haube-von-deepseek-r1/



