*edit* Video Format optimiert

Das war das letzte (und einzige) Mal seit 2 Monaten, dass ich sowas machen wollte, bzw. konnte. Meine Erkrankung hat mich im Griff. Aber Kopfkino läuft, vor allem in schlaflosen Nächten wie dieser.
So Here is something from the archives.....

#nsfw #meninhighheels #meninheels #meninpantyhose #sounding #cumming #cum #selfplay

🚀🎓 Ah, the dazzling world of #AI #research strikes again! This time in the form of #PopuLoRA, where #LLMs engage in a riveting game of self-play, trying to outsmart... well, themselves. Because nothing screams 'cutting-edge' like a bunch of AI nerds teaching their digital pets to chase their own tails for "rewards." 🤖🔄💡
https://vmax.ai/team/populora-co-evolving-llm-populations-for-reasoning-self-play #SelfPlay #Innovation #HackerNews #ngated
PopuLoRA: Co-Evolving LLM Populations for Reasoning Self-⁠Play

We introduce PopuLoRA, a population-based asymmetric self-play framework for reinforcement learning with verifiable rewards (RLVR) post-training of LLMs.

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self-⁠Play

We introduce PopuLoRA, a population-based asymmetric self-play framework for reinforcement learning with verifiable rewards (RLVR) post-training of LLMs.

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

Возможно я был недостаточно внимателен, но мне попалось на Хабре буквально одно, очень краткое упоминание крайне интересного исследования от команды из Университета Цинхуа и партнерских институтов нескольких стран: Absolute Zero Reasoner (AZR) — новую систему машинного обучения, которая развивает принципы self-play и способна обучаться без каких-либо внешних данных. В отличие от традиционных подходов, требующих тысячи размеченных примеров, AZR использует принцип самообучения через создание и решение собственных задач программирования. Система играет две роли одновременно: составителя задач (Proposer) и решателя (Solver), используя исполнитель кода как объективного судью для получения обратной связи. AZR продемонстрировал state-of-the-art результаты в программировании и математических рассуждениях, превзошедший модели, обученные на десятках тысяч человеческих примеров, при этом показав впечатляющий кросс-доменный перенос знаний между различными областями знаний.

https://habr.com/ru/articles/916316/

#Absolute_Zero_Reasoner #AZR #машинное_обучение_без_данных #самообучающийся_ИИ #selfplay #безопасность_ИИ #AI_safety

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

ИИ, который учится без данных: как Absolute Zero Reasoner меняет машинное обучение Представьте ИИ, который не нуждается в миллионах размеченных примеров, не требует армии разметчиков из Кении , и...

Хабр
Behold, a groundbreaking research paper on "absolute zero reasoning" 🤯—which is fitting, because it offers absolutely zero reasons to read it. A parade of authors assembled to make sure you don't understand a single word of it, featuring enough prestigious affiliations to make your head spin faster than their "reinforced #selfplay." 🎯
https://andrewzh112.github.io/absolute-zero-reasoner/ #absolutezeroreasoning #groundbreakingresearch #confusingpapers #academia #HackerNews #ngated
Absolute Zero Reasoner