GitHub - ash80/RLHF_in_notebooks: RLHF (Supervised fine-tuning, reward model, and PPO) step-by-step in 3 Jupyter notebooks

RLHF (Supervised fine-tuning, reward model, and PPO) step-by-step in 3 Jupyter notebooks - ash80/RLHF_in_notebooks

GitHub

🎯 Think AI just "learns"? Think again.
Today's smartest models don't memorize — they listen to YOU.
📊 Discover 3 powerful ways human feedback (RLHF) is transforming AI into something far more intuitive.
👇 Don’t just use AI. Understand how you’re shaping it.

🔗 https://medium.com/@rogt.x1997/3-game-changing-ways-rlhf-is-rewiring-ai-behavior-5f082ce6ec01
#RLHF #AIbehavior #HumanFeedback #MachineLearning
https://medium.com/@rogt.x1997/3-game-changing-ways-rlhf-is-rewiring-ai-behavior-5f082ce6ec01

3 Game-Changing Ways RLHF Is Rewiring AI Behavior - R. Thompson (PhD) - Medium

Imagine teaching a toddler to tie their shoelaces. You don’t hand them a rulebook. You show, correct, praise, and guide. This deceptively simple process — learning by feedback — has now become the


Medium
One poorly delivered joke in 2019 became the catalyst for the most human breakthrough in AI: RLHF.
Now, machines aren’t just answering—they’re understanding us.
This isn’t the future. It’s happening now.
âŹ‡ïž See how empathy, feedback, and a little comedy changed everything.
#AIAlignment #RLHF #EthicalAI #HumanFeedback
👉
https://medium.com/@rogt.x1997/the-joke-that-taught-ai-empathy-inside-the-rlhf-breakthrough-174a56d91bf7
The Joke That Taught AI Empathy: Inside the RLHF Breakthrough

It’s late 2019. A researcher leans back in their chair, rubs their eyes, and types: “Tell me a joke.” It’s technically a joke. Kind of. But it lands with the emotional resonance of an IKEA manual


Medium
Good point made by @soumith on X:
"Open LLMs need to get organized and co-ordinated about sharing human feedback. It's the weakest link with Open LLMs right now. They don't have 100m+ people giving feedback like in the case of OpenAI/Anthropic/Bard."
#Opensource #AI #LLM #GenerativeAI #humanfeedback
Könntet ihr euch ein #KI-System zur UnterstĂŒtzung bei der #Formalerschließung von physisch vorliegenden Medien in #Bibliotheken und #Informationseinrichtungen vorstellen? Ich schon. Deswegen habe ich dazu in diesem Semester ein menschenzentriertes Konzept ausgearbeitet, das sich die Kombination von #OCR und #LLM zu Nutze machen will, um letztendlich alle an der #Katalogisierung beteiligten Mitarbeitenden zu entlasten und damit mehr Zeit fĂŒr den "Feinschliff" der DatensĂ€tze oder natĂŒrlich auch andere TĂ€tigkeiten bleibt: https://doi.org/10.5281/zenodo.8075090

Sind euch Ă€hnliche AnsĂ€tze bekannt? Oder bin ich (wieder mal) nur ein TrĂ€umer? Mein Dozent meinte, er sieht Potenzial, ob ich ein Startup daraus machen wolle? Ich: Eine Unternehmung, die darauf ausgelegt ist, sich an den nĂ€chstbesten Großkonzern zu verkaufen? Nee, das haben wir im Bibliotheks-IT-Sektor schon seit Jahrzehnten, dass die kleinen innovativen Firmen von Monopolen geschluckt werden. Da ich aber ein Freund davon bin, Wissen allen Menschen frei zugĂ€nglich zu machen, könnt ihr euch in dem oben verlinken Zenodo-Repository einfach selbst ein Bild von meiner Idee machen und zwar in der Form
- eines Problemszenarios (Beschreibung einer typischen Realsituation in Storytelling-Manier mit Personas, um herauszustellen, welches Problem mit der KI-Anwendung gelöst werden soll),
- eines AktivitÀtsszenarios (Vorstellung einer typischen Situation in Storytelling-Manier mit Personas, wie es in Zukunft mit KI besser laufen soll),
- einer Claims-Analyse (Vor- und Nachteile der wichtigsten Funktionen des KI-Konzepts),
- eines AI Project Canvas (eine auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Business Canvas)
- eines AI Service Blueprints (ein auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Service Blueprints)

Shoutout an KI-Trainer Manuel Kulzer von der @hdmstuttgart, der meinen Kommiliton*innen und mir im Projekt #HumanCenteredAI die hier verwendeten Methoden nahegebracht und uns davor bewahrt hat, in Technology-Push-AnsÀtze abzudriften. Vielleicht das auch als kleine Anregung an @dini, @bib_info und alle, die gerade Veranstaltungen zum Einsatz von KI-Tools planen, mal auf die menschenzentrierten AnsÀtze ein Auge zu werfen. Das Human-Centered Design stellt nicht KI, die von Menschen trainiert werden muss, sondern Endnutzer*innen in den Mittelpunkt, denen die KI helfen soll.

CC:
@SemAntiKast hatte mal Ende Mai hier eine Ă€hnliche Frage in den Raum geworfen, ob #ChatGPT et al. die Inhaltserschließung obsolet machen könnten.
@kaiec hier ist meine Idee, ĂŒber die wir uns mal unterhalten hatten, jetzt etwas konkreter gedacht.
#Automatisierung #Informationssysteme #LLMs #GenerativeKI #ReinforcementLearning #HumanFeedback
Konzept KI-System zur UnterstĂŒtzung der Formalerschließung von physisch vorliegenden Medien in Bibliotheken und Informationseinrichtungen

Ein Konzept fĂŒr ein menschenzentriertes KI-System, das sich die Kombination von OCR (Texterkennung) und LLM (generativem Sprachmodell) zu Nutze machen will, um letztendlich alle an der Katalogisierung beteiligten Mitarbeitenden in Bibliotheken und Informationseinrichtungen zu entlasten, damit mehr Zeit fĂŒr den "Feinschliff" der DatensĂ€tze oder andere TĂ€tigkeiten bleibt. Die Arbeit setzt sich zusammen aus: einem Problemszenario (Beschreibung einer typischen Realsituation in Storytelling-Manier mit Personas, um herauszustellen, welches Problem mit der KI-Anwendung gelöst werden soll) einem AktivitĂ€tsszenario (Vorstellung einer typischen Situation in Storytelling-Manier mit Personas, wie es in Zukunft mit KI besser laufen soll) einer Claims-Analyse (Vor- und Nachteile der wichtigsten Funktionen des KI-Konzepts) einem AI Project Canvas (eine auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Business Canvas) einem AI Service Blueprint (ein auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Service Blueprints) Hierbei handelt es sich um eine Hausarbeit, die im Rahmen des Projekts "Human-Centered AI Design" im Sommersemester 2023 an der Hochschule der Medien (HdM) Stuttgart entstanden ist. Besonderer Dank gebĂŒhrt dem Dozenten und KI-Trainer Manuel Kulzer, der uns Studierenden die hier verwendeten Methoden nahegebracht und uns davor bewahrt hat, in Technology-Push-AnsĂ€tze abzudriften.

Zenodo
The secret to making #AIChatbots sound #smart and #spew less #toxic nonsense is to use a technique called reinforcement learning from #HumanFeedback, which uses input from people to improve the model’s answers. It relies on a small army of #human #data #annotators who evaluate whether a string of text makes sense and sounds fluent and natural. They decide whether a response should be kept in the AI model’s database or removed. https://www.technologyreview.com/2023/06/13/1074560/we-are-all-ais-free-data-workers
We are all AI’s free data workers

Plus: DeepMind’s game-playing AI just found another way to make code faster.

MIT Technology Review
In the intro to his keynote on Reasoning with Realistically Imperfect Knowledge, Alexander Gray is comparing gpt-3 rlhf to Shub-Niggurath, a mythical goddess from the Lovecraftian monster universe
#eswc2023 #lovecraft #reinforcementlearning #humanfeedback #gpt #rlhf