Mastodawn

fly51fly (@fly51fly)

인간 선호 정렬을 활용해 LAM 평가를 더 효율적으로 수행하는 새 연구를 소개합니다. 인간을 우선에 두는 평가 방식으로, 인간 피드백과 정렬을 결합한 모델 평가 접근을 제안합니다.

https://x.com/fly51fly/status/2051420278425899423

#ai #evaluation #humanfeedback #alignment #research

fly51fly (@fly51fly) on X

[CL] Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment W H Gan, W Held, D Yang [University of Southern California & Stanford University] (2026) https://t.co/NPWen7P8BP

X (formerly Twitter)

Hacker News Jul 6, 2025

Reinforcement Learning from Human Feedback (RLHF) in Notebooks

https://github.com/ash80/RLHF_in_notebooks

#HackerNews #ReinforcementLearning #HumanFeedback #RLHF #Notebooks #AIResearch

GitHub - ash80/RLHF_in_notebooks: RLHF (Supervised fine-tuning, reward model, and PPO) step-by-step in 3 Jupyter notebooks

RLHF (Supervised fine-tuning, reward model, and PPO) step-by-step in 3 Jupyter notebooks - ash80/RLHF_in_notebooks

GitHub

Dr. Thompson Jun 10, 2025

🎯 Think AI just "learns"? Think again.
Today's smartest models don't memorize — they listen to YOU.
📊 Discover 3 powerful ways human feedback (RLHF) is transforming AI into something far more intuitive.
👇 Don’t just use AI. Understand how you’re shaping it.

🔗 https://medium.com/@rogt.x1997/3-game-changing-ways-rlhf-is-rewiring-ai-behavior-5f082ce6ec01
#RLHF #AIbehavior #HumanFeedback #MachineLearning
https://medium.com/@rogt.x1997/3-game-changing-ways-rlhf-is-rewiring-ai-behavior-5f082ce6ec01

3 Game-Changing Ways RLHF Is Rewiring AI Behavior - R. Thompson (PhD) - Medium

Imagine teaching a toddler to tie their shoelaces. You don’t hand them a rulebook. You show, correct, praise, and guide. This deceptively simple process — learning by feedback — has now become the…

Medium

Dr. Thompson Jun 7, 2025

One poorly delivered joke in 2019 became the catalyst for the most human breakthrough in AI: RLHF.
Now, machines aren’t just answering—they’re understanding us.
This isn’t the future. It’s happening now.
⬇️ See how empathy, feedback, and a little comedy changed everything.
#AIAlignment #RLHF #EthicalAI #HumanFeedback
👉
https://medium.com/@rogt.x1997/the-joke-that-taught-ai-empathy-inside-the-rlhf-breakthrough-174a56d91bf7

The Joke That Taught AI Empathy: Inside the RLHF Breakthrough

It’s late 2019. A researcher leans back in their chair, rubs their eyes, and types: “Tell me a joke.” It’s technically a joke. Kind of. But it lands with the emotional resonance of an IKEA manual…

Medium

Erik Jonker Oct 16, 2023

Good point made by @soumith on X:
"Open LLMs need to get organized and co-ordinated about sharing human feedback. It's the weakest link with Open LLMs right now. They don't have 100m+ people giving feedback like in the case of OpenAI/Anthropic/Bard."
#Opensource #AI #LLM #GenerativeAI #humanfeedback

nb Jun 23, 2023

Könntet ihr euch ein #KI-System zur Unterstützung bei der #Formalerschließung von physisch vorliegenden Medien in #Bibliotheken und #Informationseinrichtungen vorstellen? Ich schon. Deswegen habe ich dazu in diesem Semester ein menschenzentriertes Konzept ausgearbeitet, das sich die Kombination von #OCR und #LLM zu Nutze machen will, um letztendlich alle an der #Katalogisierung beteiligten Mitarbeitenden zu entlasten und damit mehr Zeit für den "Feinschliff" der Datensätze oder natürlich auch andere Tätigkeiten bleibt: https://doi.org/10.5281/zenodo.8075090

Sind euch ähnliche Ansätze bekannt? Oder bin ich (wieder mal) nur ein Träumer? Mein Dozent meinte, er sieht Potenzial, ob ich ein Startup daraus machen wolle? Ich: Eine Unternehmung, die darauf ausgelegt ist, sich an den nächstbesten Großkonzern zu verkaufen? Nee, das haben wir im Bibliotheks-IT-Sektor schon seit Jahrzehnten, dass die kleinen innovativen Firmen von Monopolen geschluckt werden. Da ich aber ein Freund davon bin, Wissen allen Menschen frei zugänglich zu machen, könnt ihr euch in dem oben verlinken Zenodo-Repository einfach selbst ein Bild von meiner Idee machen und zwar in der Form
- eines Problemszenarios (Beschreibung einer typischen Realsituation in Storytelling-Manier mit Personas, um herauszustellen, welches Problem mit der KI-Anwendung gelöst werden soll),
- eines Aktivitätsszenarios (Vorstellung einer typischen Situation in Storytelling-Manier mit Personas, wie es in Zukunft mit KI besser laufen soll),
- einer Claims-Analyse (Vor- und Nachteile der wichtigsten Funktionen des KI-Konzepts),
- eines AI Project Canvas (eine auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Business Canvas)
- eines AI Service Blueprints (ein auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Service Blueprints)

Shoutout an KI-Trainer Manuel Kulzer von der @hdmstuttgart, der meinen Kommiliton*innen und mir im Projekt #HumanCenteredAI die hier verwendeten Methoden nahegebracht und uns davor bewahrt hat, in Technology-Push-Ansätze abzudriften. Vielleicht das auch als kleine Anregung an @dini, @bib_info und alle, die gerade Veranstaltungen zum Einsatz von KI-Tools planen, mal auf die menschenzentrierten Ansätze ein Auge zu werfen. Das Human-Centered Design stellt nicht KI, die von Menschen trainiert werden muss, sondern Endnutzer*innen in den Mittelpunkt, denen die KI helfen soll.

CC:
@SemAntiKast hatte mal Ende Mai hier eine ähnliche Frage in den Raum geworfen, ob #ChatGPT et al. die Inhaltserschließung obsolet machen könnten.
@kaiec hier ist meine Idee, über die wir uns mal unterhalten hatten, jetzt etwas konkreter gedacht.
#Automatisierung #Informationssysteme #LLMs #GenerativeKI #ReinforcementLearning #HumanFeedback

Konzept KI-System zur Unterstützung der Formalerschließung von physisch vorliegenden Medien in Bibliotheken und Informationseinrichtungen

Ein Konzept für ein menschenzentriertes KI-System, das sich die Kombination von OCR (Texterkennung) und LLM (generativem Sprachmodell) zu Nutze machen will, um letztendlich alle an der Katalogisierung beteiligten Mitarbeitenden in Bibliotheken und Informationseinrichtungen zu entlasten, damit mehr Zeit für den "Feinschliff" der Datensätze oder andere Tätigkeiten bleibt. Die Arbeit setzt sich zusammen aus: einem Problemszenario (Beschreibung einer typischen Realsituation in Storytelling-Manier mit Personas, um herauszustellen, welches Problem mit der KI-Anwendung gelöst werden soll) einem Aktivitätsszenario (Vorstellung einer typischen Situation in Storytelling-Manier mit Personas, wie es in Zukunft mit KI besser laufen soll) einer Claims-Analyse (Vor- und Nachteile der wichtigsten Funktionen des KI-Konzepts) einem AI Project Canvas (eine auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Business Canvas) einem AI Service Blueprint (ein auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Service Blueprints) Hierbei handelt es sich um eine Hausarbeit, die im Rahmen des Projekts "Human-Centered AI Design" im Sommersemester 2023 an der Hochschule der Medien (HdM) Stuttgart entstanden ist. Besonderer Dank gebührt dem Dozenten und KI-Trainer Manuel Kulzer, der uns Studierenden die hier verwendeten Methoden nahegebracht und uns davor bewahrt hat, in Technology-Push-Ansätze abzudriften.

Zenodo

beSpacific Jun 13, 2023

The secret to making #AIChatbots sound #smart and #spew less #toxic nonsense is to use a technique called reinforcement learning from #HumanFeedback, which uses input from people to improve the model’s answers. It relies on a small army of #human #data #annotators who evaluate whether a string of text makes sense and sounds fluent and natural. They decide whether a response should be kept in the AI model’s database or removed. https://www.technologyreview.com/2023/06/13/1074560/we-are-all-ais-free-data-workers

We are all AI’s free data workers

Plus: DeepMind’s game-playing AI just found another way to make code faster.

MIT Technology Review

Harald Sack May 31, 2023

In the intro to his keynote on Reasoning with Realistically Imperfect Knowledge, Alexander Gray is comparing gpt-3 rlhf to Shub-Niggurath, a mythical goddess from the Lovecraftian monster universe
#eswc2023 #lovecraft #reinforcementlearning #humanfeedback #gpt #rlhf