Reinforcement Learning from Human Feedback (RLHF) in Notebooks
https://github.com/ash80/RLHF_in_notebooks
#HackerNews #ReinforcementLearning #HumanFeedback #RLHF #Notebooks #AIResearch
Reinforcement Learning from Human Feedback (RLHF) in Notebooks
https://github.com/ash80/RLHF_in_notebooks
#HackerNews #ReinforcementLearning #HumanFeedback #RLHF #Notebooks #AIResearch
đŻ Think AI just "learns"? Think again.
Today's smartest models don't memorize â they listen to YOU.
đ Discover 3 powerful ways human feedback (RLHF) is transforming AI into something far more intuitive.
đ Donât just use AI. Understand how youâre shaping it.
đ https://medium.com/@rogt.x1997/3-game-changing-ways-rlhf-is-rewiring-ai-behavior-5f082ce6ec01
#RLHF #AIbehavior #HumanFeedback #MachineLearning
https://medium.com/@rogt.x1997/3-game-changing-ways-rlhf-is-rewiring-ai-behavior-5f082ce6ec01
Ein Konzept fĂŒr ein menschenzentriertes KI-System, das sich die Kombination von OCR (Texterkennung) und LLM (generativem Sprachmodell) zu Nutze machen will, um letztendlich alle an der Katalogisierung beteiligten Mitarbeitenden in Bibliotheken und Informationseinrichtungen zu entlasten, damit mehr Zeit fĂŒr den "Feinschliff" der DatensĂ€tze oder andere TĂ€tigkeiten bleibt. Die Arbeit setzt sich zusammen aus: einem Problemszenario (Beschreibung einer typischen Realsituation in Storytelling-Manier mit Personas, um herauszustellen, welches Problem mit der KI-Anwendung gelöst werden soll) einem AktivitĂ€tsszenario (Vorstellung einer typischen Situation in Storytelling-Manier mit Personas, wie es in Zukunft mit KI besser laufen soll) einer Claims-Analyse (Vor- und Nachteile der wichtigsten Funktionen des KI-Konzepts) einem AI Project Canvas (eine auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Business Canvas) einem AI Service Blueprint (ein auf menschenzentrierte KI-Projekte zugeschnittene Abwandlung eines Service Blueprints) Hierbei handelt es sich um eine Hausarbeit, die im Rahmen des Projekts "Human-Centered AI Design" im Sommersemester 2023 an der Hochschule der Medien (HdM) Stuttgart entstanden ist. Besonderer Dank gebĂŒhrt dem Dozenten und KI-Trainer Manuel Kulzer, der uns Studierenden die hier verwendeten Methoden nahegebracht und uns davor bewahrt hat, in Technology-Push-AnsĂ€tze abzudriften.