Mastodawn

Prowl: Learning Through Discovery

PROWL은 강화학습(RL) 기반의 적대적 프레임워크로, RL 에이전트가 게임 환경을 탐색하며 월드 모델의 실패 사례를 발견하고 이를 학습 커리큘럼으로 활용해 모델 성능을 개선한다. Minecraft 환경에서 평가된 PROWL은 행동 추종 정확도, 시각적 품질, 환경 동역학 등에서 기존 모델 대비 우수한 성능을 보였으며, 점진적 난이도 조절을 통해 안정적인 적대적 학습 루프를 구현한다. 이 접근법은 월드 모델 개발에 자체 경험 생성과 피드백 루프를 도입해 물리 및 시각 모델링의 발전 가능성을 제시한다.

https://odyssey.ml/introducing-prowl

#reinforcementlearning #worldmodel #adversarialtraining #curriculumlearning #minecraft

Introducing PROWL: Learning Through Discovery

PROWL is a novel RL-driven adversarial framework where an RL agent explores game environments with the objective to improve world model performance.

Amster Apr 9, 2023

If we can get LLMs to detect content that was computer-generated, then I think we have a real chance at minimizing spam. I worry that if not, the training sets will just get polluted with generated content which will lead to a reinforcing loop. Thankfully, there are people thinking about this: https://aclanthology.org/2022.findings-aacl.41.pdf #AI #LLM #ChatGPT #RewriteAndRollback #AdversarialTraining

gtbarry Mar 8, 2023

The inside story of how ChatGPT was built from the people who made it

The technology inside ChatGPT isn’t new. ChatGPT is a fine-tuned version of GPT-3.5, a family of large language models that OpenAI released months before the chatbot. GPT-3.5 is itself an updated version of GPT-3, which appeared in 2020.

#chatgpt #chatgptai #openai #gpt3 #artificialintelligence #ai #adversarialtraining #technology #tech

https://www.technologyreview.com/2023/03/03/1069311/inside-story-oral-history-how-chatgpt-built-openai

The inside story of how ChatGPT was built from the people who made it

Exclusive conversations that take us behind the scenes of a cultural phenomenon.

MIT Technology Review

Dominic Boutet Nov 21, 2022

#arxivfeed :

"Robust DNN Surrogate Models with Uncertainty Quantification via Adversarial Training"
https://arxiv.org/abs/2211.09954

#MachineLearning #DeepLearning #SurrogateModels #AdversarialTraining #UncertaintyQuantification #Simulation

Robust DNN Surrogate Models with Uncertainty Quantification via Adversarial Training

For computational efficiency, surrogate models have been used to emulate mathematical simulators for physical or biological processes. High-speed simulation is crucial for conducting uncertainty quantification (UQ) when the simulation is repeated over many randomly sampled input points (aka, the Monte Carlo method). In some cases, UQ is only feasible with a surrogate model. Recently, Deep Neural Network (DNN) surrogate models have gained popularity for their hard-to-match emulation accuracy. However, it is well-known that DNN is prone to errors when input data are perturbed in particular ways, the very motivation for adversarial training. In the usage scenario of surrogate models, the concern is less of a deliberate attack but more of the high sensitivity of the DNN's accuracy to input directions, an issue largely ignored by researchers using emulation models. In this paper, we show the severity of this issue through empirical studies and hypothesis testing. Furthermore, we adopt methods in adversarial training to enhance the robustness of DNN surrogate models. Experiments demonstrate that our approaches significantly improve the robustness of the surrogate models without compromising emulation accuracy.

arXiv.org

Buridan's procrastinator ⁂May 17, 2022

#Tesla 1 unbeantwortete Anfrage + 1 Ablehnung zur Frage, ob das als sicher beworbene Autopilot-System nicht vielleicht doch verkehrsgefährdend ist ...

Wenn bei einem #selfcrashingcar etwas noch schlimmer ist als mangelnder Datenschutz, dann ja wohl Verkehrsunsicherheit!

Aber niemand weiß was - und was soll ich sagen? diese Technologie ist AFAIK unausgereift (Stichwort #adversarialtraining) und die "Sicherheit" bloß intern getestet ...

https://fragdenstaat.de/anfrage/studie-uber-die-gefahrlichkeit-des-fahrassistenssytems-autopilot-des-tesla-model-s/

https://fragdenstaat.de/anfrage/autopilot-gutachten-fur-verkehrsministerium-warnt-vor-teslas-model-s/57209/anhang/2016-11-03-bast_geschwaerzt.pdf

Studie über die Gefährlichkeit des Fahrassistenssytems ("Autopilot") des Tesla Model S

Antrag nach dem IFG/UIG/VIG Bitte schicken Sie mir das Gutachten zu wie es in dem Artikel der Presse erwähnt wird: "Nach Tausenden Testkilometern im Model S von Tesla kommen Prüfer für des Bundesverkehrsministerium zu dem Schluss, dass von dem Auto eine "erhebliche Verkehrsgefährdung" ausgeht. Wegen des "Autopiloten" würden sie es am liebsten aus dem Verkehr ziehen. Die Bundesanstalt für Straßenwesen (BASt) sieht in dem sogenannten "Autopiloten" des Tesla S eine "erhebliche Verkehrsgefährdung" und fordert, dem Elektroauto die Zulassung zu entziehen. Das stehe in einem Gutachten für das Bundesverkehrsministerium von Alexander Dobrindt (CSU), das dort aber ignoriert werde, berichtet der Spiegel in seiner aktuellen Ausgabe." Quelle: http://www.heise.de/newsticker/meldun... Dies ist ein Antrag auf Zugang zu amtlichen Informationen nach § 1 des Gesetzes zur Regelung des Zugangs zu Informationen des Bundes (IFG) sowie § 3 Umweltinformationsgesetz (UIG), soweit Umweltinformationen im Sinne des § 2 Abs. 3 UIG betroffen sind, sowie § 1 des Gesetzes zur Verbesserung der gesundheitsbezogenen Verbraucherinformation (VIG), soweit Informationen im Sinne des § 1 Abs. 1 VIG betroffen sind. Ausschlussgründe liegen meines Erachtens nicht vor. Sollte der Informationszugang Ihres Erachtens gebührenpflichtig sein, möchte ich Sie bitten, mir dies vorab mitzuteilen und detailliert die zu erwartenden Kosten aufzuschlüsseln. Meines Erachtens handelt es sich um eine einfache Auskunft. Gebühren fallen somit nach § 10 IFG bzw. den anderen Vorschriften nicht an. Ich verweise auf § 7 Abs. 5 IFG/§ 3 Abs. 3 Satz 2 Nr. 1 UIG/§ 4 Abs. 2 VIG und bitte Sie, mir die erbetenen Informationen so schnell wie möglich, spätestens nach Ablauf eines Monats zugänglich zu machen. Sollten Sie für diesen Antrag nicht zuständig sein, bitte ich Sie, ihn an die zuständige Behörde weiterzuleiten und mich darüber zu unterrichten. Ich bitte Sie um eine Antwort in elektronischer Form (E-Mail) gemäß § 8 EGovG. Ich möchte Sie um eine Empfangsbestätigung bitten und danke Ihnen für Ihre Mühe!