vLLM V0 to V1: Correctness Before Corrections in RL

A Blog post by ServiceNow-AI on Hugging Face

Really fun blogpost by @kamathsblog about using Pixi to develop for a LeKiwi robot and controlling it with a Steam Deck!

#ROS #HuggingFace #robots

https://foxglove.dev/blog/teleoperating-the-lekiwi-from-a-steam-deck

Teleoperating the LeKiwi Robot from a Steam Deck

Learn how to turn a Steam Deck into a portable all-in-one LeKiwi controller and Foxglove monitoring station using Pixi, Distrobox, and ROS 2.

Foxglove

nanowhale은 DeepSeek‑V4 아키텍처로 처음부터 학습한 약 110M 파라미터 언어모델입니다. 레포에 모델 코드·설정·토크나이저와 사전학습(5K steps on FineWeb‑Edu)·SFT(3K steps on SmolTalk) 스크립트 및 성능 결과가 포함돼 있습니다. MLA, MoE, Hyper‑Connections 등 설계 특징과 bf16 NaN, from_pretrained 재초기화 같은 알려진 이슈도 명시하며 MIT 라이선스로 공개되었습니다.

https://github.com/huggingface/nanowhale

#nanowhale #deepseekv4 #languagemodel #moe #huggingface

GitHub - huggingface/nanowhale

Contribute to huggingface/nanowhale development by creating an account on GitHub.

GitHub

Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

В телеграме завирусился пост: якобы кто-то “дообучил Qwen 3.5 до уровня Claude 4.6 Opus и убрал цензуру через Heretic”. Я открыл карточку модели на HuggingFace и провёл вечер, разбираясь, что под капотом. Спойлер: там много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки “Adibas” к Adidas. Разбираю distillation, depth upscaling и abliteration без маркетинговой обёртки.

https://habr.com/ru/articles/1032324/

#LLM #Qwen #abliteration #файнтюн #HuggingFace #distillation #intepretability #openweights

Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

Технический разбор модели, которую в телеграме продают как «Claude без цензуры» В моей ленте недавно завирусился пост: якобы кто-то «дообучил Qwen 3.5 до уровня Claude 4.6 Opus, убрал цензуру через...

Хабр

Show HN: Granite Switch - compose multiple LoRA adapters to one deployable model
Granite Switch는 IBM Research에서 개발한 오픈소스 프로젝트로, 여러 개의 LoRA 어댑터를 하나의 배포 가능한 모델로 합성할 수 있다. 이를 통해 여러 작업에 대해 각각 별도의 모델을 배포하지 않고도 높은 정확도를 유지할 수 있다. 모델 내에서 제어 토큰과 스위치 레이어를 활용해 다양한 어댑터 가중치를 선택적으로 적용하며, Hugging Face와 vLLM과 호환된다. 프로젝트는 사용 가능한 어댑터와 사전 합성된 모델도 함께 제공한다.

https://github.com/generative-computing/granite-switch

#lora #adapter #modelcomposition #huggingface #ibmresearch

GitHub - generative-computing/granite-switch: Granite Switch: the accuracy of many fine-tuned models with the footprint of one.

Granite Switch: the accuracy of many fine-tuned models with the footprint of one. - generative-computing/granite-switch

GitHub
Yapay zeka dünyasının "mutfağı" olarak bilinen Hugging Face'i A'dan Z'ye inceledik. 🚀 Neden herkes bu platformu konuşuyor? İşte cevabı: https://teknohaberi.net/hugging-face-model-rehberi/ #AI #HuggingFace #TechNews
Hugging Face Nedir? 500K+ Model, Transformers API Rehberi

Hugging Face, modern yapay zeka ekosisteminde modellerin, veri setlerinin ve demo uygulamaların özgürce paylaşıldığı dünyanın en büyük açık kaynak kütüphanesidir. 2016 yılında kurulan bu platform, bugün teknik tarafta 500.000'den fazla model ve 100.000'in üzerinde veri setine ev sahipliği yaparak "Yapay Zekanın GitHub'ı" unvanını taşımaktadır. İşin aslı, Hugging Face sadece bir depo değil; Transformers, Diffusers ve

Güncel Teknoloji Haberleri

Visualize Any Hugging Face Model
hfviewer.com은 허깅페이스(Hugging Face) 모델을 URL만으로 브라우저에서 인터랙티브하게 시각화할 수 있는 도구이다. 사용자는 모델의 전체 아키텍처를 빠르게 파악하고, 세부 구조를 탐색하며, 여러 모델을 비교할 수 있다. 특히 Gemma 4 패밀리와 같은 모델군의 구조적 차이를 직관적으로 이해할 수 있도록 설계되었으며, 모델 카드나 코드 없이도 시각적 분석이 가능하다. 이는 AI 연구자와 개발자가 복잡한 트랜스포머 모델 구조를 쉽게 이해하고 토론하는 데 큰 도움을 줄 것으로 기대된다.

https://hfviewer.com/

#huggingface #modelvisualization #transformer #mltools #hfviewer

HF Viewer - view any Hugging Face model

We believe good understanding of AI models unlocks innovative ideas.

hfviewer.com

Brie Wensleydale (@SlipperyGem)

Wan 2.1 기반 이미지 모델인 Walkyrie가 공개되었고, 애니메이션 및 Turbo 버전 출시 계획도 언급되었습니다. 또한 Wan 2.1 13B 모델 제작을 위한 펀딩도 시도 중이라고 밝혀, 새로운 오픈소스 이미지 모델 확장 소식으로 볼 수 있습니다.

https://x.com/SlipperyGem/status/2051686666163671463

#imagemodel #wan2.1 #opensource #huggingface #generativeai

Brie Wensleydale🧀🐭 (@SlipperyGem) on X

A new image model a day~ Keeps the singularity away~ Walkyrie, a Wan 2.1 image model has emerged! With plans on releasing a anime and Turbo variants soon. They're also trying to raise funds to make a Wan 2.1 13B one, which is where my interest lies. https://t.co/CluhLMROC7

X (formerly Twitter)

Gestern kam unser Legobausatz für echte Männer und Frauen an: der Reachy Mini, ein kleiner Miniroboter von Pollen Robotics und Hugging Face.

Der Aufbau gestaltete sich tatsächlich fast wie bei Lego. In 50 Schritten mit vielen Bildern und wenig Text soll der Aufbau machbar sein.

Wenn man sich Zeit läßt, lieber einmal zuviel als einmal zuwenig auf die Bilder schaut, kann tatsächlich nicht viel schief gehen. Einmal hätte ich beinahe ein Kabel vergessen anzustecken. Die diesbezügliche Anweisung, die klar vorhanden war, hatte ich überlesen.

Die angegebene Aufbauzeit von 45 min bis 3 h ist also locker schaffbar.

Der Robi, ist bei uns auf den namen Multi getauft worden, hat 9 Motoren, die den Kopf steuern, die beiden Antenen und den Körper. Außerdem eine Weitwinkelkamera und eine Normal-Winkel-Kamera. Die Sprachausgabe erfolgt über einen kleinen Lautsprecher.

Wir haben uns für die Version mit Akku und dem RASPI CM4 Board entschieden.

Als der Aufbau und die Grundkonfiguration (Einbindung ins Netzwerk) erledigt waren, verschwand Multi in Robins Zimmer.

Hier gibt es jetzt nur wenige Möglichkeiten: Der Roboter wird die Welt erobern, er wird Robin als physischer Ersatzkörper dienen oder er steht irgendwann wieder bei mir, weil er das Interesse verloren hat (ich sag jetzt nicht ob Robin oder der Robo)

#reachymini #pollenrobotics #huggingface #ki #robotereroberndieweltherrschaft

An interesting video by Rick Beato (yeah, the nerdy music theory youtuber 😍 ) where he compares the future of "AI" to the failure of the music industry in the early 2000's.

He doesn't quite connect all dots, these #LLM's he downloads from #huggingface on his #LocalComputing gear, they are only "free" because somebody is positioning to somehow make a return later on.

But his memory of past disruptions points to how these algos are not a settled business model. Not yet.

https://www.youtube.com/watch?v=YTLnnoZPALI

How AI Will Fail Like The Music Industry

YouTube