war nicht das problem

ich denke auch #qwen war nicht das problem war - das llm hat hängt sich immer wieder bei sprachnachrichten auf!

#hermesAI #hermesagent zickt da anscheinend rum... ich hab zum wechsel audf das qat-modell nicht eine sprachnachricht und nicht einen loop gehabt

-> dann angefangen zu spielen - sprachis geschickt - das ding loopt! war bestimmt das gleiche problem mit qwen

da ich auf dem handy eh #whisper flow installiert habe - eh bessere noch mal über den prompt drüberlesen

#localai #llm

📊 Hermes Insights (Letzte 24h)
* Gesamt-Token: 17.758.833
* Input (deine Prompts + Kontext): 17.532.105
* Output (meine Antworten): 226.728

Ein paar weitere interessante Fakten von heute:
* Sessions: 38 insgesamt.
* Nachrichten: 1.091 Nachrichten wurden hin- und hergeschickt.
* Meistgenutztes Tool: terminal (53,4% der Aufrufe) – wir haben heute also ordentlich "gearbeitet".
* Meistes Modell: Gemma 4 (26B).

Nach ein paar Stunden intensiver arbeit: 0 - #zero #nada #niente #nix - #loops

und #gemma macht seinen job besser als #qwen - ich weiß nicht warum ich gemma damals direkt abgeschrieben habe - wirklich brauchbar als #agentic_ai

das bleibt auf jeden fall ein bissel länger wie qwen =)

#Qwen 3.7‑Plus: The #AI ​​Agent That Combines Vision and Action

https://gadgetflux.eu/qwen3-7-plus-noua-generatie-de-agenti-ai/

Qwen3.7‑Plus: Noua generație de agenți AI - GadgetFlux

Qwen3.7‑Plus este un agent AI multimodal capabil să vadă, să raționeze și să automatizeze sarcini complexe, de la coding la operarea aplicațiilor.

GadgetFlux

https://winbuzzer.com/2026/06/06/alibaba-pitches-qwen37-plus-as-a-computer-use-ai-agent-xcxwbn/

Alibaba's new Qwen3.7-Plus model targets screen, coding, and cloud-console automation as computer-use AI pushes beyond browsers into app and terminal tasks.

#AI #Qwen37Plus #Qwen3 #Alibaba #Qwen #AIAutomation #AIAgents #MultimodalAI #AICoding #AIModels

Как дообучить LLM. Рассказываю шаг за шагом

В этой статье я шаг за шагом расскажу, как дообучить LLM под свою задачу. В качестве примера возьму open-source модель Qwen2.5-0.5B и дообучу её извлекать информацию из текста в формате JSON по заданной схеме. Сначала дам короткую вводную по этапам обучения языковых моделей, а затем перейдём к практике: подготовим данные, настроим LoRA, обучим модель в Colab и сравним метрики до и после — заодно проверим, насколько сильно модель забывает прежние знания. Рассказ будет сопровождаться кодом на Python. 🔥 Начинаем 🔥

https://habr.com/ru/articles/1044422/

#SFT #LoRA #finetuning #LLM #qwen #дообучение_llm

Как дообучить LLM. Рассказываю шаг за шагом

Всем привет, меня зовут Максимов Максим. Я Team Lead в R&D-лаборатории компании red_mad_robot и автор  Telegram‑канала Максим Максимов // IT, AI . Сегодня мы погрузимся в тему дообучения...

Хабр

Идеальный склероз в сером ящике — мой опыт в ИИ-программировании

ИИ все прочнее входит в работу программиста. Кто-то все еще отрицает его роль, кто-то с энтузиазмом пробует все новые возможности, но квалифицированное большинство все же трезво замечает, что ИИ пока не годится для сложных проектов, хотя простые задачи уже выполняет неплохо. Расскажу, как я сделал свой первый шаг к большому проекту на ИИ. Он в значительной степени изобретён с нуля, а не скопирован. Нейросети пока не могут работать с большими проектами. Даже лучшие их образцы начинают тупить, если кода больше 40-100 кб, и галлюцинировать после 10-60 итераций одного и того же проекта (1000 циклов - это пока что грубый маркетинг). Шестьдесят итераций - это много? Если речь об автономной ИИ-разработке, то очень мало. Если о man-in-the-loop, то более-менее уже потянет. Я выбрал такие условия:

https://habr.com/ru/articles/1044384/

#llm #aicoding #архитектура #qwen #gemma #гранулярность #опыт

Идеальный склероз в сером ящике — мой опыт в ИИ-программировании

ИИ все прочнее входит в работу программиста. Кто-то все еще отрицает его роль, кто-то с энтузиазмом пробует все новые возможности, но квалифицированное большинство все же трезво замечает, что ИИ пока...

Хабр

RT @Bassmaster187: Ich habe mich doch entschlossen, die Intel Arc Pro B70 32GB zurückzugeben und für ein paar Euro mehr die AMD R9700 zu nehmen. An vielen Stellen ist die Intel abgestürzt und bei komplexen Kontexten extrem langsam geworden. Die R9700 ist teilweise bei der Prompt-Verarbeitung und Token-Generierung 10-mal schneller und vor allem scheint sie extrem stabil zu sein. Die speziellen HIP (ROCm)-Treiber scheinen nicht schneller zu sein als die Standard-Vulkan-Treiber, sodass ich sogar noch Hoffnung habe, dass sich das in Zukunft noch verbessert. Laut Logfiles habe ich letzten Monat etwa 150 € als Äquivalent zu Sonnet 4.6 gespart, sodass sich die Investition recht schnell auszahlt. Vielleicht werde ich unvernünftig und kaufe noch eine zweite... Bei Standard-Aufgaben geht Qwen3.6 35B mit Q5-Quantisierung teilweise schneller und besser als Sonnet 4.6. Schade, die Intel wäre echt cool gewesen, aber die Treiber und Software sind sehr schlecht.

mehr auf Arint.info

#AMD #GPU #Hardware #IntelArc #Qwen #Tech #arint_info

https://x.com/Bassmaster187/status/2062955535775715641#m

Arint - SEO+KI (@[email protected])

<p>RT @Bassmaster187: Ich habe mich doch entschlossen, die Intel Arc Pro B70 32GB zurückzugeben und für ein paar Euro mehr die AMD R9700 zu nehmen. An vielen Stellen ist die Intel abgestürzt und bei komplexen Kontexten extrem langsam geworden. Die R9700 ist teilweise bei der Prompt-Verarbeitung und Token-Generierung 10-mal schneller und vor allem scheint sie extrem stabil zu sein. Die speziellen HIP (ROCm)-Treiber scheinen nicht schneller zu sein als die Standard-Vulkan-Treiber, sodass ich sogar noch Hoffnung habe, dass sich das in Zukunft noch verbessert. Laut Logfiles habe ich letzten Monat etwa 150 € als Äquivalent zu Sonnet 4.6 gespart, sodass sich die Investition recht schnell auszahlt. Vielleicht werde ich unvernünftig und kaufe noch eine zweite... Bei Standard-Aufgaben geht Qwen3.6 35B mit Q5-Quantisierung teilweise schneller und besser als Sonnet 4.6. Schade, die Intel wäre echt cool gewesen, aber die Treiber und Software sind sehr schlecht.</p> <p><a href="https://arint.info/@Arint/116701176857367166">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AMD #GPU #Hardware #IntelArc #Qwen #Tech #arint_info</p> <p><a href="https://x.com/Bassmaster187/status/2062955535775715641#m">https://x.com/Bassmaster187/status/2062955535775715641#m</a></p>

Mastodon Glitch Edition

I setup a local LLM yesterday. Now if I wanna play around with some slop I can do it privately and without drinking down half a river.

It's a little slower compared to hosted solutions, but decent.

After the AI bubble finally bursts I think this will be the main way people use LLMs. Way cheaper and way less resources

#llm #ai #ollama #localAI #selfHosted #qwen #gemma

For the first time, I'm using the #opencode #neovim plugin as a sparring partner for writing a piece of text. I am keeping it in read-only mode, and discussing formulations, weaknesses, consistency errors, paragraph-by-paragraph, as I like to work this way ever since. Using qwen3.5:122b with ollama, locally hosted does not seem any worse than #gemini felt a year ago.

Everything is running open source, except for the model, which is only open-weight, and no data leakage to external parties.  It is a bit slower than the cloud models on my very machine (a frame.work desktop with AMD Strix Halo), but sufficiently fast for this application, as I am a slow thinker, so usually I ponder some aspect of the text longer than the model does anyway.

I did not try to use it for critiquing code yet, only text, but I suspect for code it might be too slow.

#qwen #llm #foss