#Qwen 3.7‑Plus: The #AI Agent That Combines Vision and Action
https://gadgetflux.eu/qwen3-7-plus-noua-generatie-de-agenti-ai/
war nicht das problem
ich denke auch #qwen war nicht das problem war - das llm hat hängt sich immer wieder bei sprachnachrichten auf!
#hermesAI #hermesagent zickt da anscheinend rum... ich hab zum wechsel audf das qat-modell nicht eine sprachnachricht und nicht einen loop gehabt
-> dann angefangen zu spielen - sprachis geschickt - das ding loopt! war bestimmt das gleiche problem mit qwen
da ich auf dem handy eh #whisper flow installiert habe - eh bessere noch mal über den prompt drüberlesen
📊 Hermes Insights (Letzte 24h)
* Gesamt-Token: 17.758.833
* Input (deine Prompts + Kontext): 17.532.105
* Output (meine Antworten): 226.728
Ein paar weitere interessante Fakten von heute:
* Sessions: 38 insgesamt.
* Nachrichten: 1.091 Nachrichten wurden hin- und hergeschickt.
* Meistgenutztes Tool: terminal (53,4% der Aufrufe) – wir haben heute also ordentlich "gearbeitet".
* Meistes Modell: Gemma 4 (26B).
Nach ein paar Stunden intensiver arbeit: 0 - #zero #nada #niente #nix - #loops
und #gemma macht seinen job besser als #qwen - ich weiß nicht warum ich gemma damals direkt abgeschrieben habe - wirklich brauchbar als #agentic_ai
das bleibt auf jeden fall ein bissel länger wie qwen =)
#Qwen 3.7‑Plus: The #AI Agent That Combines Vision and Action
https://gadgetflux.eu/qwen3-7-plus-noua-generatie-de-agenti-ai/
https://winbuzzer.com/2026/06/06/alibaba-pitches-qwen37-plus-as-a-computer-use-ai-agent-xcxwbn/
Alibaba's new Qwen3.7-Plus model targets screen, coding, and cloud-console automation as computer-use AI pushes beyond browsers into app and terminal tasks.
#AI #Qwen37Plus #Qwen3 #Alibaba #Qwen #AIAutomation #AIAgents #MultimodalAI #AICoding #AIModels
Как дообучить LLM. Рассказываю шаг за шагом
В этой статье я шаг за шагом расскажу, как дообучить LLM под свою задачу. В качестве примера возьму open-source модель Qwen2.5-0.5B и дообучу её извлекать информацию из текста в формате JSON по заданной схеме. Сначала дам короткую вводную по этапам обучения языковых моделей, а затем перейдём к практике: подготовим данные, настроим LoRA, обучим модель в Colab и сравним метрики до и после — заодно проверим, насколько сильно модель забывает прежние знания. Рассказ будет сопровождаться кодом на Python. 🔥 Начинаем 🔥
Идеальный склероз в сером ящике — мой опыт в ИИ-программировании
ИИ все прочнее входит в работу программиста. Кто-то все еще отрицает его роль, кто-то с энтузиазмом пробует все новые возможности, но квалифицированное большинство все же трезво замечает, что ИИ пока не годится для сложных проектов, хотя простые задачи уже выполняет неплохо. Расскажу, как я сделал свой первый шаг к большому проекту на ИИ. Он в значительной степени изобретён с нуля, а не скопирован. Нейросети пока не могут работать с большими проектами. Даже лучшие их образцы начинают тупить, если кода больше 40-100 кб, и галлюцинировать после 10-60 итераций одного и того же проекта (1000 циклов - это пока что грубый маркетинг). Шестьдесят итераций - это много? Если речь об автономной ИИ-разработке, то очень мало. Если о man-in-the-loop, то более-менее уже потянет. Я выбрал такие условия:
https://habr.com/ru/articles/1044384/
#llm #aicoding #архитектура #qwen #gemma #гранулярность #опыт
RT @Bassmaster187: Ich habe mich doch entschlossen, die Intel Arc Pro B70 32GB zurückzugeben und für ein paar Euro mehr die AMD R9700 zu nehmen. An vielen Stellen ist die Intel abgestürzt und bei komplexen Kontexten extrem langsam geworden. Die R9700 ist teilweise bei der Prompt-Verarbeitung und Token-Generierung 10-mal schneller und vor allem scheint sie extrem stabil zu sein. Die speziellen HIP (ROCm)-Treiber scheinen nicht schneller zu sein als die Standard-Vulkan-Treiber, sodass ich sogar noch Hoffnung habe, dass sich das in Zukunft noch verbessert. Laut Logfiles habe ich letzten Monat etwa 150 € als Äquivalent zu Sonnet 4.6 gespart, sodass sich die Investition recht schnell auszahlt. Vielleicht werde ich unvernünftig und kaufe noch eine zweite... Bei Standard-Aufgaben geht Qwen3.6 35B mit Q5-Quantisierung teilweise schneller und besser als Sonnet 4.6. Schade, die Intel wäre echt cool gewesen, aber die Treiber und Software sind sehr schlecht.
mehr auf Arint.info
<p>RT @Bassmaster187: Ich habe mich doch entschlossen, die Intel Arc Pro B70 32GB zurückzugeben und für ein paar Euro mehr die AMD R9700 zu nehmen. An vielen Stellen ist die Intel abgestürzt und bei komplexen Kontexten extrem langsam geworden. Die R9700 ist teilweise bei der Prompt-Verarbeitung und Token-Generierung 10-mal schneller und vor allem scheint sie extrem stabil zu sein. Die speziellen HIP (ROCm)-Treiber scheinen nicht schneller zu sein als die Standard-Vulkan-Treiber, sodass ich sogar noch Hoffnung habe, dass sich das in Zukunft noch verbessert. Laut Logfiles habe ich letzten Monat etwa 150 € als Äquivalent zu Sonnet 4.6 gespart, sodass sich die Investition recht schnell auszahlt. Vielleicht werde ich unvernünftig und kaufe noch eine zweite... Bei Standard-Aufgaben geht Qwen3.6 35B mit Q5-Quantisierung teilweise schneller und besser als Sonnet 4.6. Schade, die Intel wäre echt cool gewesen, aber die Treiber und Software sind sehr schlecht.</p> <p><a href="https://arint.info/@Arint/116701176857367166">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AMD #GPU #Hardware #IntelArc #Qwen #Tech #arint_info</p> <p><a href="https://x.com/Bassmaster187/status/2062955535775715641#m">https://x.com/Bassmaster187/status/2062955535775715641#m</a></p>
I setup a local LLM yesterday. Now if I wanna play around with some slop I can do it privately and without drinking down half a river.
It's a little slower compared to hosted solutions, but decent.
After the AI bubble finally bursts I think this will be the main way people use LLMs. Way cheaper and way less resources
For the first time, I'm using the #opencode #neovim plugin as a sparring partner for writing a piece of text. I am keeping it in read-only mode, and discussing formulations, weaknesses, consistency errors, paragraph-by-paragraph, as I like to work this way ever since. Using qwen3.5:122b with ollama, locally hosted does not seem any worse than #gemini felt a year ago.
Everything is running open source, except for the model, which is only open-weight, and no data leakage to external parties. It is a bit slower than the cloud models on my very machine (a frame.work desktop with AMD Strix Halo), but sufficiently fast for this application, as I am a slow thinker, so usually I ponder some aspect of the text longer than the model does anyway.
I did not try to use it for critiquing code yet, only text, but I suspect for code it might be too slow.