Tỷ lệ tham số hoạt động trên các mô hình MoE lớn: Kimi K2 (3.2%), GPT OSS 120B (4.4%), Qwen3 Next 80B (3.8%). Tỷ lệ thấp cho thấy xu hướng ưu tiên kiến thức đa dạng thay vì trí tuệ tập trung. Một số mô hình cũ như Grok 2 đạt 42.6% – nổi bật về tham số hoạt động. #AI #LLM #Moe #Kimi #Qwen3 #Grok2 #AI #MoE #ThamSoHoatDong #HocMay

https://www.reddit.com/r/LocalLLaMA/comments/1q401ka/ratios_of_active_parameters_to_total_parameters/

Một công cụ dịch tự động README cho kho lưu GitHub, hoạt động hoàn toàn cục bộ, không cần API và đảm bảo quyền riêng tư. Sử dụng mô hình Qwen3 14B, xử lý trực tiếp trên nền tảng GitHub. Dễ dàng thiết lập bằng cách sao chép file workflow. #Translation #GitHub #LocalAI #Qwen3 #DevTool #CôngCụLậpTrình #GitHubVietnamese #AI #MãNguồnMở

https://www.reddit.com/r/selfhosted/comments/1pzsxya/automated_readme_translation_for_your_github/

@LocalLLaMA Trùng hợp 2 CPU Xeon 2690 V3 + RAM 2133MHz, nâng tối đa 256GB để tự lưu trữ mô hình AI cỡ lớn (LLM). Có thể chạy mô hình 235B như Qwen3? Mời chia sẻ kinh nghiệm & đánh giá hiệu năng! #SelfHosting #LLM #AI #TựNhânViễn #Qwen3 #MáyChủAI #ThửTháchCôngNghệ #LocalLLaMA

https://www.reddit.com/r/LocalLLaMA/comments/1py4nuu/self_hosting_llm_on_multi_cpu_sys_ram_combo/

Qwen3 đã gặp khủng hoảng tồn tại khi phân tích ván cờ vì ván cờ không đầy đủ. Mô hình phát hiện thiếu vua trắng và hậu trắng, dẫn đến suy luận sai lầm về thế trận. Bài học: Dữ liệu đầu vào không đúng có thể làm AI "loạn nhịp".

#AI #Chess #Qwen3 #KhủngHồngxTồnTại #CờVua #MachineLearning #AIAnalysis #DữLiệuKhôngĐúng

https://www.reddit.com/r/LocalLLaMA/comments/1pxm06s/qwen3_had_an_existential_crisis_trying_to/

克隆跨物种,有点意思😹
【Qwen3-TTS上新,支持跨物种克隆音色!-哔哩哔哩】 https://b23.tv/64a9TjQ

这个人头真铁,敢薅美军的东西,L站站长前几天就已经拉闸ChatGPT美军认证相关的所有帖子了
【【ChatGPT Plus会员1年免费过美军认证教程】看本教程过认证之后即可免费用GPT Plus会员12个月!薅羊毛必备!-哔哩哔哩】 https://b23.tv/0gUWkUr

#哔哩哔哩 #ChatGPT #qwen3

Qwen3-TTS上新,支持跨物种克隆音色!_哔哩哔哩_bilibili

Qwen3-TTS 重磅上新:VoiceDesign & VoiceClone!🎙️ 更快的速度,更强的表现力,重新定义语音合成。✨ VoiceDesign (VD-Flash):全文本控制: 通过文字指令调整语气、节奏和情感,拒绝千篇一律的预设音色。性能卓越: Role-play 表现超越 GPT-4o-mini & Gemini-2.5-pro。⚡ VoiceClone (V, 视频播放量 26264、弹幕量 52、点赞数 893、投硬币枚数 112、收藏人数 834、转发人数 289, 视频作者 通义大模型, 作者简介 让代码流动,以开放之火燎技术之原。,相关视频:通义千问国际版底裤被扒出😰,说得更好、更准、更自然:Qwen3-TTS上线,阿里巴巴蔡崇信自曝:当时被 DeepSeek 逼急了,工程师春节睡办公室搞研发。,Qwen-Image-Edit-2511终于和大家见面了,阿里最新开源AI生图Z-Image模型实测,全新VAE模型Z_image出图更高清,提高细节10倍,阿里通义万相Wan 2.6 闭源?! 到底是冲上神坛还是跌落神坛!,平替 Claude Code?阿里Qwen3-Coder Plus + Qwen Code 深度体验。前后端真实场景,阿里开源实时AI交互式数字人模型Live Avatar:支持超长视频生成+虚拟人实时互动直播!,Fun-ASR 全新升级|企业级抗干扰

🔧 #OpenRouter launches Response Healing: automatically fixes malformed #JSON responses from #LLMs before they reach your app #AI #API #devops

📊 Results from 1.6M+ requests analyzed at inference time:
#Gemini 2.0 Flash: 80% defect reduction (99.61% → 99.92%)
#Qwen3 235B: 99.8% defect reduction (88% → 99.98%)
#Deepseek Chat v3.1: 85% defect reduction (82.5% → 97.4%)
#Devstral 2512: 99.6% defect reduction (96.6% → 99.99%)

🧵 👇

Working the Strix Halo in my ROG Flow z13. qwen3-vl:32b model, writing a report about why the sky is blue. 8.65 t/s. Same model wrote the ALT.

Now to fact check it (a fun hobby 😆)

#localai #llm #llms #qwen3 #strixhalo #amd #rog

Выбор LLM и фреймворка для ИИ-агентов

Путь от одной A100 в облаке до кластера на H200 — это не просто апгрейд железа, а история о том, как ML-команда перестала искать «ту самую идеальную модель» и начала строить экосистему. Когда под капотом миллионы строк C-кода PostgreSQL, а задачи варьируются от генерации hint-сетов до Graph-RAG, модель превращается из «черного ящика» в обычный заменяемый компонент. Рассказываем, как мы пересобрали стек на базе vLLM и MCP, почему контекст-менеджмент важнее весов модели и как заставить 0.6B-параметров работать не хуже гигантов через GRPO.

https://habr.com/ru/companies/postgrespro/articles/979820/

#llm #aiагент #ииагенты #qwen3 #ragas #finetuning #дообучение #trl #grpo #gspo

Выбор LLM и фреймворка для ИИ-агентов

Последние полтора года наша ML-команда делает крайне интересные штуки, например строит ИИ-агентов поверх PostgreSQL, при этом инфраструктура меняется, индустрия созревает, а ожидания и требования к...

Хабр

Разбираем три новых Qwen: нейросеть в роли диктора, художника и писателя

Привет! Я Антон, инженер по информационной безопасности в Selectel . Под катом снова поговорим о китайской Qwen. Ее обновления выходят так же часто, как у ChatGPT, а амбиций у команды — не меньше. Протестируем три новые модели: «диктора», «художника» и универсального генератора. Посмотрим, где они действительно впечатляют, а где пока «спотыкаются» и уступают конкурентам. Под кат →

https://habr.com/ru/companies/selectel/articles/977768/?utm_source=habrahabr&utm_medium=rss&utm_campaign=977768

#selectel #qwen #qwen3 #chatgpt #нейросети

Разбираем три новых Qwen: нейросеть в роли диктора, художника и писателя

Привет! Я Антон, инженер по информационной безопасности в Selectel . Сегодня продолжаем обозревать модели китайской экосистемы Qwen от Alibaba. По частоте релизов она уже сопоставима с ChatGPT, а вот...

Хабр

Разбираем три новых Qwen: нейросеть в роли диктора, художника и писателя

Привет! Я Антон, инженер Под кат →

https://habr.com/ru/companies/selectel/articles/977768/

#selectel #qwen #qwen3 #chatgpt #нейросети

Разбираем три новых Qwen: нейросеть в роли диктора, художника и писателя

Привет! Я Антон, инженер по информационной безопасности в Selectel . Сегодня продолжаем обозревать модели китайской экосистемы Qwen от Alibaba. По частоте релизов она уже сопоставима с ChatGPT, а вот...

Хабр