Dù sở hữu MacBook/Ultra Studio RAM 192–256GB (M5/M6 Max) để chạy mô hình AI cục bộ (GLM/Qwen) có thực sự cần thiết? Đôi khi, việc đầu tư vào API (Claude/GPT) + gói Plus + MacBook 64/128GB lại tiết kiệm hơn và hiệu quả hơn cho lập trình, toán học và tìm kiếm. Theo trải nghiệm, mô hình Qwen3/GLM4.6 cục bộ chạy kém hơn các API phổ biến. Đáng cân nhắc ưu tiên chi phí vào dịch vụ AI và tận hưởng kỳ nghỉ!

#Tech #Mac #AI #API #Coding #M5Max #Qwen #GLM #ĐầuTưCôngNghệ

https://www.reddit.com/r/LocalLL

Tìm kiếm mô hình AI nào phù hợp cho công việc học thuật và tổng hợp? GPT OSS 120b xử lý tốt các lý luận thông thường, nhưng đôi khi gặp khó với câu hỏi phức tạp. Ngược lại, các mô hình Trung Quốc như Qwen/Kimi xử lý nhanh (~5s) nhưng hay "quá đầu" khi tự thẩm định kỹ lưỡng (~15s tiếp theo). Ưu tiên GPT OSS nếu không cần kiểm tra kỹ thuật! #AI #MôHìnhHọcThuật #GPT #Qwen #TríTuệNhânTạo

https://www.reddit.com/r/LocalLLaMA/comments/1pn1uif/whats_one_of_the_best_general_use_case_open_models/

Бесплатные сервисы для ваших экспериментов с LLM и агентами

Всем привет. Без лишних слов - сегодня хотелось бы поделиться с вами сервисами, которые вы можете использовать абсолютно бесплатно (без всяких подписок) для ваших исследований в области LLM и ИИ-агентов. Это два веб-сервиса Open Web UI с поддержкой нескольких моделей, развернутых в облаке и Sim AI - для построения воркфлоу агентов без программирования. Оба эти сервиса я разворачивал в облаке для участников воркшопов в моем сообществе, но решил, что многим они могут пригодиться в качестве экспериментов.

https://habr.com/ru/articles/976590/

#ии #сервисы #бесплатные #облако #qwen #sim #open #web #ui

Бесплатные сервисы для ваших экспериментов с LLM и агентами

Всем привет. Без лишних слов - сегодня хотелось бы поделиться с вами сервисами, которые вы можете использовать абсолютно бесплатно (без всяких подписок) для ваших исследований в области LLM и...

Хабр

Using an LLM, we have analyzed the 6.6M theses contained in the OpenAIRE database and filtered 13k theses relevant to chip-design/EDA.
We then scored them into 53 sub-categories and served the result in a searchable database:

https://wiki.f-si.org/theses/

Project description:
https://wiki.f-si.org/index.php?title=EDA_and_chip-design_thesis_database

Source:
https://codeberg.org/fsi/thesis-filtering-pipeline

The goal is to give the community a starting point for more reading.

The same approach can be applied to other fields.

#Silicon #FOSS #NGIZero #Qwen #OpenAIRE #Zenodo

It's kinda getting hard to hate on China cos every few months or so, some new text/image/video generation model comes along that I can actually run on my hardware, and it beats whatever came before it a year ago, half a year even sometimes. Like that Z-Image Turbo and Qwen 3.

I know China's government is so fucking bad. They're always one of the top 3 countries who uses my snowflake proxy whenever I check, but yeah. I actually like where they're going with "AI".

#zimage #qwen #localai #qwen3

Mistral Vibe CLI được đánh giá là mô hình LLM nhỏ nhất có thể chạy cục bộ. Người dùng Reddit chia sẻ rằng Devstral-Small-2-24B-Instruct chậm, còn Qwen3-4B-Instruct-2507-Q4_K_M nhanh hơn và hỗ trợ gọi công cụ hiệu quả hơn các mô hình lớn. #AI #LLM #Mistral #Qwen #CôngNghệ #TríTuệNhiệt #MôHìnhCụcBộ #LocalLLM #MachineLearning #Technology #LLM #AICommunity #VietnamAI

https://www.reddit.com/r/LocalLLaMA/comments/1pkaqjl/mistral_vibe_cli_which_is_the_smallest_local_llm/

Оцифровываем сырую документацию компании с помощью ИИ локально! DeepSeek-OCR + Qwen 1.5

Недавно получил задачу сделать автоматизированную оцифровку характеристик из паспортов товаров в БД, а не изменение параметров вручную в ERP. Я подумал, было бы здорово поделиться, как я это сделал, с вами на Хабре!

https://habr.com/ru/articles/975824/

#OCR #DeepSeek #Qwen #vLLM #Docker #LLM #локальный_ИИ #оцифровка_документов #selfhosted #Сезон_ИИ_в_разработке

Оцифровываем сырую документацию компании с помощью ИИ локально! DeepSeek-OCR + Qwen 1.5

Недавно получил задачу сделать автоматизированную оцифровку характеристик из паспортов товаров в БД, а не изменение параметров вручную в ERP. Я подумал, было бы здорово поделиться, как я это сделал, с...

Хабр

От страха к успеху: история появления ИИ-помощника в системе «АФИДА»

Привет, Хабр! На связи снова Всеволод Зайковский, заместитель руководителя проекта в «Газпром ЦПС». В прошлый раз я рассказывал, как мы научили нашу систему «АФИДА» распознавать и раскладывать по полочкам тысячи строительных актов с помощью компьютерного зрения. Хаос был побежден, документы оцифрованы, лежали в нужных папках, и их даже можно было найти. Казалось бы — живи и радуйся, но аппетит приходит во время еды. Мы поняли, что система «видит» текст, и задали логичный вопрос: «А можно просто спросить у нее, какую марку бетона использовали для заливки фундамента, и она ответит?». Подумали и решили, что можно. Тогда нам казалось, что прикрутить LLM к нашему архиву, чтобы она работала как умный поисковик, очень просто. Но все оказалось не так радужно. Первая версия нашего «строительного чат-бота» галлюцинировала так, что путала проектную документацию с веб-дизайном, а ответы генерировались по три минуты. Это история о том, как мы прошли путь от игрушечного чат-бота до полноценной RAG-системы в закрытом контуре. Расскажу, как мы запускали нейросети на CPU, почему в нашем сравнительном тесте победил Qwen, и как мы оценивали качество ответов в Excel, когда поняли, что стандартные бенчмарки нам не подходят. Статья будет полезна архитекторам, ML-инженерам, и руководителям, которые ищут рабочие on-premise решения. Если вы тоже пытаетесь внедрить LLM в энтерпрайз без бюджета и тысячи видеокарт — этот кейс для вас.

https://habr.com/ru/companies/gazpromcps/articles/975596/

#Искусственный_интеллект #RAG #Корпоративные_решения #ChromaDB #Qwen #Интеграция_AI #llm #Бэнчмарк

От страха к успеху: история появления ИИ-помощника в системе «АФИДА»

Привет, Хабр! На связи снова Всеволод Зайковский, заместитель руководителя проекта в «Газпром ЦПС». В прошлый раз я рассказывал, как мы научили нашу систему «АФИДА» распознавать и раскладывать по...

Хабр

Bạn dùng Ollama + Qwen trên Windows 11, chép "hi" mà mô hình tạo 30 trang văn bản? Đây là lỗi tinh chỉnh mô hình hay cấu hình sai? Cần kiểm tra GGUF "abliterated/uncensored" & Modelfile. #Mastodon #LinguisticModel #AI #Ollama #Qwen

(NOTE: The original content is a technical query about LLM behavior, not news-worthy but relevant for AI enthusiasts. The summary captures the core issue and context.)

**Answer:**
Bạn gặp lỗi Ollama + Qwen tạo văn bản quá mức khi chào hỏi? Hãy kiểm tra việc ti

Nous Research vừa công bố mô hình Nomos 1, chuyên sâu giải toán và viết chứng minh tự nhiên, dựa trên Qwen 30B. Mô hình 30 tỷ tham số đạt 87/120 trên kỳ thi Putnam năm nay. Mở nguồn tại Huggingface và GitHub. #AI #MachineLearning #ToánHọc #Nomos1 #Qwen

https://www.reddit.com/r/LocalLLaMA/comments/1pj343j/nous_research_just_open_source_nomos_1_a/