**Cách áp dụng Batching trong Llama.cpp? Tốc độ giảm theo LOL?** 🤔

@ClimateBoss chia sẻ trải nghiệm khi dùng lệnh `./llama-server --parallel 2 --cont-batching...` và gặp phải:
- Context bị giảm một nửa 😮
- 2 người dùng = 20% chậm hơn so với 1 người? 🤯
- Batching không hiệu quả như mong đợi?

NVIDIA nói tăng người dùng sẽ tăng tổng băng thông (throughput). Làm thế nào để tốc độ tăng lên? 🚀

#LlamaCPP #AI #Performance #Batching #MLOptimизация #ViệcLàmAI #TốcĐộ #Debug #NVIDIA #AIvn

Theo báo cáo của AlixPartners, 100+ công ty phần mềm quy mô trung bình đang bị "ép" giữa đại gia Fortune 500 & startup. Nhiều doanh nghiệp không đủ linh hoạt để bắt kịp AI, thiếu nguồn lực mở rộng thử nghiệm. Dự đoán xu hướng sáp nhập (M&A) sẽ tăng 30-40% vào 2026, lên 600 tỷ USD. #SaaS #AI #CongNghe #ThiTruong #DoanhNhan #StartupViet #AIvn #SaaSvi

https://www.reddit.com/r/SaaS/comments/1qsb3ty/the_midmarket_saas_company_is_becoming_extinct/

SenseTime đã công bố và open-source SenseNova-MARS (8B/32B)! Đây là AgenticVLM open-source đầu tiên hỗ trợ lập luận từ hình ảnh động & tìm kiếm đa phương tiện. Tự động quy trình, gọi công cụ để giải quyết nhiệm vụ phức tạp. Đạt SOTA vượt Gemini3Pro & GPT5.2 trên MMSearch, HR-MMSearch, FVQA. #AILLM #OpenSource #ComputerVision #AIvn #SángTạoAI #NguồnMở #CV

https://www.reddit.com/r/LocalLLaMA/comments/1qr1p1u/sensetime_have_launched_and_opensourced/

Tích hợp RAG & giao diện thoại thời gian thực đầu tiên trên thế giới! 🤖💬 Bỏ qua thiếu sót, bot giờ nghe-nói suôn sẻ, trả lời chính xác nhờ dữ liệu thật. Khả dụng cho hỗ trợ khách hàng, công cụ nội bộ & ứng dụng trợ năng. Dự án ChatRAG: Gói giải pháp toàn diện!
#AI #RAG #Chatbot #CôngNghệ #Innovation #AIvn #ChatRAG #GiaoTiếpThờiGianThực

https://www.reddit.com/r/SideProject/comments/1pv0res/i_finally_got_rag_and_realtime_voice_working/

🎉 Đột phá AI: DOOM JS: Master Protocol với 392 mẫu AI, tích hợp DeepSeek, Claude, Perplexity, xóa bỏ đoán mò & ảo giác. 👻 Bối cảnh tối + sương mù, 🚶 Vật lý 1.6m, 🧟 AI đỏ lửa tấn công đa dạng. Game AI học hỏi chuẩn xác!
#AI #DoomJS #TríTuệNhanTạo #Gaming #TechViet #AIvn

https://www.reddit.com/r/ollama/comments/1pufqor/doom_js_master_protocol_the_power_of_392_ai/

=== VIETNAMESE POST ===
[Ảnh] Cộng đồng Reddit r/ArtificialIntelligence đang bị "xâm lấn" nặng nề bởi nội dung hoang tưởng, bài trừ AI. Các bài đăng nổi bật với hàng nghìn upvote như "AI hủy hoại mọi thứ" hay kêu gọi "cấm hoàn toàn AI" đang lấn át thảo luận kỹ thuật. Người dùng kêu gọi tăng cường kiểm duyệt, duy trì định hướng về Singularity và AGI trước "sự tràn ngập" từ quan điểm chậm tiến. #AI #SựKiệnReddit #AGI #CôngNghệTươngLai #LoạnThôngTin #MainstreamAI #AIvn #CôngNghệ

https://www.redd

**Cách tạo chatbot thành SaaS**
Từ prompt hay NLU, chatbot có thể giơ flott với LLlm nhưng cần cải tiến. Câu hỏi chính: như monetize края? Liệu bạn có thể Burr service ar này để though business?

#AI #SaaS #Chatbot #TruyCapAI #Technology #AIvn #BizModel

https://www.reddit.com/r/SaaS/comments/1o86svh/how_to_make_a_chatbot_into_a_saas/

"100 AI Agent Miễn Phí Cho Dịch Vụ Ja! Handpicked từ 2000+ workflow n8n. Tạo nội dung, thu gom lead, theo dõi đối thủ, kết nối CRM/SLACK. Mỗi workflow làm việc như 5 kỹ sinh không chi phí. #AI #MarketingTools #n8n #AIvn #QuảnTếTinLuis"

https://www.reddit.com/r/SaaS/comments/1o7irov/100_free_ai_agents_for_marketers_handpicked_from/