Bài test thực tế so sánh GLM 4.7 và Minimax M2.1 trong việc tạo kiểm thử e2e. Minimax M2.1 vượt trội về tốc độ và độ tin cậy (40 phút vs 70 phút không xong của GLM).

Đáng chú ý, GLM 4.7 dù không hoàn thành nhưng lại phát hiện lỗi thiết kế code, điều mà Minimax bỏ qua. Người dùng ưu tiên Minimax M2.1 cho hiệu suất, nhưng vẫn cân nhắc GLM làm backup cho các vấn đề sâu hơn.

#AI #LLM #GLM47 #MinimaxM21 #AITesting #TechReview #SoSanhAI #KiểmThửAI

https://www.reddit.com/r/LocalLLaMA/comments/1ptq7r

AI testing tools for software testing are gaining momentum as QA teams handle complex systems and faster release cycles.

We recently published a Video exploring the AI testing tools landscape and how teams are using these tools to improve coverage and reduce maintenance. Sharing this here to exchange views on how AI-driven testing is being adopted in real-world QA setups.

https://youtu.be/hheoLq4c7nQ

#AIToolsForSoftwareTesting #SoftwareTesting #AITesting #TestAutomation #QualityEngineering

AI Tools for Software Testing 2026: The Future of Smart QA

YouTube

🛠️ 7 công cụ AI Testing Agent hàng đầu 2026: CoTester (TestGrid), Mabl, AutonomIQ, TestCraft, Virtuoso QA, ACCELQ Autopilot, Functionize. Tất cả hỗ trợ tự động tạo test, self‑healing, đa nền tảng (web‑mobile‑API) và tích hợp CI/CD, giảm phí bảo trì và tăng tốc release. #AITesting #Automation #DevOps #Testing #AI #QA #CôngCụAI #KiểmThử

https://dev.to/jamescantor38/7-best-ai-testing-agent-tools-for-intelligent-test-automation-pf6

7 Best AI Testing Agent Tools for Intelligent Test Automation

The landscape of software testing is changing rapidly, and teams are increasingly relying on the AI...

DEV Community

AutoQA-Agent: Viết test chấp nhận bằng Markdown, chạy tự động với AI + Playwright. Giảm lỗi do thay đổi UI, cho phép QA/PM tham gia viết test. Xuất kết quả thành test Playwright chuẩn.
Tính năng: snapshot-first, log chi tiết, chụp màn hình, trace.
Cài đặt: Node.js >=20, Claude API.
Chạy: `autoqa run specs/ --url <base-url>`
Xuất spec thành `.spec.ts` nếu test thành công.

#AutoQAAgent #Playwright #AITesting #MarkdownTests #EndToEndTesting #TestAutomation #AutoQA #KiểmThửTựĐộng #Playwri

AI Agent trong kiểm thử đang thay đổi cách đảm bảo chất lượng phần mềm: tự động hóa thông minh, giảm gánh nặng bảo trì, nâng cao độ bao phủ. Quản lý hiệu quả bằng cách thiết lập giới hạn, tích hợp công cụ, kiểm soát qua prompt và vòng phản hồi. Ứng dụng từng bước từ chế độ gợi ý đến thực thi, kết hợp giám sát chất lượng và chi phí. Chuyển đổi từ thủ công sang agentic AI cần chiến lược phù hợp, đảm bảo con người luôn kiểm soát cuối cùng. #AITesting #QA #AgenticAI #TestAutomation #KiểmThửPhầnMềm #

Sử dụng mô hình **Ollama địa phương** (ví dụ: *llama3.2*) để kiểm tra AI agents thay vì API đám mây. Ưu điểm: tiết kiệm chi phí, bảo mật dữ liệu và hoạt động ngoại tuyến. Cài đặt đơn giản qua **EvalView**: `pip install evalview`, kết nối Ollama với cú pháp YAML để đánh giá phản hồi AI. Dự án mở nguồn tại GitHub. Gợi ý thử nghiệm mô hình Ollama nào khác?

#AItesting #Ollama #AIBots #Llama3 #ĐánhGIáAI #CơChếTesting #PythonTools #AIĐịaPhương #MastodonAI #TechNewsVN

https://www.reddit.com/r/ollam

Momentic raises $15M to revolutionize software testing, preventing 390,000 bugs with AI-powered verification platform. Transforming quality assurance for tech teams worldwide. #AITesting #SoftwareDevelopment

🟦 Set Up Evaluations in Microsoft Copilot Studio
Want reliable Copilot agents? Build test sets, run automated evaluations, and measure pass rates to improve accuracy and relevance 🚀

💡 Define test sets: import, generate, or add cases.
🔍 Pick methods: exact, partial, similarity, or quality.
⚖️ Run evaluations: simulate chats, score responses, set thresholds.

▶︎https://www.hubsite365.com/en-ww/citizen-developer/?id=4138de3e-13c6-f011-bbd3-7ced8d5e09ec&topic=9f678e9a-8cd4-ec11-a7b5-6045bd92fe52&theater=true

Ready to boost agent quality? Watch the guide or DM for a step-by-step walkthrough.
#CopilotStudio #AItesting #PowerPlatform #ConversationalAI

Kiểm tra A/B là chìa khóa trong phát triển ứng dụng AI. Giúp đánh giá độ trễ, hiệu quả chi phí, độ chính xác và trải nghiệm người dùng. #AITesting #ABTesting #AIEngineering #PhátTriểnngDụngAI #KiểmThửA_B #MachineLearning #AITools

https://www.reddit.com/r/SaaS/comments/1or2o0n/why_ab_testing_is_crucial_in_ai_app_development/

The engineering cost of flaky tests is too high. I'm presenting our work in progress on a data-driven solution tomorrow at #SFSCon.

Join me for: "Zap the Flakes! Leveraging AI to Combat Flaky Tests with CANNIER."

I will detail the CANNIER research: using ML to predict and flag flakiness risks in KubeVirt CI.

⏰ Tomorrow, 08/11/2025 @ 10:00 CET
📍 Bolzano, Italy
🔗 Talk Details: https://www.sfscon.it/talks/zap-the-flakes/

#SoftwareQuality #CI #DevOps #AITesting #KubeVirt #WIP

Zap the Flakes! - SFSCON

SFSCON Talk

SFSCON