Die Linux Foundation startet mit Akrites eine Allianz gegen KI-gestützte Angriffe auf Open Source. Rund 20 Tech-Konzerne, KI-Labore und Banken wollen Schwachstellen schließen, bevor sie ausgenutzt werden.
Die Linux Foundation startet mit Akrites eine Allianz gegen KI-gestützte Angriffe auf Open Source. Rund 20 Tech-Konzerne, KI-Labore und Banken wollen Schwachstellen schließen, bevor sie ausgenutzt werden.
nvidia/c-fast-foundationstereo ist ein Depth-Estimation-Modell fuer rectified binocular stereo pairs. Die Card nennt 14,6 Mio. Parameter, real-time zero-shot stereo disparity estimation und den Einsatz fuer Forschung und Evaluation.
nvidia/fast-foundationstereo ist ein Depth-Estimation-Modell fuer rectified Stereo-Paare. Die Card nennt 14,6M Parameter, Real-Time und Zero-Shot Stereo Disparity Estimation.
Qwen/Qwen3-ForcedAligner-0.6B-hf ist ein Token-Classification-Modell fuer Forced Alignment. Die Model Card nennt Timestamp-Prediction fuer beliebige Einheiten bis 5 Minuten Sprache in 11 Sprachen und Apache-2.0.
Qwen/Qwen3-ASR-1.7B-hf ist ein Automatic-Speech-Recognition-Modell. Die Card nennt 52 Sprachen und Dialekte sowie Offline- und Streaming-Inferenz. Die README führt eine Mean WER von 5.59 auf dem Open ASR Leaderboard aus.
Qwen/Qwen3-ASR-0.6B-hf ist ein Automatic-Speech-Recognition-Modell. Die Card nennt Sprachidentifikation und ASR fuer 52 Sprachen und Dialekte sowie Offline-/Streaming-Inferenz. In den Benchmarks steht ein Mean WER von 6.31.
Patronus AI sammelt 50 Mio. US-Dollar für ‚digitale Welten‘, die KI-Agenten unter Last testen. Für Agenten-Infrastruktur ist das mehr als Demo-Glanz: Ohne harte Tests bleiben autonome Workflows ein Risiko statt Produktivwerkzeug.
nvidia/dlesym-v0-isccp-era5 ist auf Hugging Face erschienen. Die Card nennt ein globales Earth-System-Modell mit HEALPix U-Net für Atmosphäre und Ozean sowie einen diagnostischen Niederschlags-Checkpoint.
NVIDIA hat GLM-5.2-NVFP4 veröffentlicht: ein quantisiertes Text-Generation-Modell auf Basis von ZAI’s GLM-5.2. Laut Model Card ist es MIT-lizenziert, für kommerzielle und nicht-kommerzielle Nutzung freigegeben und für globale Nutzung bereitgestellt.
Gemini 3.5 Flash kann jetzt Computer, Browser und Smartphones selbstständig steuern. Google bringt „Computer Use“ direkt in die API; im OSWorld-Benchmark kommt das Modell auf 78,4 Punkte und liegt auf GPT-5.5-Niveau.

Google integriert "Computer Use" direkt in Gemini 3.5 Flash: Das Modell kann nun eigenständig Computer, Browser und mobile Geräte bedienen. Im OSWorld-Benchmark erreicht es 78,4 Punkte und liegt damit auf Augenhöhe mit GPT-5.5 Entwickler können über die Gemini-API Agenten für Softwaretests oder Büroautomatisierung bauen.