RT @TeksEdge: Interessantes Gerücht über Gemini 3.2 Flash. „Benchmarks zeigen, dass es 92 % der Leistung von GPT 5.5 bei Coding- und Reasoning-Aufgaben erreicht, während die Inferenzkosten um das 15- bis 20-fache niedriger sind.“ Bindu Reddy (@bindureddy) Gemini 3.2 Flash – Nutzung der cleveren Distillation-Techniken von DeepMind … Gerüchten zufolge zeigen Benchmarks, dass es 92 % der Leistung von GPT 5.5 bei Coding- und Reasoning-Aufgaben erreicht, während die Inferenzkosten um das 15- bis 20-fache niedriger sind. Die Latenzverbesserungen sind enorm – unter 200 ms für die meisten Abfragen. Googles Distillation- und Sparsity-Techniken zahlen sich massiv aus. Sie haben im Wesentlichen ein Frontier-Modell in eine Flash-Variante komprimiert, ohne den üblichen Qualitätsverlust. — https://nitter.net/bindureddy/status/2054767771418861964#m

mehr auf Arint.info

#AIModel #DeepMind #Gemini32Flash #InferenceCosts #LLM #TechRumors #arint_info

https://x.com/TeksEdge/status/2054916564336681387#m

Arena AI Model ELO History

Visualizing AI flagship model degradation and progression over time.

StepFun (@StepFun_ai)

Step Image Edit 2가 공개되어 이미지 편집 모델의 새 버전이 실시간으로 제공되기 시작했다. 3.5B 파라미터의 이미지 모델로, 지시 기반 이미지 편집 벤치마크인 KRIS-Bench에서 전체, 사실성, 개념 카테고리 모두 1위를 기록했다. 5~6배 큰 모델들을 능가하며, 응답 속도도 0.7초로 빠르다.

https://x.com/StepFun_ai/status/2054282965652471918

#imageediting #aimodel #benchmark #generativeai #ai

StepFun (@StepFun_ai) on X

🚀 Step Image Edit 2 is live!! A 3.5B-parameter image model that ranks #1 on KRIS-Bench —the leading benchmark for instruction-based image editing —across overall, factual, and conceptual categories. It outperforms models at 5–6x the parameter count. Performance - 0.7s

X (formerly Twitter)

Krea (@krea_ai)

오늘부터 Max 및 Business 사용자에게 Krea 2 접근 권한이 제공된다. 이번 주 동안 추가 접근 코드도 순차적으로 배포될 예정이며, 모델 및 관련 정보도 함께 안내했다.

https://x.com/krea_ai/status/2054207490771009940

#krea #aimodel #release #generativeai #productlaunch

Krea (@krea_ai) on X

starting today, every Max and Business user gets access to Krea 2. we will continue to roll out more access codes during the week. access and more info about the model here: https://t.co/BjAN9F2tEj

X (formerly Twitter)

Ant Ling (@AntLingAGI)

Ant Ling 2.6 1T의 아키텍처가 @rasbt의 최신 업데이트에 소개됐다. Hugging Face 컬렉션과 Discord 채널을 통해 피드백과 논의를 받고 있으며, 향후 추가 업데이트도 예고했다. 대규모 모델 아키텍처 공개 및 커뮤니티 반응을 유도하는 내용이라 AI 개발자에게 유용하다.

https://x.com/AntLingAGI/status/2053526387143946682

#llm #huggingface #opensource #architecture #aimodel

Ant Ling (@AntLingAGI) on X

It was quite a delight to get Ant Ling 2.6 1T's Architecture featured in @rasbt 's latest update🤝. We welcome feedback and discussions on our HF page https://t.co/bZwQRsjljU as well as our Discord channel https://t.co/TwbjGjpDza Stay tuned for more updates! 🤠

X (formerly Twitter)

Sean L., Ph.D., CFA (@SeanLix)

DeepSeek V4 Flash를 128GB 메모리 환경에서 실행해 본 경험을 공유하며, DS4와 DS4 WebUI 조합이 인상적이라고 언급했다. DS4는 antirez가 만들었고, cocktailpeanut이 간단한 WebUI를 구축했다고 소개했다. 오픈소스 기반 AI 실행 환경과 모델 운용 사례로 주목할 만하다.

https://x.com/SeanLix/status/2053639021579178492

#deepseek #webui #opensource #aimodel #inference

Sean L., Ph.D., CFA (@SeanLix) on X

☄️☄️Big Thanks to @antirez created the amazing DS4 and @cocktailpeanut built the simple WebUI, experiencing DeepSeek V4 Flash running on full 128G memory is FUN & COOL! 😛😛😛 #DS4 #DS4WebUI

X (formerly Twitter)

Does anyone know if @Vivaldi users are impacted by Google Chrome's 4GB AI Model?

#browser #browsers #ai #aimodel #google #chrome #malware #googlemalware #vivaldi

RT @AntLingAGI: Wir starten Ring-2.6-1T, ein Flaggschiff-Denkmuster mit einer Billion Parametern, das für komplexe reale Aufgaben und Produktionsumgebungen entwickelt wurde: 🚀 - Anpassbare Denkleistung: Dynamischer Rechenmechanismus zur flexiblen Balance zwischen kognitiver Tiefe, Token-Kosten und Ausführungsgeschwindigkeit; - Agent-optimiert: Entwickelt für hochfrequente Workflows, bietet schnelle mehrstufige Ausführung und Tool-Orchestrierung mit SOTA-Stabilität; - Tiefes Denken: Entfesselt die maximale Leistungsfähigkeit des Modells für rigorose mathematische Logik und wissenschaftliche Forschung;

mehr auf Arint.info

#AgentOptimized #AIModel #DeepThinking #ProductionReady #Ring261T #TrillionParameters #arint_info

https://x.com/AntLingAGI/status/2052808934390661134#m

Arint - SEO+KI (@[email protected])

<p>RT @AntLingAGI: Wir starten Ring-2.6-1T, ein Flaggschiff-Denkmuster mit einer Billion Parametern, das für komplexe reale Aufgaben und Produktionsumgebungen entwickelt wurde: 🚀 - Anpassbare Denkleistung: Dynamischer Rechenmechanismus zur flexiblen Balance zwischen kognitiver Tiefe, Token-Kosten und Ausführungsgeschwindigkeit; - Agent-optimiert: Entwickelt für hochfrequente Workflows, bietet schnelle mehrstufige Ausführung und Tool-Orchestrierung mit SOTA-Stabilität; - Tiefes Denken: Entfesselt die maximale Leistungsfähigkeit des Modells für rigorose mathematische Logik und wissenschaftliche Forschung;</p> <p><a href="https://arint.info/@Arint/116542626249873774">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AgentOptimized #AIModel #DeepThinking #ProductionReady #Ring261T #TrillionParameters #arint_info</p> <p><a href="https://x.com/AntLingAGI/status/2052808934390661134#m">https://x.com/AntLingAGI/status/2052808934390661134#m</a></p>

Mastodon Glitch Edition